Microsoft Fabric
Microsoft Fabric er en alt-i-en analytics-løsning til virksomheder, der dækker alt fra dataflytning til data science, realtidsanalyse og Business Intelligence.
Hvad er Microsoft Fabric?
Microsoft Fabric tilbyder en omfattende pakke af tjenester, herunder data lake, data engineering og dataintegration, alt sammen samlet på ét sted.
Med Fabric behøver du ikke at sammensætte forskellige tjenester fra flere leverandører. I stedet kan du nyde godt af et super integreret, end-to-end og brugervenligt produkt, der er designet til at forenkle dine analytics-behov.
Platformen er bygget på en grundlæggende Software as a Service (SaaS) model, der tager enkelhed og integration til et helt nyt niveau.
SaaS fundament
Microsoft Fabric samler nye og eksisterende komponenter fra Power BI, Azure Synapse og Azure Data Explorer i et integreret miljø. Disse komponenter præsenteres derefter gennem forskellige tilpassede brugeroplevelser.
Fabric samler oplevelser som Data Engineering, Data Factory, Data Science, Data Warehouse, Real-Time Analytics og Power BI på et samlet Software as a Service (SaaS)-fundament. Det giver følgende fordele:
- Et bredt udvalg af dybt integrerede analysemuligheder.
- Delte oplevelser der er kendte og lette at lære.
- Udviklere kan nemt få adgang til og genbruge alle ressourcer.
- En forenet data lake, der giver mulighed for at bevare data, hvor det er, mens man bruger foretrukne analyseværktøjer.
- Centraliseret administration og styring på værs af alle oplevelser.
Med Microsoft Fabric er data og tjenester sømløst integreret. IT-teams kan centralt konfigurere funktioner og tilladelser, der automatisk anvendes på alle underliggende tjenester. Derudover nedarves datafølsomhedslabels automatisk på tværs af elementerne i pakken.
Fabric giver brugerne af løsningen mulighed for at fokusere på at levere deres bedste arbejde uden behov for at integrere, administrere eller forstå den underliggende infrastruktur, der understøtter platformen.
Komponenter i Microsoft Fabric
Microsoft Fabric integrerer en omfattende række af analytiske oplevelser, der er designet til at fungere gnidningsløst sammen. Hver oplevelse er skræddersyet til specifikke roller og opgaver og omfatter forskellige kategorier for at imødekomme end-to-end analytiske behov.
Data Engineering
Data Engineering-oplevelsen tilbyder en robust Spark-platform med brugervenlige udviklingsmuligheder. Den giver data engineers mulighed for at udføre datatransformation i stor skala og demokratiserer data gennem lakehouse. Microsoft Fabric Spark integrerer problemfrit med Data Factory, hvilket muliggør planlagt orkestrering af notebooks og Spark-job.
Data Factory
Azure Data Factory kombinerer Power Query's enkelhed med Azure's skalerbarhed og kraft. Den tilbyder over 200 native forbindelser til at oprette forbindelse til datakilder både lokalt og i skyen.
Data Science
Data Science-oplevelsen muliggør problemfri udvikling, implementering og operationalisering af machine learning-modeller inden for Fabric-miljøet. Den integrerer med Azure Machine Learning og giver indbygget eksperimentsporing og modelregistrering. Data scientists kan berige organisatoriske data med forudsigelser, hvilket gør det muligt for forretningsanalytikere at inkorporere dem i deres BI-rapporter og gå fra deskriptive til forudsigende indsigter.
Data Warehouse
Data Warehouse-oplevelsen leverer enestående SQL-ydelse og skalerbarhed. Den muliggør uafhængig skalering af beregnings- og lagerkomponenter ved at adskille dem. Derudover lagrer den data naturligt i det åbne Delta Lake-format.
Real-Time Analytics
Real-Time Analytics udmærker sig i analyse af observationsdata, der indsamles fra forskellige kilder som apps, IoT-enheder og menneskelig interaktion. Disse data er ofte semi-strukturerede i formater som JSON eller tekst, med højt volumen og skiftende skemaer. Real-Time Analytics giver en fremragende motor til arbejde med denne type data.
Power BI
Power BI er en førende Business Intelligence-platform, der giver forretningsindehavere hurtig og intuitiv adgang til alle data i Fabric, hvilket giver dem mulighed for at træffe datadrevne beslutninger.
Videoserie: Afmystificering af Data Lakehouse i Microsoft Fabric
Fem afsnit med Just Blindbæk går i dybden med emner som arkitektur, dekobling af storage og compute, PySpark, SQL og Power BI Direct Lake.
I første afsnit giver Just Blindbæk dig et overblik over, hvad det handler om med udgangspunkt i en grundig gennemgang den klassiske lagdelte arkitektur.
I andet afsnit i vores serie om ”Afmystificering af Data Lakehouse i Microsoft Fabric” kigger Just Blindbæk nærmere på dekobling af storage og compute - en helt central del af Microsoft Fabric, som giver fordele i forhold til omkostninger og bedre fleksibilitet.
Er PySpark egentlig så skræmmende, som det lyder til? Nej, og det giver rigtig god mening at bruge i forskellige scenarier, og det giver os nogle oplagte fordele i forhold til, hvordan vi har gjort tidligere i en SQL-baseret verden.
Svaret er JA!
I afsnit 3 introducerede Just PySpark, men det betyder ikke, at SQL ikke er cool længere.
Se afsnittet og få Justs svar på hvorfor der stadig skal være plads til SQL.
I dette afsnit kigger Just Blindbæk nærmere på, hvordan vi gør data tilgængelige for vores slutbrugere i Power BI via den nye Direct Lake-funktionalitet, vi har fået med Microsoft Fabric.
OneLake og lakehouse - sammensmeltningen af lakehouses
Microsoft Fabric-platformen forener OneLake og lakehouse-arkitekturen på tværs af virksomheder.
OneLake
Data lake er fundamentet, som alle Fabric-tjenester er bygget på. Microsoft Fabric Lake, også kendt som OneLake, er integreret i Fabric-tjenesten og giver et samlet sted til opbevaring af alle virksomhedens data.
OneLake er bygget på ADLS (Azure Data Lake Storage) Gen2. Den tilbyder en enkelt SaaS-oplevelse og en fælles placering til opbevaring af data for både professionelle og almindelige udviklere. OneLake SaaS-oplevelsen forenkler brugeroplevelsen og eliminerer behovet for, at brugerne skal forstå infrastrukturkoncepter som ressourcegrupper, RBAC (Role-Based Access Control), Azure Resource Manager, redundans eller regioner. Derudover kræver det ikke engang, at brugeren har en Azure-konto.
OneLake eliminerer de udbredte og kaotiske datasiloer, som individuelle udviklere skaber, når de etablerer og konfigurerer deres egne isolerede lagringskonti. I stedet giver OneLake et enkelt, forenet lagersystem for alle udviklere, hvor opdagelse og deling af data er ubesværet, og overholdelse af politikker og sikkerhedsindstillinger bliver centralt og ensartet håndhævet.
Organisatorisk struktur af OneLake og lakehouse
OneLake er hierarkisk i sin natur for at forenkle administrationen på tværs af virksomheden. Det er integreret i Microsoft Fabric, og der kræves ingen forudgående oprettelse. Der er kun én OneLake pr. tenant, og løsningen tilbyder et enkelt filsystem, der strækker sig på tværs af brugere, regioner og endda skyen. Data i OneLake er opdelt i håndterbare containers for nem håndtering.
Tenants svarer til rodstrukturen i OneLake, og er det øverste niveau i hierarkiet. Du kan oprette et hvilket som helst antal workspaces inden for en tenant, som kan betragtes som mapper.
Nedenstående billede viser de forskellige Fabric-elementer, hvor data er gemt. Det er et eksempel på, hvordan forskellige elementer inden for Fabric gemmer data i OneLake. Som vist kan du oprette flere workspaces inden for en tenant, og oprette flere lakehouses inden for hvert workspace. Et lakehouse er en samling af filer, mapper og tabeller, der repræsenterer en database over en data lake.
Hver udvikler og forretningsenhed inden for en tenant kan uden videre oprette deres egne workspaces i OneLake. De kan indtage data i deres respektive lakehouses, initiere dataforarbejdning, analyse og samarbejde - på samme måde som OneDrive fungerer i Office.
Alle Microsoft Fabric-compute-oplevelser er problemfrit forbundet med OneLake, på samme måde som Office-applikationer er forbundet med organisatorisk OneDrive. Data Engineering, Data Warehouse, Data Factory, Power BI og Real-Time Analytics anvender OneLake som deres native lagerløsning og eliminerer behovet for yderligere konfiguration.
Derudover letter shortcuts datadeling mellem brugere og applikationer uden at duplikere eller flytte information. Shortcuts dækker også andre lagringssystemer, så brugerne kan komponere og analysere data på tværs af forskellige clouds ved hjælp af intelligent caching, der reducerer omkostninger og mindsker afstanden mellem data og behandling.
Læs om andre dataplatforms-teknologier
Azure Databricks
Azure Databricks gør det nemt at analysere selv meget store datamængder ved hjælp af den enorme regnekraft, der findes i cloud-miljøet.
Mirosoft Azure Services
Azure har et evigt voksende portfolio af cloudtjenester, der kan hjælpe dig med at klare dine forretningsmæssige udfordringer.
Læs mere her
Azure Synapse Analytics
Azure Synapse Analytics er en analysetjeneste, som kombinerer store Data Warehouses med Big Data Analytics, og produktet er en evolution af Azure SQL Data Warehouse.
Læs mere her
Vil du i gang? Det vil vi også
Gør som en lang række af landets mest ambitiøse virksomheder:
Udfyld formularen eller tag fat i Søren – så kan vi tage en god snak om jeres udfordringer og drømme.