Og her er hvorfor du overhovedet skal vide det:
Når du begynder at arbejde med Business Intelligence (BI), flyver det rundt med it-buzzwords. Som beslutningstager i din virksomhed ønsker du sikkert ikke at vide noget om 'datamodeller', du vil 'bare' gerne have oplysninger på skærmen, som du kan analysere. Og det forstår vi godt. Men det er klogt i det mindste at være bekendt med nogle af disse udtryk. Derfor fortæller vi det, du skal vide om begreberne her.
'Datalake'
En 'Datalake' er en kilde, hvor ustrukturerede data samles. Det er i bund og grund den store forskel i forhold til et Data Warehouse. Med en Datalake foregår lagring uden nogen specifik struktur. En beholder med data opbevares centralt i sin rå og oprindelige form. Lageromkostningerne er begrænsede, så ideen bag er, at man skal gemme dataene, fordi man måske får brug for dem. Så du kan gemme billeder, vejrinformationer, geografiske data, e-mail-trafik og stort set alt, hvad du kan finde på. En stor kilde til data til en lav pris, som du kan 'spørge' ved hjælp af en Data specialist. Datalakkens ustrukturerede karakter giver fordele for 'datamining' og 'maskinlæring'. I praksis er det vanskeligt at bevare overblikket.
Datalake er en relativ ny løsning fra Microsoft. Det er en løsning, der tegner til at blive rigtig god og som der fortsat udvikles på. Løsningen løser i store træk den samme opgave som 'BYOD' (Bring Your Own Database) eller en SQL-server hidtil har løst.
Data fra en Datalake er ikke 'ideelle' til din rapportering, for at få en rigtig god BI-løsning skal du også bruge et 'Data Warehouse'.
'Data Warehouse'
Et datawarehouse er et sted, hvor du kan samle og strukturere data fra en eller flere specifikt udvalgte kilder - f.eks. fra Datalake. Tænk f.eks. på din Microsoft Dynamics NAV eller din Dynamics AX. Alle data er strukturerede og har et fast format, der er gemt i tabeller og felter. I Data Warehouset indlæses og struktureres data.
Men i et Data Warehouse soorteres data ikke kun, der skabes også 'relationer' mellem de forksellige data og unødvendige data 'fjernes'. Det hjælper både på performance på din BI-løsning og det giver dig en mere overskuelig BI-løsning, så dine data er nemmere at fortolke.
Hvilket BI-setup der er bedst, er forskelligt fra organisation til organisation og afhænger af målet. Der findes tilstrækkelige analyseløsninger til både Data Warehouses og Data Lakes. Hvis du primært har brug for klare og entydige oplysninger til brug for BI-værktøjer og datavisualisering, er et Data Warehouse et oplagt valg. Begge muligheder behøver ikke nødvendigvis at udelukke hinanden. Du kan også vælge løsninger, hvor et Data Warehouse og en Data Lake (eller BOYD) eksisterer side om side, og hvor de begge anvendes optimalt inden for deres eget speciale.
'Den tabulære model'
Et andet begreb er den tabulære model (også kaldet en kube). Det er her, at omdannelsen fra data til information i sidste ende finder sted. Alle definitioner er tilgængelige her, og du kan begynde at sammensætte dine analyser i f.eks. Power BI. Meget praktisk. Tænk på en pivottabel (eller Pivottable), som du kender den fra Excel. Men denne pivottabel ligger ikke på din egen computer, men et sted på serveren eller i Azure, så alle i organisationen ser på de samme data ... hvis de er filtreret korrekt, selvfølgelig.
Vidste du, at de fleste spørgsmål i vores servicedesk omhandler manglende data eller ufuldstændige data har at gøre med de filtre, der er indstillet?