Tärningens DI/DW/BI

DB
Vad är en databas?
Ordet databas började användas 1963. Det är en samling av data som hanteras av ett system. Den vanligaste typen är relationsdatabas, men det finns andra typer.
>> DB

RDBMS
Vad är en relationsdatabas?
RDBMS står för Relational DataBase Management System, eller relationsdatabas på svenska. 1970 publicerade Codd en artikel som blev grunden för relationsdatabasen, som lagrar all data i tabeller, även kallade relationer. Dess språk är SQL.
>> RDBMS

SQL
Vad är SQL?
SQL står för Structured Query Language, och används för sökning, manipulering, definition och säkerhet. Sökning och manipulering kallas ibland för CRUD-operationer: Create, Read, Update och Delete. SQL är ett set-baserat språk, men det finns utökningar för procedurell funktionalitet.
>> SQL

DI
Vad är DI?
DI står för Data Integration, vilket är ett generellt begrepp för att koppla ihop data från olika system. För att kunna analysera data i ett källsystem används ofta en ETL-process.
>> DI

ETL
Vad är ETL?
ETL står för Extract, Transform & Load, vilket är en process för att frikoppla, sammanställa och förbereda data för rapporter, analys, prognoser och åtgärder. Målet är ofta ett DW.
>> ETL

DW
Vad är DW?
DW betyder Data Warehouse, eller översatt till svenska datalager. Det är ett sätt för att sammanställa sina data. Några relaterade begrepp är Data Vault, Data Lake, Data Lakehouse, Data Mesh och Data Products.
>> DW

DV
Vad är Data Vault?
Data Vault är en metodologi, arkitektur och modelleringsteknik som ofta används i ett datalager. Det erbjuder både skalbarhet, spårbarhet och flexibilitet.
>> DV

DL
Vad är Data Lake och Data Lakehouse?
Data Lake är en teknik som växte fram på 2010-talet som ett alternativ till datalager, men det blev ofta oöverskådligt och svårskött. Data Lakehouse är en efterföljaren som erbjuder bättre översikt och hantering.

DP
Vad är Data Mesh och Data Products?
Data Mesh är en slags arkitektur som handlar mer om människor och processer än arkitektur, vars slutresultat är domän-orienterade Data Products. Data Products är en synsätt som erbjuder distribuerat ansvar för datat.

BI
Vad är BI?
BI betyder Business Intelligence, vilket i grunden betyder att förstå sin verksamhet. Det finns olika BI-verktyg, som används för rapporter, analys, prognoser och åtgärder.
>> BI

AI
Vad är AI?
AI betyder Artifical Intelligence, vilket ännu inte existerar. Däremot kallas ibland ML för AI. Begreppet Generativ AI används (för närvarande; 2024) för maskingenererade svar baserade på massiva textmassor (eller motsvarande) i en LLM, dvs på statistik. För att få bättre svar används RAG.

ML
Vad är ML?
ML betyder Machine Learning. Det är kortfattat en metod för att automatisera statistiska processer.

LLM
Vad är LLM?
LLM betyder Large Language Model. Det är en statistisk modell tränad på en enormt stor samling av textmassor (eller motsvarande), som används för att hitta det mest troliga svaret på en fråga.

RAG
Vad är RAG?
RAG betyder Retrieval Augmented Generation. Det innebär att man styr modellen mot ett bättre svar genom att ge den mer specifik indata.

Sidan skapad 10 maj 2007
Uppdaterat 29 augusti 2014
Senast uppdaterat 6 december 2024
Sammanställt av Christer Tärning.