För att råda bot på detta publicerade Dan Linstedt år 2000 ett nytt modelleringskoncept kallat Data Vault. Syftet är att erbjuda långsiktig historisk datalagring från skiftande källsystem med full flexibilitet och spårning av data oberoende av eventuella ändringar i och från källsystemen.
En annan skillnad är att Data Vault inte skiljer på bra eller dåliga data. Alla data sparas oberoende av kvalitet. I ett klassiskt datalager blir data som inte passar antingen tvättat eller raderat. Detta medför också att det blir enklare att tillgodose krav från Sarbanes-Oxley Act och liknande lagar om dataspårning.
Data Vault löser problemet med ändringar av datastrukturen genom att separera på källsystemens affärsnycklar (business keys), relationerna mellan dem och deras beskrivande attribut. Tanken är att affärsnycklarna (dvs källsystemens faktiska nycklar) sällan eller aldrig ändras, däremot kommer relationerna och attributen att ändras ibland.
Affärsnycklarna lagras för sig i en typ av tabell som kallas Hub, tillsammans med radens surrogatnyckel, en referens till källsystemet samt till operativ metadata (dvs när och hur laddningen av raden gjordes). Notera att affärsnycklen kan vara mer än ett fält.
Attributen som beskriver affärsnycklarnas data lagras i en typ av tabell som kallas Satellit. Det kan finnas mellan en och flera satelliter till en Hub beroende på datastrukturen. Exempelvis kan adressdata lagras i en satellit medan demografiska data lagras i en annan. Här finns möjlighet att använda lagra flera versioner av samma attribut.
Relationerna mellan affärsnycklarna lagras i en typ av tabell som kallas Link. På samma sätt bör bara relationens nyckel sparas i Link-tabellen. Relationens attribut sparas i en satellit, på samma sätt som för en Hub.
En fjärde typ av tabell är Referens, dvs lookup-tabeller med i stort sett fasta referensvärden.
För att underlätta användningen är det sedan normalt att modellen konverteras till en dimensionell modell i ett dataförråd eller semantiskt lager. Link-tabeller med sina satelliter bildar normalt fakta, medan Hub-tabellerna med sina satelliter blir dimensioner.
Enkelt Data Vault exempel med 2 Hubs (blå), 1 Link (grön) och 4 Satelliter (gula).
Data Vault 2.0 lanserades 2013 och inkluderar områdena Big Data, NoSQL, semistrukturerad integration, tillsammans med metodologi, arkitektur och implementationsråd.
källa: en.wikipedia.org/wiki/Data_Vault_modeling
Sidan skapad 10 maj 2007
Uppdaterat 20 januari 2009 (Mer om OLAP)
Uppdaterat 28 augusti 2011 (Semantiskt lager)
Uppdaterat 29 augusti 2014 (Om prestanda)
Uppdaterat 10 oktober 2017 (Mer historik)
Uppdaterat 18 mars 2020 (Data Vault)
Uppdaterat 3 december 2024 (DV på egen sida)
Sammanställt av Christer Tärning.