Důsledky
• pro transformaci nelze použít hromadné zpracování pomocí neprocedurálního SQL (insert … select, update)
• nutno implementovat komplexní transformační procedury pomocí procedurální nástavby SQL, nebo prostředky ETL (Extraction, Transformation, Loading)
• transformace je zdlouhavá
• je problematické prosadit zlepšení kvality vstupních dat v organizaci - většinou to vede na reinženýring stávajících procesů
• výsledky jsou zatíženy chybou, chyba je identifikovatelná
Serializace MD prostoru do relačních schémat
• Buňky v krychli (jednotlivé ukazatele) a jejich souřadnice reprezentuje tzv. tabulka faktů (fact table)
• Hrany krychle (dimenze), prvky těchto hran a jejich další atributy reprezentují tzv. tabulky dimenzí
Tabulka faktů
Obsahuje cizí klíče do jednotlivých tabulek dimenzí
Měřené veličiny - UKAZATELE
Cizí klíče do jednotlivých tabulek dimenzí tvoří složený primární klíč tabulky faktů
UKAZATELE mohou být:
plně aditivní: Prodej v ks, Prodej v Kč
neaditivní: Marže v %
semiaditivní: Zásoba v ks, Zásoba v Kč, Počet prodejů
Tabulka dimenzí
Jsou vlastně „číselníky“
Obsahují název, popis a jiné sledované atributy pro prvky dimenzí
Pozn: Může existovat dimenze bez tabulky dimenzí (atribut v tabulce faktů) - degenerovaná dimenze
Typy schémat
Podle implementace hierarchie v dimenzích se rozlišují na:
Hvězdice (Star)
Sněhová vločka (Snowflake)
Schéma do hvězdice umožňuje jednodušší browsing dimenzí (browsing = listování a zadávání filtrů pro všechny hierarchické úrovně dimenze). Dimenze ve schematu do sněhové vločky jsou ve 3. NF - úspora místa v DB (diskutabilní - úspora je v miliontinách velikosti DW!). Při častých změnách v dimenzích a v zatřiďování v hierarchiích dimenzí je výhodnější schéma do sněhové vločky. Pro vytváření agregačních tabulek podle hierarchických úrovní dimenzí, musí být daná hierarchie ve sněhové vločce.
Žádné komentáře:
Okomentovat