Hledejte v chronologicky řazené databázi studijních materiálů (starší / novější příspěvky).

V reálném projektu ...

V reálném projektu centralizovaného datového skladu bývají desítky až stovky pumpovacích kroků. Správa kroků v software ETL probíhá obvykle pomocí acyklického orientovaného grafu, kde uzly grafu jsou kroky a spojnice tzv. workflow (pracovní toky). Většinou existují různé typy workflow podle toho, jak dopadl krok ve výchozím uzlu spojnice (úspěch, chyba, nezáleží).
Ukládání dat do datového skladu je možné provádět na základě dvou různých strategií. Buď se pokaždé uloží celý obsah datového skladu znovu, což je použitelné pouze u velmi malých objemů dat a pro úvodní načtení, nebo se ukládají pouze přírůstky a změněná data – v tomto případě musí být k dispozici systém zajišťující rozpoznávání změněných údajů.
6.3.3 Metadata
Metadata obsahují popis dat, která budou uložena do datového skladu. Mohou obsahovat zdroj původní informace a pravidla či transformace, které byly použity při nahrávání dat. Metadata lze rozdělit na dvě skupiny – technická a obchodní:
 Technická metadata definují atributy, které popisují fyzické vlastnosti položek jako: odkud pocházejí, jak byly transformovány, kdo je za to zodpovědný, kdy byly naposledy načteny atd.
 Obchodní metadata jsou důležitá pro uživatele DW, protože obsahují informace jako jsou definice dat, hodnoty atributů a domén, obchodní pravidla, vztahy mezi daty atd.
Ukládání a využívání metadat umožňuje automatické načítání dat a údržbu datového skladu.

Žádné komentáře:

Okomentovat