Hledejte v chronologicky řazené databázi studijních materiálů (starší / novější příspěvky).

Fáze budování DW

1.8. Fáze budování DW
1. Předběžná analýza, rámec projektu a jeho etapizace, specifikace první etapy, prototyp MIS první etapy
2. Analýza profesních procesů, uživatelských požadavků, hledání ukazatelů, dimenzí
3. Analýza primárních systémů, hledání dostupných dat, zjišťování kvality dat, řešení problémových oblastí
4. Návrh a implementace relační databáze datového skladu (DBDS)
5. Realizace datových pump
6. Realizace OLAP, příp. MDDB - vypočítané ukazatele, optimalizace
7. Realizace klientských aplikací

Číselníky
• statická (pomalu se měnící) data, někdy označována jako kmenová data
• popisují základní entity organizace (artikl, supermarket, nákupčí, dodavatel, prodejna, zaměstnanec)
• v multidimenzionálním modelování jsou základem dimenzí

Fakta
• dynamická (neustále přibývající) data, někdy označována jako stavová data
• zaznamenávají procesy v organizaci (přijaté/vystavené faktury, jejich položky, prodeje pokladnou, příjemky na sklad)
• v multidimenzionálním modelování se v nich identifikují ukazatele

Typické problémy při transformaci dat
• data jsou v různých zdrojích (různých systémech), nejsou sjednoceny číselníky
• i data v jednom zdroji nebývají uložena dle relačních zásad
• neexistují primární klíče, není vynucována povinnost atributů
• nejsou ve 3 NF, jedna tabulka odpovídá více reálným entitám, atributy nejsou závislé jen na klíči
• jeden sloupec v tabulce zahrnuje více atributů (vlastností entity)
• je problematické spojovat tabulky (joins), podmínky bývají komplexní, hrozí vztah m:n - kartézský součin - nesprávné součty.
• problémy s konverzí datových typů (datum, Y2K), znakových sad (LATIN2, CP 852, CP 1250, EBCDIC)

Žádné komentáře:

Okomentovat