Formáty dat
Soubor je posloupnost bytů (znaků), která jako celek nese informaci. Pro přečtení
informace ze zakódované podoby je třeba mít interpret dat. Formáty aplikačních dokumentů:
1) Textové formáty (dokumenty) uchování textové informace s řádkováním, odstavci, tabulátory
2) Grafické formáty - uchovávají grafické informace
3) Hypertextové formáty – strukturované texty, odkazy na jiné, grafické objekty)
4) Meta formáty prostředek pro popis více formátů
5) Komprimační formáty – pomocné formáty pro přenos, archivaci
6) Formáty pro tiskárnu, scanner, plotter (vstup/výstup formáty pro pořízení dat)
7) Databázové soubory pro uchování rozsáhlých dat, jejich manipulaci, definici
Kódování
- proces přetváření zprávy do jiného vyjádření (např. úspornější, ....)
- obsah zprávy se nemění
- důvod – snížení množství znaků, ve kterých je zpráva vyjádřena – zabezpečení zprávy
Hospodárnost kódu
- vztahuje se na nějakou zprávu složenou z mnoha znaků (každý znak musí být označen pravděpodobností výskytu ve zprávě)
- nejčastějším znakem (nejpravděpodobnější) je mezera
Kvantifikace redundance (číselné vyjádření nadbytečnosti)
- kolik nadbytečných kódů sebou info nese
r = 1-h; h = H/Hmax
h – relativní entropie, vztaženo k H=H/Hmax
H – entropie na 1 znak, skutečná entropie
Hmax – maximální možná entropie, která vyplývá z množství znaků
Když se zlomek blíží 1, dostáváme malou redundanci.
Žádné komentáře:
Okomentovat