Hledejte v chronologicky řazené databázi studijních materiálů (starší / novější příspěvky).

Čeština a WWW

Čeština a WWW
• HTML obsahuje standardně kódování ISO Latin 1 (ISO 8859-1) - to se v první polovině shoduje s ASCII, v druhé jsou speciální znaky pro západní Evropu (ale ne například ř, š) - umožní napsat některé české znaky, jiné ne
• další možností je psát text v ASCII, tedy bez diakritiky
• tato řešení jso technicky jednoduchá, lepší jsou ale řešení umožňující používat plnou českou diakritiku
• je mnoho kódování, obsahujících všechny české znaky
– CP 1250 - ve Windows
– ISO 8859-2 - hlavně v UNIXech (IE a NN pro Windows je také zvládají)
– PC Latin 2 - Microsoftí kódování v DOSu (stránka 852), také pro OS/2
– Kameničtí - původní český kód používaný zejména v DOSu (označení keybcs2)
– MAC CE - kódování pro češtinu na Apple Macintosh
• tedy pro každý OS máme jiné kódování - měli bychom ale podporovat uživatele na všech systémech - tedy uživatel by měl mít možnost zvolit kódování (nebo ASCII)
• řešením je tvorba samostatné verze dokumentu pro každé kódování - problémem jsou mnohem vyšší nároky na diskovou kapacitu a také náročnost při zapisování odkazů a náročnost při aktualizaci dokumentu (ve všech verzích)
• lepším řešením je dynamická změna kódu - CGI skript, který provede požadovaný převod - nevýhodou je zatížení serveru - pro každou stránku je spouštěn skript zajišťující převod, nevýhodou je také to, že dynamicky generované dokumenty se neuchovávají ve vyrovnávací paměti nebo skutečnost, že všichni uživatelé nemusí vědět co to kódování je
• existuje řada balíků na převod kódu
http://www.kin.vslib.cz/cgi-bin/whichcode/~satrapa/
sw/saczech/saczech.html

Žádné komentáře:

Okomentovat