Ebooks, Audobooks and Classical Music from Liber Liber
a b c d e f g h i j k l m n o p q r s t u v w x y z





Web - Amazon

We provide Linux to the World


We support WINRAR [What is this] - [Download .exe file(s) for Windows]

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
SITEMAP
Audiobooks by Valerio Di Stefano: Single Download - Complete Download [TAR] [WIM] [ZIP] [RAR] - Alphabetical Download  [TAR] [WIM] [ZIP] [RAR] - Download Instructions

Make a donation: IBAN: IT36M0708677020000000008016 - BIC/SWIFT:  ICRAITRRU60 - VALERIO DI STEFANO or
Privacy Policy Cookie Policy Terms and Conditions
Unicode - Wikipédia

Unicode

Z Wikipédie

Unicode
Kódovania
  • UTF-7
  • UTF-8
  • CESU-8
  • UTF-16/UCS-2
  • UTF-32/UCS-4
  • UTF-EBCDIC
  • SCSU
  • Punycode
  • GB18030
UCS
Obojsmerný text
BOM
Han zjednotenie
Unicode a HTML
Unicode a e-mail

Unicode je medzinárodný štandard, ktorého cieľom je definovať jedinečný kód zvaný code point pre každú z grafém používaných na zápis ľudského jazyka.

Napriek technickým problémom, obmedzeniam a kritike sa zo štandardu Unicode stala dominantná kódovacia schéma používaná pri internacionalizácii softvéru a viacjazyčných prostredí.

Operačné systémy Microsoft Windows NT a odvodené verzie Windows 2000 a Windows XP používajú Unicode, presnejšie UTF-16, na internú reprezentáciu textu. Operačné systémy UNIXového typu ako sú GNU/Linux, BSD a Mac OS X, prijali Unicode, presnejšie UTF-8, ako základ pre reprezentáciu viacjazyčného textu.

Unicode je štandard pre univerzálne kódovanie znakov pre počítače. Toto kódovanie navrhla nezisková organizácia s názvom The Unicode Consortium, ktorej cielom bolo vytvoriť jednotnú sadu znakov UCS (Universal Character Set), ktorá by nahradila množstvo rozdielnych sád znakov používaných v jednotlivých krajinách. Tento štandard publikovala v knihe The Unicode Standard. Okrem znakovej sady, ktorá bola tiež normalizovaná ako ISO/IEC 10646, dokument obsahuje i ďalšie veci súvisiace s požítačovým písmom (spôsob dekompozície, renderovania, metódy kódovania…) Tento štandard bol implementovaný do moderných operačných systémov a jeho modifikácia UTF (Unicode Transformation Format)je implementovaná v jazkoch XML a JAVA.

Obsah

[úprava] Vývoj štandardu

Vznik jednotného kódu znakov, podmienila existencia množstva znakových sád. Znakové sady sa líšili nielen pre jednotlivé krajiny, ale i v rámci jednej z krajín existovalo viacero znakových sád. Všetky znakové sady boli navrhnuté na základe americkej normy ASCII, ktorá pevne určovala prvých 128 znakov sady a zvyšných 128 sa líšilo v závislosti od krajiny. Na slovensku sa najčastejšie používali (a ešte stále používajú) kódy ISO 8859-2 známy tiež ako LATIN 2 alebo CP 852 definovaný medzinárodnou organizáciou ISO, kód ANSI 1250 známy tiež ako Windows 1250 definovaný americkou organizáciou ale najradšej sme používali kód bratov kamenických známy tiež ako CP 895, ktorý nebol štandardizovaný. Podobné to bolo i v iných krajinách. Celý problém bol v tom, že kód ASCII bol navrhnutý tak, že jednému znaku prislúchal jeden bajt. Takéto kódovanie umožňovalo vytvárať sady s 256 znakmi. Kódovanie UNICODE je navrhnuté pomocou dvojbajtového kódovania znakov, čo umožňuje vytvárať sady s 65 536 znakmi. Štandard je navrhnutý tak, že všetky možné znaky rozdeľuje do sedemnástich dvojbajtových plánov. Takéto rozdelenie umožňuje definovať až 1 114 112 (= 17 × 216) znakov. Prvá verzia štandardu vznikla v októbri 1991 no súčasná verzia štandardu je už UNICODE 5.0. Táto definuje 101 063 znakov čo je iba 9,1 % zo všetkých možných.

[úprava] Problémy s kódovaním UNICODE

Pôvodná koncepcia bola taká, že každému znaku bude priradená dvojbajtová hodnota, ktorá bude znak reprezentovať v pamäti počítača. Takéto kódovanie však vytváralo niekoľko problémov. Niektoré systémy boli navrhnuté tak, že z pamäte sa najskôr spracovával vyšší bajt a potom nižší a u iných systémov to bolo opačne. Na niektorých systémoch, preto začali ukladať bajty v opačnom poradí, čo spôsobilo to, že po prenose textu z jedného systému na druhý, bol text nečitateľný. Problém vyriešili tým, že na začiatok každého dokumentu vložili informáciu BOM (Byte Order Mark), o tom v akom poradí sú uložené byjty reprezentujúce text. Tekéto kódovanie je dnes označované tiež UCS-2.

Ďalším problémom bola nekompatibilita so staršími systémami, ktoré používali ASCII kódovanie. Tento problém čiastočne rieši kódovanie UTF s premenlivou bitovou dĺžkou. Toto kódovanie kóduje prvých 128 znakov zhodne s ASCII tabuľkou. Líšiť sa zažina až ďalšími znakmi, ktoré na kodovanie používajú viac ako 8 bitov.

V súčasnosti sa používajú tieto spôsoby kódovania:

  • UTF-7 — nepopulárne 7-bitové kódovanie, považované za zastaralé
  • UTF-8 — 8-bitové kódovanie s premenlivou bitovou dĺžkou, ktoré je čiastočne kompatibilné s ASCII
  • UCS-2 — 16-bitové kódovanie s pevnou dĺžkou, ktoré však podporuje len prvý zo 17 plánov tzv. BMP (Basic Multilingual Plane)
  • UTF-16 — 16-bitové kódovanie s premenlivou dĺžkou
  • UCS-4 alebo UTF-32 — 32-bitové kódovanie s pevnou bitovou dĺžkou
  • UTF-EBCDIC — kódovanie pre systémy EBCDI od firmy IBM

[úprava] Znakové sady Unicode

  • Základná latinka (0000-007F)
  • Doplnok Latin-1 (0080-00FF)
  • Rozšírenie latinky-A (0100-017F)
  • Rozšírenie latinky-B (0180-024F)
  • Medzinárodná fonetická abeceda (0250-02AF)
  • Medzerové písmená (02B0-02FF)
  • Kombinovanie Diakritické Značky (0300-036F)
  • Grécka abeceda a Koptické (0370-03FF)
  • Cyrilská abeceda (0400-04FF)
  • Doplnok cyrilskej abecedy (0500-052F)
  • Arménska abeceda (0530-058F)
  • Hebrejská abeceda (0590-05FF)
  • Arabská abeceda (0600-06FF)
  • Sýrska abeceda (0700-074F)
  • Thaanska abeceda (0780-07BF)
  • Devanagari abeceda (0900-097F)
  • Bengálska abeceda (0980-09FF)
  • Gurmukhi abeceda (0A00-0A7F)
  • Gujarati abeceda (0A80-0AFF)
  • Oriya abeceda (0B00-0B7F)
  • Tamilská abeceda (0B80-0BFF)
  • Telugu abeceda (0C00-0C7F)
  • Kannada abeceda (0C80-0CFF)
  • Malayalam abeceda (0D00-0D7F)
  • Sinhala abeceda (0D80-0DFF)
  • Thaiská abeceda (0E00-0E7F)
  • Laoská abeceda (0E80-0EFF)
  • Tibetský skript (0F00-0FFF)
  • Burmeská abeceda (1000-109F)
  • Gruzínska abeceda (10A0-10FF)
  • Hangul Jamo (1100-11FF)
  • Etiópčina (1200-137F)
  • Cherokee (13A0-13FF)
  • Zjednotené kanadské domorodé slabiky (1400-167F)
  • Ogham (1680-169F)
  • Runy (16A0-16FF)
  • Tagalog (1700-171F)
  • Hanunoo (1720-173F)
  • Buhid (1740-175F)
  • Tagbanwa (1760-177F)
  • Khmérska abeceda (1780-17FF)
  • Mongolčina (1800-18AF)
  • Limbu (1900-194F)
  • Tai Le (1950-197F)
  • Khmérske symboly (19E0-19FF)
  • Fonetické rozšírenia (1D00-1D7F)
  • Doplnená rozšírená latinka (1E00-1EFF)
  • Rozšírená gréčtina (1F00-1FFF)
  • Všeobecné interpunkčné znamienka (2000-206F)
  • Superskripty and subskripty (2070-209F)
  • Symboly peňažných mien (20A0-20CF)
  • Kombinovanie diakritických znakov a symbolov (20D0-20FF)
  • Symboly pripomínajúce písmená (2100-214F)
  • Číselné formy (2150-218F)
  • Šípky (2190-21FF)
  • Matematické operátory (2200-22FF)
  • Rôzne technické znaky (2300-23FF)
  • Riadiace obrázky (2400-243F)
  • Optické rozoznávanie znakov (2440-245F)
  • Uzavretá alfanumerika (2460-24FF)
  • Kreslenie čiar (2500-257F)
  • Blokové prvky (2580-259F)
  • Geometrické tvary (25A0-25FF)
  • Rôzne symboly (2600-26FF)
  • Dingbaty (2700-27BF)
  • Rôzne matematické symboly-A (27C0-27EF)
  • Doplňujúce šípky-A (27F0-27FF)
  • Braillovo písmo (2800-28FF)
  • Doplňujúce šípky-B (2900-297F)
  • Rôzne matematické symboly-B (2980-29FF)
  • Doplňujúce matematické operátory (2A00-2AFF)
  • Rôzne symboly a šípky (2B00-2BFF)
  • Doplnok CJK radikálov (2E80-2EFF)
  • Kangxi radikály (2F00-2FDF)
  • Ideographické popisujúce znaky (2FF0-2FFF)
  • CJK symboly a interpunkčné znamienka (3000-303F)
  • Hiragana (3040-309F)
  • Katakana (30A0-30FF)
  • Bopomofo (3100-312F)
  • Hangul kompatibilita Jamo (3130-318F)
  • Kanbun (3190-319F)
  • Rozšírené Bopomofo (31A0-31BF)
  • Katakana fonetické rozšírenia (31F0-31FF)
  • Uzavreté CJK písmená a mesiace (3200-32FF)
  • CJK kompatibilita (3300-33FF)
  • CJK zjednotené ideografické rozšírenia A (3400-4DBF)
  • Yijing Hexagramové symboly (4DC0-4DFF)
  • CJK zjednotené ideography (4E00-9FFF)
  • Yi slabiky (A000-A48F)
  • Yi radikály (A490-A4CF)
  • Hangul slabiky (AC00-D7AF)
  • High Surrogates (D800-DB7F)
  • High Private Use Surrogates (DB80-DBFF)
  • Low Surrogates (DC00-DFFF)
  • Oblasť na súkromné použitie (E000-F8FF)
  • CJK Compatibility Ideographs (F900-FAFF)
  • Abecedné prezentačné formy (FB00-FB4F)
  • Arabské prezentačné formy-A (FB50-FDFF)
  • Variation Selectors (FE00-FE0F)
  • Combining Half Marks (FE20-FE2F)
  • CJK Compatibility Forms (FE30-FE4F)
  • Malé varianty foriem (FE50-FE6F)
  • Arabské prezentačné formy-B (FE70-FEFF)
  • Pološiroké a plnoširoké formy (FF00-FFEF)
  • Špeciálne (FFF0-FFFF)
  • Linear B Syllabary (10000-1007F)
  • Linear B Ideograms (10080-100FF)
  • Aegské čísla (10100-1013F)
  • Stará italičtina (10300-1032F)
  • Gótická abeceda (10330-1034F)
  • Ugaritická abeceda (10380-1039F)
  • Deseretská abeceda (10400-1044F)
  • Shavianská abeceda (10450-1047F)
  • Osmanya (10480-104AF)
  • Cypriotský šlabikár (10800-1083F)
  • Byzantské hudobné symboly (1D000-1D0FF)
  • Hudobné symboly (1D100-1D1FF)
  • Tai Xuan Jing Symbols (1D300-1D35F)
  • Matematické alfanumerické symboly (1D400-1D7FF)
  • CJK zjednotené ideografické rozšírenia B (20000-2A6DF)
  • CJK Compatibility Ideographs Supplement (2F800-2FA1F)
  • Značky (E0000-E007F)
  • Variation Selectors Supplement (E0100-E01EF)
  • Doplňujúca oblasť na súkromné použitie-A (F0000-FFFFF)
  • Doplňujúca oblasť na súkromné použitie-B (100000–10FFFD)

[úprava] História revízií Unicode

[úprava] Externé odkazy

Our "Network":

Project Gutenberg
https://gutenberg.classicistranieri.com

Encyclopaedia Britannica 1911
https://encyclopaediabritannica.classicistranieri.com

Librivox Audiobooks
https://librivox.classicistranieri.com

Linux Distributions
https://old.classicistranieri.com

Magnatune (MP3 Music)
https://magnatune.classicistranieri.com

Static Wikipedia (June 2008)
https://wikipedia.classicistranieri.com

Static Wikipedia (March 2008)
https://wikipedia2007.classicistranieri.com/mar2008/

Static Wikipedia (2007)
https://wikipedia2007.classicistranieri.com

Static Wikipedia (2006)
https://wikipedia2006.classicistranieri.com

Liber Liber
https://liberliber.classicistranieri.com

ZIM Files for Kiwix
https://zim.classicistranieri.com


Other Websites:

Bach - Goldberg Variations
https://www.goldbergvariations.org

Lazarillo de Tormes
https://www.lazarillodetormes.org

Madame Bovary
https://www.madamebovary.org

Il Fu Mattia Pascal
https://www.mattiapascal.it

The Voice in the Desert
https://www.thevoiceinthedesert.org

Confessione d'un amore fascista
https://www.amorefascista.it

Malinverno
https://www.malinverno.org

Debito formativo
https://www.debitoformativo.it

Adina Spire
https://www.adinaspire.com