ISO 8859-2
Z Wikipedii
ISO 8859-2 lub bardziej formalnie ISO/IEC 8859-2, również znane jako Latin-2, bądź "środkowo–" i "wschodnioeuropejskie", jest drugą częścią standardu kodowania znaków zdefiniowanego przez organizację ISO. Składa się ze 191 znaków łacińskiego pisma, z czego każdy jest zapisywany przy pomocy ośmiu bitów.
Spis treści |
[edytuj] Pokrycie języków
Używając tego zestawu znaków da się zapisać teksty w językach bośniackim, chorwackim, czeskim, węgierskim, polskim, rumuńskim, serbskim (w łacińskiej transkrypcji), serbsko–chorwackim, słowackim, słoweńskim, jak również w górno– i dolnołużyckim. Dodatkowo nadaje się do przedstawienia kilku zachodnioeuropejskich języków jak niemiecki, czy też angielski, co jest ważną cechą przy wielojęzycznych dokumentach (dla tych języków powinno się raczej stosować ISO 8859-1).
W przeciwieńswie do ISO 8859-1, choć nie jest to stosowane, da się w tym zestawie znaków przedstawić też język fiński. Sporną kwestią jest natomiast, dostosowanie tego kodowania do języka rumuńskiego z powodu tego, że zamiast liter Șș i Țț (S i T z przecinkiem) są znaki Şş i Ţţ (S i T z cedillą). Co prawda, litery te zostały zunifikowane w pierwszej wersji Unicode'u, gdzie pojawienie się ich z cedillą czy przecinkiem było traktowane jako wybór glifu, a nie jako oddzielne znaki, to jednak fonty przeznaczone do użycia z z tym językiem winny mieć znaki z przecinkiem w ich miejscach.
[edytuj] Tablica kodów
ISO/IEC 8859-2:1999 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
0x | Znaki kontrolne | |||||||||||||||
1x | ||||||||||||||||
2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8x | Nie używane | |||||||||||||||
9x | ||||||||||||||||
Ax | NBSP | Ą | ˘ | Ł | ¤ | Ľ | Ś | § | ¨ | Š | Ş | Ť | Ź | SHY | Ž | Ż |
Bx | ° | ą | ˛ | ł | ´ | ľ | ś | ˇ | ¸ | š | ş | ť | ź | ˝ | ž | ż |
Cx | Ŕ | Á | Â | Ă | Ä | Ĺ | Ć | Ç | Č | É | Ę | Ë | Ě | Í | Î | Ď |
Dx | Đ | Ń | Ň | Ó | Ô | Ő | Ö | × | Ř | Ů | Ú | Ű | Ü | Ý | Ţ | ß |
Ex | ŕ | á | â | ă | ä | ĺ | ć | ç | č | é | ę | ë | ě | í | î | ď |
Fx | đ | ń | ň | ó | ô | ő | ö | ÷ | ř | ů | ú | ű | ü | ý | ţ | ˙ |
W powyższej tabeli, znak o kodzie 0x20 jest zwykłą spacją, 0xA0 jest spacją niełamliwą, a znak 0xAD jest miękkim myślnikiem.
[edytuj] Mapowanie na Unicode
Poniższa tabela przedstawia miejsca znaków z ISO 8859-2 w Unicode.
ISO/IEC 8859-2:1999 | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Hex | Znak | Unicode | Hex | Znak | Unicode | Hex | Znak | Unicode | Hex | Znak | Unicode |
0x80 | ZK | U+0080 | 0xA0 | NBSP | U+00A0 | 0xC0 | Ŕ | U+0154 | 0xE0 | ŕ | U+0155 |
0x81 | ZK | U+0081 | 0xA1 | Ą | U+0104 | 0xC1 | Á | U+00C1 | 0xE1 | á | U+00E1 |
0x82 | ZK | U+0082 | 0xA2 | ˘ | U+02D8 | 0xC2 | Â | U+00C2 | 0xE2 | â | U+00E2 |
0x83 | ZK | U+0083 | 0xA3 | Ł | U+0141 | 0xC3 | Ă | U+0102 | 0xE3 | ă | U+0103 |
0x84 | ZK | U+0084 | 0xA4 | ¤ | U+00A4 | 0xC4 | Ä | U+00C4 | 0xE4 | ä | U+00E4 |
0x85 | ZK | U+0085 | 0xA5 | Ľ | U+013D | 0xC5 | Ĺ | U+0139 | 0xE5 | ĺ | U+013A |
0x86 | ZK | U+0086 | 0xA6 | Ś | U+015A | 0xC6 | Ć | U+0106 | 0xE6 | ć | U+0107 |
0x87 | ZK | U+0087 | 0xA7 | § | U+00A7 | 0xC7 | Ç | U+00C7 | 0xE7 | ç | U+00E7 |
0x88 | ZK | U+0088 | 0xA8 | ¨ | U+00A8 | 0xC8 | Č | U+010C | 0xE8 | č | U+010D |
0x89 | ZK | U+0089 | 0xA9 | Š | U+0160 | 0xC9 | É | U+00C9 | 0xE9 | é | U+00E9 |
0x8A | ZK | U+008A | 0xAA | Ş | U+015E | 0xCA | Ę | U+0118 | 0xEA | ę | U+0119 |
0x8B | ZK | U+008B | 0xAB | Ť | U+0164 | 0xCB | Ë | U+00CB | 0xEB | ë | U+00EB |
0x8C | ZK | U+008C | 0xAC | Ź | U+0179 | 0xCC | Ě | U+011A | 0xEC | ě | U+011B |
0x8D | ZK | U+008D | 0xAD | SHY | U+00AD | 0xCD | Í | U+00CD | 0xED | í | U+00ED |
0x8E | ZK | U+008E | 0xAE | Ž | U+017D | 0xCE | Î | U+00CE | 0xEE | î | U+00EE |
0x8F | ZK | U+008F | 0xAF | Ż | U+017B | 0xCF | Ď | U+010E | 0xEF | ď | U+010F |
0x90 | ZK | U+0090 | 0xB0 | ° | U+00B0 | 0xD0 | Đ | U+0110 | 0xF0 | đ | U+0111 |
0x91 | ZK | U+0091 | 0xB1 | ą | U+0105 | 0xD1 | Ń | U+0143 | 0xF1 | ń | U+0144 |
0x92 | ZK | U+0092 | 0xB2 | ˛ | U+02DB | 0xD2 | Ň | U+0147 | 0xF2 | ň | U+0148 |
0x93 | ZK | U+0093 | 0xB3 | ł | U+0142 | 0xD3 | Ó | U+00D3 | 0xF3 | ó | U+00F3 |
0x94 | ZK | U+0094 | 0xB4 | ´ | U+00B4 | 0xD4 | Ô | U+00D4 | 0xF4 | ô | U+00F4 |
0x95 | ZK | U+0095 | 0xB5 | ľ | U+013E | 0xD5 | Ő | U+0150 | 0xF5 | ő | U+0151 |
0x96 | ZK | U+0096 | 0xB6 | ś | U+015B | 0xD6 | Ö | U+00D6 | 0xF6 | ö | U+00F6 |
0x97 | ZK | U+0097 | 0xB7 | ˇ | U+02C7 | 0xD7 | × | U+00D7 | 0xF7 | ÷ | U+00F7 |
0x98 | ZK | U+0098 | 0xB8 | ¸ | U+00B8 | 0xD8 | Ř | U+0158 | 0xF8 | ř | U+0159 |
0x99 | ZK | U+0099 | 0xB9 | š | U+0161 | 0xD9 | Ů | U+016E | 0xF9 | ů | U+016F |
0x9A | ZK | U+009A | 0xBA | ş | U+015F | 0xDA | Ú | U+00DA | 0xFA | ú | U+00FA |
0x9B | ZK | U+009B | 0xBB | ť | U+0165 | 0xDB | Ű | U+0170 | 0xFB | ű | U+0171 |
0x9C | ZK | U+009C | 0xBC | ź | U+017A | 0xDC | Ü | U+00DC | 0xFC | ü | U+00FC |
0x9D | ZK | U+009D | 0xBD | ˝ | U+02DD | 0xDD | Ý | U+00DD | 0xFD | ý | U+00FD |
0x9E | ZK | U+009E | 0xBE | ž | U+017E | 0xDE | Ţ | U+0162 | 0xFE | ţ | U+0163 |
0x9F | ZK | U+009F | 0xBF | ż | U+017C | 0xDF | ß | U+00DF | 0xFF | ˙ | U+02D9 |
Gdzie „ZK” oznacza znak kontrolny.
[edytuj] Linki zewnętrzne
ISO 8859-1 • ISO 8859-2 • ISO 8859-3 • ISO 8859-4 • ISO 8859-5 • ISO 8859-6 • ISO 8859-7 • ISO 8859-8 • ISO 8859-9 • ISO 8859-10 • ISO 8859-11 • ISO 8859-13 • ISO 8859-14 • ISO 8859-15 • ISO 8859-16