GB 2312
出典: フリー百科事典『ウィキペディア(Wikipedia)』
GB 2312-80は、主に中国大陸で使われる簡体字中国語の文字コード(文字集合)。規格名は「信息交换用汉字编码字符集・基本集」。1980年に中華人民共和国国家標準総局により策定され、1981年5月1日に実施された。GBは「国家标准(国家標準=ピン音: Guójiā Biāozhǔn)」の略で、日本のJISにあたる中華人民共和国の国家規格。
JIS X 0208とよく似た構造を持つ94×94文字集合で、漢字の他に声調付き拼音字母、英数字、仮名(ただし長音符「ー」を除く)、ギリシア文字、キリル文字を含んでいる。漢字は一級漢字(3755字)と二級漢字(3008字)に分かれ、前者が読みの順、後者が部首の順である点もJIS X 0208と似ている。
GB 2312をEUCで符号化したものを簡体字中国語EUC (EUC-CN) という。他の符号化方式としては、1990年代半ばに、インターネットメールやネットニュースなど7ビットの経路で使用されていた非公式な方式であるHz (Hanzi) がある。ISO-2022-CNというものもあるが、ほとんど使われていない。 今日ではもっぱらEUC-CNのみが使われるため、単にGB 2312といっただけでEUC-CNを意味している場合が多い。 IANAの登録名もGB2312となっている。
[編集] 派生・後継規格
- GB/T 12345-90
- GB 2312の簡体字を繁体字に置き換えたもの。ただしそもそも簡体字と繁体字は一対一に対応するわけではないので、単純にGB 2312をこれで置き換えれば正しい繁体字表記になるというわけではない。
- GBK
- Kは「扩展(ピン音: kuòzhǎn=拡張)」を意味する。正式には「汉字内码扩展规范」という。EUC-CNを元に、ISO/IEC 10646.1:1993(Unicode 1.1に相当)の漢字等を追加し、漢字20,902字を収録。繁体字・日本漢字・韓国漢字だけでなく「啰」や「镕」のようにGB 2312の制定後に簡化され「規範漢字」となった字も取り込まれた。中国大陸向けのWindows 95簡体中文版に採用されたことにより普及した。正式な規格ではない。
- GB 18030-2000
- 規格名は「信息交换用汉字编码字符集基本集的扩充」。GBKをさらに拡張し、少数民族の文字なども含んだ大規模で正式な国家規格。2000年3月17日に国家質量技術監督局によって発布・実施され、現在中国で流通するコンピュータ製品は原則としてこれを実装することが定められている。
[編集] 関連項目
- Big5
- CNS 11643
- JIS X 0208
- KS X 1001(KS C 5601)
- CJK統合漢字