文字集合
出典: フリー百科事典『ウィキペディア(Wikipedia)』
文字集合 (character set) とは、文字を重複なく集めたものである。文字セットという場合もある。
例えば、「全てのアルファベット」(a, b, c, ..., z, A, B, C, ..., Z)というのもひとつの文字集合であるし、 「全てのひらがな」(あ, い, う, ..., ん)というのもまた、ひとつの文字集合である。
コンピュータ上で文字を扱う場合、文字ごとに符号化表現 (ビット組合せ) を割り当てるため、どの文字を扱うかということを決めなければならない。このため文字集合の定義が必要となる。
コンピュータで扱う文字集合内の各文字には符号 (ビット組合せ、または番号) が割り当てられているのが通常であり、これを符号化文字集合と言う。実際にコンピュータ上で使われている符号化文字集合には、例えばJIS X 0201 や JIS X 0208がある。
複数の符号化文字集合を組み合わせた運用方式や、一つの符号化文字集合を計算によって変形させた形式を指して符号化方式と呼ぶことがある (Shift_JIS や UTF-8等)。
文字コードとは、『符号化文字集合』を指す言葉であると解釈されることが多い。