カンマ区切りテキスト
出典: フリー百科事典『ウィキペディア(Wikipedia)』
カンマ区切りテキスト(カンマくぎりテキスト、Comma Separated Values、CSV)とは、ある項目と項目との区切り(デリミタ)にカンマ(,)を用いて表記されているテキストファイルの事である。カンマではなく、tab(タブ)やスペースなどの区切り文字を使用している場合は、CSVとは呼ばない。
[編集] 概要
コンピュータ内部において、データベース内のテーブルや表計算ソフトの表の内容は、それぞれのソフトウェアが処理可能な独自のファイルフォーマットで保存されており、別のソフトウェアへデータを移そうにも基本的には互換性はない為に読み込む事はできない。
カンマ区切りテキストは、テキスト形式で保存される為テキストエディタでも閲覧や編集が可能。さらに使用するソフトウェアが、カンマ区切りテキストの出力(エクスポート)と、読み込みから表への生成(インポート)に対応していれば、別製品のデータベースソフトや表計算ソフトからのデータ交換が可能となる。
しかし、「テキスト形式」や「日付形式」といった各項目に設定している属性は出力されない為、インポートする側のソフトウエアがインポートする際に設定しなくてはいけない。
パソコンの表計算ソフトが流行して以降、非常によく利用されるようになった。大型コンピュータとのデータのやりとりでは固定長データフォーマットがよく利用される。現在では、XMLを使おうという動きもあるが、主流になるには至っていない。
カンマ区切りテキストには、正式な仕様書が無いため(2005年10月に後追いで現状を追認する形ながらRFC 4180で一応の定義はされたが)、ExcelのCSV出力(別名K3フォーマット、かつて、NECのPC-9800シリーズで使われていた、管理工学研究所製データベースソフト「桐」のカンマ区切りテキスト出力フォーマットの形式)がデファクトスタンダードとなる事が多い。たとえば、項目中にカンマを入れるにはどうすればいいかという問題に対しては、項目をダブルクォート(")で括り、ダブルクォート自体はどうするかというと、二つ重ねることで対処するという。もっとも、全てのソフトが対応しているというわけではない。
[編集] 外部リンク
- RFC4180 (Common Format and MIME Type for Comma-Separated Values (CSV) Files)
- RFC4180・日本語訳