HyperText Markup Language
出典: フリー百科事典『ウィキペディア(Wikipedia)』
HTMLコードの例。 |
|
拡張子: | .html, .htm |
---|---|
MIME Type: | text/html |
タイプコード: | TEXT |
UTI: | public.html |
開発者: | W3C |
種別: | マークアップ言語 |
拡張: | XHTML |
国際標準: | W3C HTML 4.01 |
HyperText Markup Language(ハイパーテキスト・マークアップ・ランゲージ、略称:HTML)は、ウェブ上のドキュメントを記述するためのマークアップ言語である。
ウェブの基幹的役割を持つ技術の一つで、HTMLでマークアップされたドキュメントはほかのドキュメントへのハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などの高度な表現力を持つ。
HTMLは現在W3Cによる標準規格であるが、最近では後継規格であるXHTMLへの置き換えが進められている。
目次 |
[編集] 特徴
HTML |
---|
Cascading Style Sheets |
HTMLの特徴は、ハイパーテキストを利用した、相互間文書参照のフレームワークである。マークアップはプレーンテキストの文書を要素で括って意味付けすることで行い、文書の特定要素にURIを用いた他文書へのリンクを記載しておけば、ユーザエージェントはそれを解釈して指定された他文書を表示させる事が可能となる。また、マークアップを施す際に引用や画像の埋め込み、文書のタイトルの指定などを定める要素を記載すれば、ユーザエージェントがそれらを解釈し、形態に見合った表示を行う。HTML はそうしたマークアップの規則を定めている。
マークアップ規則は DTD として公開され、要素ごとに記載することの出来る属性、内容に含むことの出来る要素などが定められている。最新バージョンの HTML 4.01 では、厳密なもの (Strict)、過渡期のためのもの (Transitional)、フレームを用いた文書のためのもの (Frameset) といった3つのDTDが定義されている。
要素は開始タグ、内容、終了タグの三つから成り立つ。開始タグ・終了タグは <、> で括られ、更に終了タグについては < の直後に / を含めなければならない。属性は開始タグの中において要素名の後ろから > の前までの間に書くことができる。また、終了タグを省略できる要素も存在する。内容をもたない空要素は、開始タグのみ書くことができる。
HTML 3.2 では見た目を左右する要素や属性が追加されたが、HTML は本来文書構造を示すためだけにその存在意義があり、それらの要素は目的に反するものとされた。そのため視覚的・感覚的効果を定義する手段としてスタイルシート(一般にはその中のCSS)が考案された。見た目を左右する要素や属性の一部は、HTML 4以降では非推奨とされており、HTML 4.01 Strictでは定義されていないので使用できない。また非推奨とされていない要素や属性も、できるだけスタイルシートにより表現することが推奨されている。
[編集] HTML文書
HTMLで書かれた文書をHTML文書と言い、DTDによって定義される書式に沿って書くことが期待される。DTDは文書型宣言(DOCTYPE宣言)によって宣言したバージョンのものが選択される。
以下よりDTDはHTML 4.01 Strictのものを使い、要素名は大文字、属性は小文字で記すものとする。ただし、HTMLにおいて要素名の大文字小文字は区別されない。
HTMLでは、まず文書型宣言が必要となる。HTML 4.01 Strictの文書型宣言は以下のようなものである。
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
このとき、HTML 4.01 Strictの使用およびその DTD の場所が明示されている。
次にHTML文書の例を挙げる。
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd"> <HTML lang="ja"> <HEAD> <META http-equiv="content-type" content="text/html; charset=UTF-8"> <LINK rev="made" href="mailto:mail@example.com"> <TITLE>Hypertext Markup Language - Wikipedia</TITLE> </HEAD> <BODY> <DIV> <H1>Hypertext Markup Language</H1> <P>HTMLは、<A href="http://ja.wikipedia.org/wiki/SGML">SGML</A> アプリケーションの一つで、ハイパーテキストを利用してワールド ワイドウェブ上で情報を発信するために作られ、 ワールドワイドウェブの<STRONG>基幹的役割</STRONG>をなしている。 情報を発信するための文書構造を定義するために使われ、 ある程度機械が理解可能な言語で、 写真の埋め込みや、フォームの作成、 ハイパーテキストによるHTML間の連携が可能である。</P> </DIV> </BODY> </HTML>
このHTML文書は次のような構造を示している。
文書型宣言 HTML要素(ルート要素。また、言語コードjaの言語が使われていることの明示) HEAD要素(この文書のヘッダ情報の明示) META要素(文書のメタ情報。この場合、HTTPヘッダの代用) LINK要素(他のリソースとの関連を明示。この場合、作者の明示) TITLE要素(この文書のタイトルの明示) BODY要素(この文書の内容の明示) DIV要素(ブロックを明示) H1(第一レベルの見出しを明示) P要素(段落の明示) A要素(他のリソース([1])へのアンカーであることの明示) STRONG要素(強い強調であることの明示)
タグによって文字列を括ることによりその文字列の意味付けがなされる。ユーザエージェントはそれを解釈して、例えばGUIによるウェブブラウザであればSTRONG要素で括られたテキストを太字として表示するなどする。また、スタイルシートを用いることで見ためなどを指定することができるようになっている。
[編集] HTMLタグ
タグとは本来 < に始まり > に終わる要素を記述するための符号を示す意味で用いられる言葉であるが、HTMLの要素を示す意味でタグと言う言葉が用いられることもある。
Webページを構築するCSSやJavaScript、CGIなどのこともタグであると言う事例があるが、これらは要素を記述する符号と言う意味が派生・曖昧化したものであり、コンピュータ用語として正しい用法であるとはいえない。
[編集] HTMLの歴史
HTMLはもともと、SGMLアプリケーションの一つとして制定された。
また、HTMLは、環境に依存せずHTMLを書く側・読む側で矛盾が起こらぬよう標準化が進められてきた。初期はIETFからRFCとして標準化されていた。HTML 3.2 からはW3Cがその役目を担っている。
[編集] HTML 1.0
1993年6月に、IETFのIIIR Workingグループより提出されたインターネット・ドラフトを通常HTML 1.0と呼ぶ。このドラフトはティム・バーナーズ=リーおよびダニエル・コノリーによって、ティムの出したHTML Design Constraintsに極力従うように書かれた。
[編集] HTML+
(未投稿)
[編集] HTML 2.0
1995年11月に、IETFのHTMLワーキンググループによってRFC 1866として仕様が発表された。HTML 2.0はRFC 2854によって破棄された。
[編集] HTML 3.0
策定作業が行われたが、ドラフトの段階で策定途中に破棄された。
[編集] HTML 3.2
[編集] HTML 2.x
1997年1月、RFC 2070として発表された。「HTML i18n」とも呼ばれるが、現在はRFC 2854によって破棄された。
日本語を扱えるHTMLのバージョンとしては、最も古い。
[編集] HTML 4.0、HTML 4.01
1997年12月18日に、W3C勧告としてHTML 4.0の仕様が発表された。HTML 4.0は1998年4月24日に仕様が改訂された。この仕様にいくらかのマイナーな修正が加えられたHTML 4.01は1999年12月24日にW3C勧告となった。
この後、HTML 4.01をベースとしてXHTML 1.0が策定されることになる。
ISO/IEC 15445:2000、JIS X 4156:2000としてより厳密に規格化されている。
[編集] HTML形式の電子メール
Outlook Expressなどの電子メールソフトでは、メール内容をHTML形式で送信するため、HTML描画用レンダリングエンジンのセキュリティホールを突いたコンピュータウイルスの侵入など、セキュリティなどの面で問題が生じることが多い。電子メール#メール形式を参照。
[編集] 関連項目
- SGML - HTMLやXMLなどのマークアップ言語を定義するためのメタ言語の一つ
- XHTML - HTMLをXMLで再定義したマークアップ言語
- HDML (Handheld Device Markup Language) - i-modeなどのモバイルコンテンツ用に定義されたマークアップ言語
- CSS (カスケーディング・スタイル・シート) - HTMLやXMLの修飾に使われる仕様・規格
- ダイナミックHTML (Dynamic HTML, DHTML) - 動的なHTMLの抽象的概念
- ユーザビリティ - ユーザーの立場に立った利便性を追求する概念
- アクセシビリティ - 誰もが情報を取得・発信できる柔軟性に富んでいて、アクセスした誰もが同様に情報を共有できる状態にあること(あるいはその度合い)
- Webブラウザ - Microsoft Internet ExplorerやMozilla FirefoxなどWebページにアクセスして表示するためのブラウザ・ソフトウェア
- HTMLレンダリングエンジン - 実際にHTMLを解析・組み立てを行いWebブラウザなどクライアントの画面に表示させる機能を担う
- 実体参照 (エンティティ) - や ' などの表記方法
- Hypertext Transfer Protocol
[編集] 外部リンク
- RFC 2854 - The 'text/html' Media Type.
- Another HTML-lint:HTML文書の文法をチェック、採点。
- W3C Markup Validation Service:HTML、CSS文書などの文法をチェック、採点。
- ごく簡単なHTMLの説明
カテゴリ: World Wide Web | W3C勧告 | マークアップ言語 | ISO