手書き文字認識
出典: フリー百科事典『ウィキペディア(Wikipedia)』
手書き文字認識(Handwriting Recognition)とは、認識可能な手書き入力を受け取るコンピュータの機能である。紙の上に書かれた文書のイメージを「オフライン」で光学スキャンすることで認識する場合がある(光学文字認識)。また、ペン付コンピュータの画面のような入力方法で「オンライン」で筆記用具の動きを認識する場合もある。オンライン手書き文字認識のインターフェイスには一般に以下の要素が含まれる。
- ユーザーが書き込むのに使うペンまたはスタイラス。
- 接触を感知する平面の入力域。出力ディスプレイと統合されているか、隣接していることがある。
- スタイラスの動きとその結果として生じている曲線をデジタルのテキストに翻訳して解釈するソフトウェアアプリケーション。
手書き文字認識は一般的にPDAの入力方式として使われる。手書き文字入力を提供した最初のPDAは、アップル・ニュートンで、効率化されたユーザーインタフェイスの有利さを世間に知らしめた。しかし、この機器はユーザーの書き込みパターンを学習するソフトウェアの信頼性の欠如のため、商業的には成功しなかった。Newton OS 2.0で、モードレスエラー修正などの現在の認識システムでも見られないユニークな機能を含めて手書き文字認識が大いに改善されたものの、それ以前に悪い第一印象が形成されてしまっていた。他の努力として、Go の Penpoint オペレーティングシステムを使った Penpoint コンピュータであり、NCR や IBM など様々なメーカーが製造した。IBMのThinkpad タブレット・コンピュータは Penpoint オペレーティングシステム と IBM の手書き文字認識技術を使っていた。この認識システムは後に Microsoft Windows for Pen と IBM の Pen for OS/2 に移植された。これはどれも商業的には成功しなかった。
PalmOneは後にグラフィティ認識システムに基づくPDAのシリーズをスタートさせた。グラフィティは各文字についてペンの動きのセットを定義することで使い勝手を向上させた。これによって誤認識の可能性は狭まったが、ユーザーはペン動作パターンを覚える必要が生じた。
最近の手書き文字認識システムは、タブレットPCのためのMicrosoftのWindows XPオペレーティングシステムに見ることができる。タブレットPCはペンタブレット(とスタイラス)を装備した特殊なノート型パーソナルコンピュータで、スクリーン上に文字を手書きで入力できるようになっている。オペレーティング・システムは手書きを認識し、それを通常のテキストに変換する。特に、Microsoftのシステムはユーザの書き込みパターンを学ばず、代わりに数千の可能な字形を含む内部の認識データベースを管理している。このシステムはPDA向けの Windows Mobile OS の中で使用されている低レベルの手書き文字認識システムとは異なる。
最近では、デジタル要素を仕込んだペンで紙に文字を書いて、そこからデジタル化されたテキストを得る試みがなされている。その製品としての成否は今後のことであろう。
手書き文字認識は入力方式として一般化してきたが、いまだにデスクトップコンピュータなどで広範囲に使われるには至っていない。キーボードによる入力の方が速くて信頼性が高いという見方が一般的である。PDAでも、キーボードが徐々に導入されてグラフィティなどの手書き文字認識を置き換えている。
目次 |
[編集] オンライン手書き文字認識
オンライン手書き文字認識は、特殊なタブレットやPDAにおいて書かれた文字をテキスト情報に変換するもので、センサーがペンの先端の軌跡 X(t)、Y(t) を認識し、スイッチによってペンの上げ下げを認識する。これらのデータはデジタルインキと呼ばれ、手書き動作の表現とみなすことができる。信号は文字コードに変換され、コンピュータ内でテキスト処理アプリケーションに使われる。しかし、文字の分類はオンライン手書き文字認識システムの機能全体のほんの一部である。システムは、しばしばノイズの含まれた信号を前処理し、文字列の中に適切な分節を見つけて、最もそれらしい単語を見つける必要がある。
[編集] オフライン手書き文字認識
オフライン手書き文字認識は、手書き文字の画像データから文字コードを自動的に抽出するもので、それをコンピュータ内でテキスト処理アプリケーションで使用する。これで得られるデータは手書き文字の静的な表現とみなすことができる。手書き文字認識は光学文字認識に基づいている。しかし、文字の分類はオフライン手書き文字認識システムの機能全体のほんの一部である。システムは、画像を前処理し、文字列の中に適切な分節を見つけて、最もそれらしい単語を見つける必要がある。
この技術は、保険会社のようなたくさんの手書きの文書を処理するビジネスで使われて、成功している。認識の質は、文書を構造化することによって大幅に増大させることができる。