研究課題/領域番号 |
11480074
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 (2001) 北陸先端科学技術大学院大学 (1999-2000) |
研究代表者 |
嵯峨山 茂樹 東京大学, 大学院・情報理工学系研究科, 教授 (00303321)
|
研究分担者 |
田原 鉄也 東京大学, 大学院・情報理工学系研究科, 助手 (90272393)
中井 満 北陸先端科学技術大学院大学, 情報科学研究科, 助手 (60283149)
下平 博 北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (30206239)
|
研究期間 (年度) |
1999 – 2001
|
研究課題ステータス |
完了 (2001年度)
|
配分額 *注記 |
10,600千円 (直接経費: 10,600千円)
2001年度: 1,200千円 (直接経費: 1,200千円)
2000年度: 3,200千円 (直接経費: 3,200千円)
1999年度: 6,200千円 (直接経費: 6,200千円)
|
キーワード | オンライン手書き文字認識 / 走り書き・非目視手書き / 連続音声認識手法 / 隠れマルコフモデル / ストローク単位 / 階層的漢字構造辞書 / Viterbiアルゴリズム / 視覚障害者手書き文字 / 漢字データベース |
研究概要 |
連続音声認識の方法論をオンライン手書き文字認識の問題に応用して新手法を開発し、多くの成果を挙げた。原理は、連続音声認識における音素に代えて25種類の基本サブストローク、言語モデルに代えて漢字構造辞書を用いる。これに高度に進歩した連続音声認識の手法を応用して、漢字構造辞書を解空間とし、効率的な探索を行うことで、かなり崩れた手書き漢字でも認識できる技術を開発した。速度ベクトルを観測して隠れマルコフモデル(HMM)によってモデル化するため、筆先の運動から何の文字を書いたかの意図を認識する。このため字形の変動に強く、書かれた文字を人が読めなくとも認識できる場合も多い。モデルサイズ、辞書サイズは、実用になっている従来のDPベースの手法より小さく、認識速度は高速である。 このような基本構成による技術を確立した後、速度ベクトル特徴量の検討(数種類の特徴量を開発・比較)、筆圧情報を用いた手書き文字認識、ストローク環境依存モデル(前後のストロークの影響による変形をモデル化)、ストローク列マクロモデル(連続する複数ストロークをまとめてモデル化)、モデルの筆者適応(少量のサンプルから筆者の癖を学習)、非目視手書き文字の認識(見ないで書いた文字の認識)、重ね書き文字列の認識(記入枠なしで連続文字を入力)、文字認識アルゴリズムの高速化(特に解探索法を改良して極めて高速になった)、数字・平仮名を構成する曲線サブストロークモデル(漢字と別の構成要素)、走り書き・非目視手書き・視覚障害者手書き文字データの収集などを行なった。 この技術成果を核にして、視覚障害者のための文字コミュニケーション技術の開発を提案し、石川県から3年間に約1億円の支援によりプロジェクトを進めている。その過程で、100万文字を超える文字データ(走り書き・非目視手書き・視覚障害者手書き文字データを含むユニークなもの)を収集するなど、両プロジェクトが極めてうまく連携している。
|