1997 Fiscal Year Annual Research Report
手書き線画像からの筆順情報復元とその応用に関する研究
Project/Area Number |
09680357
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
保原 信 電気通信大学, 大学院・情報システム学研究科, 教授 (70017359)
|
Keywords | 手書き文字認識 / ストローク / 線画 / 筆順 / トレース / オイラーパス |
Research Abstract |
タブレットなどの入力装置を用いるオンライン手書き文字認識と比べると、スキャナーなどから入力された2次元画像の情報だけを頼りとしなければならないオフライン手書き文字認識には大きな困難が伴う。もし、手書き文字画像データから筆順情報を復元することができれば、オフライン手書き文字認識の問題を時間情報を利用するオンライン手書き文字認識の問題に帰着させることが可能になる。従来から本問題に対して、(1)文字画像からストロークの特徴を解析する方法、(2)ストロークの方向、長さや幅等の情報から連続性を解析する方法、(3)大局的な滑らかさを評価する方法、(4)巡回セールスマン問題を解くことによって最小曲率となるハミルトン・パスを求める方法などが試みられているが、夫々長短があり未解決の問題である。本研究は、これらの研究の比較検討を行った上で、新しくストロークの交点の次数と最短経路の探索に基づく方法を導入し、その有効性を調べた。まず、線画文字をストローク交点の集合Vと辺の集合Eからなる連結無向グラフG=(V,E)と見做し、オイラー・パスの存在を保証するように、各辺の性質を一意的に決定する。この時、例えば「h」のように、特定の辺が2度書きされる(ダブル・トレース)を許す。ある現実的で緩い条件の下に、このアルゴリズムが存在し、その数学的証明も済んでいる。実際、計算機実験によっても確認できた。この結果を基づいてストロークを追跡することにより、一筆書きの文字をダブル・トレースを含むような複雑な文字画像であっても、正確に筆順を復元することが可能でることがわかった。本手法の特徴は、最も進んだ方法と考えられる、上述の(3)、(4)の手法で最大の欠点である組合せ最適化問題を解くことが回避できることである。次年度は本手法をマルチ・ストローク文字について拡張する予定である。 なお、本研究は1998年春の情報処理学会全国大会、夏の国際パタン認識学会(ICPR)にて発表の予定である。また、情報処理学会論文誌に投稿準備中である。
|