本研究は,日本語のオンライン手書きで確立した明示的な切出し手法による最先端の認識技術を土台に,包括的なモデルを提案し,英語や中国語,アラビア語などの多言語の手書き認識に適用し,各言語に対する既存手法のメリットを包括しつつ,各手法を超える性能や利点を実現することを目指している. 自由に筆記される手書き文字列においては,暗黙的な切出し手法と明示的な切出し手法の2種類がある. 暗黙的切出し手法は文字列パタンを想定される文字幅より小さい一定幅の基本切出し(フレーム)に分割し,分割されたフレームのいくつかの列に字種クラスのラベルを付けることで認識を行う.この方法では,個々にフレームの形状を評価しているため文字パタンの形状情報が有効に評価されない欠点がある. 一方,明示的な切出し手法では,まず文字列パタンは基本切出しパタンに仮切出しする.文字を分割しすぎることがあっても,文字の切れ目を切らないことがないように過分割する.基本切出しパタンのまま,あるいは結合して生成された候補文字パタンを文字認識し,それらを組み合わせることで,文字切出し認識候補ラティスを生成する.この手法では,同じ筆点が複数の切出しパタンに属し,何度も重複して計算され計算コストを増大さる欠点がある. 日本語と中国語を代表とする漢字文化圏では,文字ごとでは分かち書きされるので,明示的な切出し手法が主流であり,一方,英語やフランス語,ドイツ語などの欧米語文化圏では,単語の続け字の明示的な切出しが難しいために暗黙的な切出し手法が多く採用されている. 二年目では英語手書き認識のモデル化について,暗黙的切出し手法と明示的切出し手法をそれぞれ認識に適用し結果を比較するうえで,両手法を統合し,改良を行った.これにより,精度と速度の大きくの向上を実現した.国際会議や論文誌などの場で研究成果を公表し,意見交換を行った.
|