2000 Fiscal Year Annual Research Report
連続音声認識手法を用いた走り書き・非目視手書き文字のオンライン認識の研究
Project/Area Number |
11480074
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
嵯峨山 茂樹 北陸先端科学技術大学院大学, 情報科学研究科, 教授 (00303321)
|
Co-Investigator(Kenkyū-buntansha) |
中井 満 北陸先端科学技術大学院大学, 情報科学研究科, 助手 (60283149)
下平 博 北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (30206239)
|
Keywords | オンライン手書き文字認識 / 走り書き・非目視手書き / 連続音声認識手法 / 隠れマルコフモデル / ストローク単位 / 階層的漢字構造辞書 / Viterbiアルゴリズム / 漢字データベース |
Research Abstract |
連続音声認識の方法論をオンライン手書き文字認識に応用する新手法開発を昨年度開始した。連続音声認識における音素に代えて25種類の基本サブストローク、言語モデルに代えて漢字構造辞書を用いるものである。漢字構造辞書を解空間とし、効率的な探索を行って認識を行う。これにより、辞書定義により新しい文字を容易に増やすことができ、たとえば教育漢字のみを学習データとして用いて、第一・第二水準の漢字も高い認識性能で認識できる。隠れマルコフモデル(HMM)の使用によって変動に強い。モデルサイズ、辞書サイズは、実用になっている従来のDPベースの手法より小さい。今年度は、以下のような成果があった。 1.画の前後環境依存モデルの学習、マクロモデルの自動生成 非目視や走り書きの文字では、位相幾何学的特徴(交差や閉曲線など)の保存は期待できない。本手法はペンの動きの中のミクロの意志の時系列を確率論的に捉える方法論である。前後の画の影響を表現するために、調音結合現象による環境依存変形を表現するために開発した隠れマルコフ網(HMnet)を用いて、前後環境依存ストロークモデルを開発して性能を向上させた。また、統計的に多数を占めるサブストロークの連鎖をマクロモデル化して、認識誤りを半減させる成果を得た。 2.認識特徴量の改良 従来の(x,y)座標の速度ベクトルに代えて、多次元量や加速度量などさまざまな認識特徴量を検討し、極座標系(r,θ)(速度絶対値とペン進行方向角度)が有効であることを見出し、かつそのモデル学習法を開発した。 3.文字認識アルゴリズムの高速化 Beam探索をベースとする高速解探索手法を用いて、第一・第二水準の全漢字を実時間以内で余裕を持って認識できるようにした。書いている間にそこまでの入力から推定される文字認識結果が表示される。 4.走り書き・非目視手書き文字データの収集 昨年度に続き、今年度も精力的に二百人近い筆者により、非目視データ、走り書きデータを含む手書き文字の大量のデータ収集を行った。英数字&かな漢字データベース(γセット)、非目視手書き文字データベース(δセット:晴眼者による手下げ筆記、晴眼者による卓上筆記、視覚障害者による卓上筆記)、走り書き文字データベース(εセット)などを含む。視覚障害者の協力も得て、この種のデータに関して初の本格的収集である。 5.筆順バリエーションの自動学習 書かれた文字データから、その筆順を自動推定し、異なった筆順を漢字構造辞書に付け加える自動アルゴリズムを開発した。これにより、従来認識性能が極めて低かった誤筆順漢字入力の認識性能が数十倍に向上した。 6.障害者向け応用開発の開始 本技術を応用した「視覚障害者のための文字コミュニケーション技術開発」の提案が石川県の「地域産学官連携豊かさ創造研究開発プロジェクト」(リーダ:嵯峨山、3年間、予算総額1億円の予定)として採択され、今年度から開発を開始した。視覚障害者が手書き文字でモバイル機器を操作できるようにすることを狙う。
|
Research Products
(6 results)
-
[Publications] 井波暢人,松田繁樹,中井満,下平博,嵯峨山茂樹: "環境依存型ストロークHMMを用いたオンライン手書き文字認識"信学技報,PRMU2000-135. 39-46 (2000)
-
[Publications] 秋良直人,中井満,下平博,嵯峨山茂樹: "ストロークHMMに基づくオンライン手書き文字認識の特徴量の検討"信学技報,PRMU2000-134. 31-38 (2000)
-
[Publications] 井波暢人,松田繁樹,中井満,下平博,嵯峨山茂樹: "環境依存型ストロークHMMによるオンライン手書き文字認識"平成12年電気関係学会北陸支部大会講演論文集,F-93. 394 (2000)
-
[Publications] 秋良直人,中井満,下平博,嵯峨山茂樹: "ストロークHMMによるオンライン文字認識の特徴量の検討"平成12年電気関係学会北陸支部大会講演論文集,F-92. 393 (2000)
-
[Publications] 嵯峨山茂樹,中井満,下平博: "ストロークHMMに基づくオンライン手書き文字認識方式"信学技報,PRMU2000-35. 1-8 (2000)
-
[Publications] 中井満,嵯峨山茂樹,秋良直人,小場久雄,下平博: "ストロークHMMによるオンライン手書き文字認識の性能評価"信学技報,PRMU2000-36. 9-16 (2000)