2001 Fiscal Year Annual Research Report
連続音声認識手法を用いた走り書き・非目視手書き漢字認識の研究
Project/Area Number |
11480074
|
Research Institution | The University of Tokyo |
Principal Investigator |
嵯峨山 茂樹 東京大学, 大学院・情報理工学系研究科, 教授 (00303321)
|
Co-Investigator(Kenkyū-buntansha) |
田原 鉄也 東京大学, 大学院・情報理工学系研究科, 助手 (90272393)
中井 満 北陸先端科学技術大学院大学, 情報科学研究科, 助手 (60283149)
下平 博 北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (30206239)
|
Keywords | オンライン手書き文字認識 / 走り書き・非目視手書き / 連続音声認識手法 / 隠れマルコフモデル / ストローク単位 / 階層的漢字構造辞書 / Viterbiアルゴリズム / 漢字データベース |
Research Abstract |
連続音声認識の方法論をオンライン手書き文字認識に応用する新手法開発を一昨年度に開始した。連続音声認識における音素に代えて25種類の基本サブストローク、言語モデルに代えて漢字構造辞書を用いるものである。漢字辞書を解空間とし、効果的な探索を行って認識を行う。これにより、辞書定義により新しい文字を容易に増やすことができ、たとえば教育漢字のみを学習データとして用いて、第一・第二水準の漢字も高い認識性能で認識できる。隠れマルコフモデル(HMM)の使用によって変動に強い。モデルサイズ、辞書サイズは、実用になっている従来のDPベースの手法より小さい。3年間に、本研究開発は高度に、大幅に進み、人間には読めないような手書き文字もかなり認識できるようになった。 1.走り書き、続け字、視覚障害者の手書き漢字の認識手法開発 本手法はペンの動きの中のミクロの意志の時系列を確率論的に捉える方法論に依っている。前後の画の影響を表現するために、SSS(逐次状態分割)法およびSSS-free法を用いて、隠れマルコフ網(HMnet)を自動学習生成し、前後環境依存ストロークモデルを開発して性能を向上させた。また、サブストロークの連鎖を自動学習しマクロモデル化して、認識性能向上を行った。 2.重ね書き連続漢字認識手法開発 タッチパッド上の同一領域に次々に文字を重ね書きして文入力できる手法を開発した。漢字区切り情報は与えず、漢字連鎖確率モデルを統計文法とし、連続音声認識手法と同様の考え方に基づく。 3.筆圧を利用したオンライン手書き漢字認識手法開発 筆先の進行方向θと移動速度rに、さらに筆圧zを特徴量に加えたオンライン手書き漢字認識を行った。筆圧の時間微分量を使用すると性能向上が確認され、丁寧な手書き漢字(教育漢字)の認識率約98%を得た。 4.走り書き、非目視手書き、視覚障害者文字データの収集と解析 過去2年間に続き、今年度も精力的に百人超の筆者により、非目視、走り書き、視覚障害者の手書き文字の大量のデータ収集を行った。この種のデータに関して初の本格的収集である。また、文字認識の視点からそれらの文字の問題を解析した。かすれや余分な点などの問題が大きいことが判明した。人間には読めないような、これらの文字を認識する手法が確立できた。 5.障害者向け応用開発の開始 同時並行で、本技術を核として「視覚障害者のための文字コミュニケーション技術開発」を石川県の「地域産学官連携豊かさ創造研究開発プロジェクト」(リーダ:嵯峨山、3年間、予算総額1億円の予定)として、視覚障害者が手書き文字でモバイル機器を操作できるように進めている。
|
Research Products
(6 results)
-
[Publications] 秋良 直人, 中井 満, 下平 博, 嵯峨山 茂樹: "ストロークHMMを用いたオンライン非目視手書き文字認識の性能評価"電子情報通信学会技術報告 PRMU2000-206, Mar 2001. 39-46 (2002)
-
[Publications] 徳野 淳子, 中井 満, 下平 博, 嵯峨山 茂樹, 細川 啓子: "視覚障害者を対象にしたストロークHMMオンライン文字認識方式の性能評価"電子情報通信学会技術報告 WIT2001-13, Aug 2001. 19-24 (2002)
-
[Publications] M.Nakai, N.Akira, H.Shimodaira, S.Sagayama: "Substroke Approach to HMM-based On-line Kanji Handwriting Recognition"Proceedings of ICDAR'01, Sep 2001. 491-495 (2002)
-
[Publications] 須藤 隆, 中井 満, 下平 博, 嵯峨山 茂樹: "筆圧を利用したストロークHMMに基づくオンライン走り書き文字認識"平成13年電気関係学会北陸支部大会講演論文集, F-67, Oct 2001. 407-407 (2002)
-
[Publications] 須藤 隆, 中井 満, 下平 博, 嵯峨山 茂樹: "筆圧情報を併用したストロークHMMに基づくオンライン文字認識"電子情報通信学会技術報告 PRMU2001-189, Dec 2001. 93-100 (2002)
-
[Publications] 須藤 隆, 中井 満, 下平 博, 嵯峨山 茂樹: "ストロークHMMを用いたオンライン重ね書き文字列認識"電子情報通信学会技術報告 PRMU2001-, Mar 2002. (2002)