1992 Fiscal Year Annual Research Report
神経回路モデル、確率モデルの適用によるオンライン文字認識の高度化に関する研究
Project/Area Number |
03650306
|
Research Institution | Kyushu University |
Principal Investigator |
迫江 博昭 九州大学, 工学部, 教授 (30215701)
|
Co-Investigator(Kenkyū-buntansha) |
片山 喜規 九州大学, 工学部, 助手 (00214338)
宮崎 明雄 九州大学, 工学部, 助教授 (70192763)
|
Keywords | オンライン文字認識 / 筆順フリー / 確率モデル / 神経回路モデル / DPマッチング / 複合アルゴリズム |
Research Abstract |
1.当年度当初は、対象文字セットを英文字まで拡張して、確率モデルとDPマッチングの複合アルゴリズム(2次元HMM)による認識実験を行なうことを目的としていたが、文字セットの拡大にともなってアルゴリズムの複雑さが問題となった。すなわち、このアルゴリズムが要する計算量、記憶量ともに膨大で、実用上の問題があることが判明した。このため本年度はアルゴリズムの効率化に注力した。 従来のアルゴリズムが4次元構成のワークエリア上での探索処理となっていることが問題点と判明し、2次元平面上に(1,0)ドットで表現されていた入力パターンを、ペン軌跡の(x,y)座標系列で表現し、DP計算点をこのテーブルで指定する方式を開発した。これにより、計算ワークエリアは実質3次元構成となり、記憶量が1桁圧縮され、計算量的には数倍の高速化が達成された。 2.英数字等の多画文字に対する2次元HMMの適用について検討を行ない、画間のジャンプ部を実線部分とは別の出力確率形式で処理し、全体としては実線部分と矛盾なく統合されたHMMとする方式を確立した。 3.神経回路網の適用については、基礎検討を継続するとともに予測型ネットワークによるペン移動予測能力について実験を行ない、予測能力があるとの定性的実験結果を得た。 以上をまとめるに、本研究は完全には完成しておらず、これまでの成果を踏まえての継続研究を行なう必要がある。
|
-
[Publications] 片山 喜規: "HMMを用いた筆順フリーオンライン文字認識アルゴリズムの改良-高速化と画間処理-" 電子情報通信学会技術報告. PRU92-116. 107-112 (1993)
-
[Publications] Akio MIYAZAKI: "Representing and Computing the Wavelet Transform by means of Networks for Approximation and Learning" Proc of 1992 Joint Technical Conference on Circuits/Systems,Computers and Communications. 517-522 (1992)
-
[Publications] 迫江 博昭: "1-2次元HMMによる筆順フリーオンライン文字認識" 電子情報通信学会技術報告. PRU92-19. 9-14 (1992)
-
[Publications] 宮崎 明雄: "2次元信号処理における演算子の表現について-行列による表現とテンソル積による表現-" 電子情報通信学会技術報告. CAS92-9. 49-54 (1992)
-
[Publications] Hiroaki SAKOE: "Neural Networks Applied to Speech Recognition" IEICE Trans.Fundamentals Vol.E75-A. No.5. 546-551 (1992)
-
[Publications] 宮崎 明雄: "ウェーブレット変換により生成される再生核空間における直交関数系の構成" 電子情報通信学会,第5回回路とシステム軽井沢ワークショップ論文集. 149-154 (1992)
-
[Publications] Hiroaki SAKOE: "Speech Science and Technology;Section 4.4:A Continuous Speech Recognition System Based on Word References,Dynamic Programming and Finite State Automaton" Ohmsha, 11 (1992)
-
[Publications] Hiroaki SAKOE: "Speech Science and Technology;Section 5.4.2:A DP-Matching LSI for Speech Recognition" Ohmsha, 14 (1992)