2015 Fiscal Year Annual Research Report
変形正規分布の線形結合歪度モデルによる異字体混合の低品質手書き文章認識の研究
Project/Area Number |
25330217
|
Research Institution | Tokyo National College of Technology |
Principal Investigator |
鈴木 雅人 東京工業高等専門学校, その他部局等, 教授 (50290721)
|
Co-Investigator(Kenkyū-buntansha) |
松本 章代 東北学院大学, 教養学部, 准教授 (40413752)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 線形結合歪度モデル / パタン認識 / データマイニング / 自然言語処理 |
Outline of Annual Research Achievements |
本研究の目的である識別関数の設計は,既に前年度までの研究で完了している.しかし,識別関数の計算で用いる歪度成分分析は膨大な計算時間を要するため,歪みが大きく現れる軸を経験的に絞り込む必要があった.また,歪みが大きい軸では多峰性の分布を示すこともあるため,部分的正規分布の線形結合モデルを独立成分分析により求める必要もあり,その計算にも膨大な時間がかかるという問題が残されていた. この問題を解決するため,今年度の研究では,歪度成分分析の対象軸の効果的な選択方法と,計算時間の削減方法について検討を行った.IMI(Inverted Multi Index)は,データを表現するベクトル空間を幾つかの部分空間に分割し,各部分空間におけるデータをクラスタリングすることで,最近傍探索を正確かつ高速に実現する手法の1つである.本研究では,IMIで用いる部分空間およびクラスタリング手法を応用し,上記の問題に対する解決を図った.歪度成分分析の対象軸の選択方式に関しては,従来は経験的・発見的に対象軸を決めていたが,提案手法では,全ての特徴軸を対象としてIMIで用いる部分空間をクラスタリングすることにより,歪度成分分析が必要な軸を適切に選択することが可能になった.また選択される軸は,部分空間数を適切に定めると従来の15軸の半数程度に抑えることができるため,計算時間の削減に対しても効果が高いことが分かった.更に,部分的正規分布の線形結合モデルの計算では,クラスタ毎にあてはめる部分的正規分布の線形結合によって分布を推定することができるため,独立成分分析の計算時間を大幅に削減することが可能であり,結果として計算時間の大幅な削減を実現することができた. 前年度までの成果および今年度の成果を踏襲し,我々が普段書き記すような品質の手書き文字に対して実験を行ったところ,84.5%の認識精度を実現することができた.
|