研究分担者 |
外山 淳 北海道大学, 大学院・工学研究科, 助手 (60197960)
今井 英幸 北海道大学, 大学院・工学研究科, 助教授 (10213216)
村井 哲也 北海道大学, 大学院・工学研究科, 助教授 (90201805)
林 裕樹 国立釧路工業高専, 情報工学科, 講師 (60342440)
天元 宏 国立釧路工業高専, 情報工学科, 助教授 (80321371)
|
研究概要 |
本研究で扱っている、大規模パターン認識系の実現における検討事項のうち,今年度の成果は以下のようにまとめられる. 1)識別性能に関する検討(データ数に関する規模の問題):これまでの研究における識別性能重視から性能を損なわない範囲で計算量を削減する問題を検討し,代表的なk最近隣法において従来の分枝限定法をより高速に行う手法を開発した. 2)特徴数に関する検討(特徴数に関する規模の問題):最適な特徴の部分集合を選択する問題が本質的に組み合わせ問題を解くことになるためこれまで多くの準最適手法が検討されてきている.しかし,規模の増大に応じてこれまで十分高速であるとみなされてきた手法に関しても速度的に不十分であることが明らかになりつつある.そこで,本研究では,識別に明らかに不必要な特徴を先に除去することを「識別子に依存しない特徴選択」と位置付け,その方法論を検討し新たな提案を行った.また,その提案手法により検査すべき特徴の個数を予め減らし,その後従来の代表的な方法を適用することで,全体として高速な「識別子を特定した」特徴選択が実現できることを示した. 3)クラスの数の多い場合の検討(クラス数に関する規模の問題):漢字認識のようにカテゴリ数が非常に多い場合,識別の困難さが増すことは明らかである.本研究ではそのことの新しい視点として,識別の困難なカテゴリのグループを(スーパークラスとして)まとめることで,より高性能な識別ができるとともに,各スーパークラスを視覚化することで,困難さの所在を明らかにする手法を開発した.実際,これにより,特徴選択との併用により識別性能を向上できることを類似漢字識別問題において示した.
|