研究分担者 |
村井 哲也 北海道大学, 大学院・情報科学研究科, 助教授 (90201805)
今井 英幸 北海道大学, 大学院・情報科学研究科, 助教授 (10213216)
外山 淳 北海道大学, 大学院・情報科学研究科, 助手 (60197960)
天元 宏 釧路高等専門学校, 情報工学科, 助教授 (80321371)
林 裕樹 釧路高等専門学校, 情報工学科, 助教授 (60342440)
|
研究概要 |
本課題の目的とした「大規模パターン認識系の実現」に対して、交付申請時に挙げた三種類課題に関する成果は以下の通りである。 1.データ数に関する規模の問題:高い識別性能(汎化性能)を達成する問題から、性能を大きく損なわない範囲で計算量を削減する問題へと、問題の設定を移し、データ数に対して少ない計算量で学習する方式を考察した。特に、1)代表的な識別手法の一つである、k最近隣法をより高速に行う手法を開発し、2)データ数に対して線形の時間で構成できるプロトタイプの構成法を検討した(今後、継続検討). 2.特徴数に関する規模の問題:識別性能を維持したまま識別に本質的な特徴のみを残す「特徴選択」手法に着目して各種の提案を行った。これまで提案されているて多くの手法では規模の増大に計算量的に十分対応できない。そこで,本研究では,識別に明らかに不必要な特徴を先に除去することを「識別子に依存しない特徴選択」と位置付け,その方法論を検討した.また,提案手法により検査すべき特徴の個数を予め減らし,その後従来の代表的な方法を適用することで,全体として高速な「識別子を特定した」特徴選択が実現できることを示した.基本的な方法論として二通り、加えて、選ぶべき特徴数の選択に関する研究を行った。 3.クラスの数の多い場合の検討(クラス数に関する規模の問題):漢字認識のようにカテゴリ数が非常に多い場合,識別の困難さが増すことは明らかである.本研究では、新しい視点として,識別の困難なカテゴリのグループを(スーパークラスとして)まとめることで,より高性能な識別ができること、さらに、各スーパークラスを視覚化することで,困難さの所在を明らかできることを示した。また、実際の効果を類似漢字識別問題において示した.さらに、これまで検討してきたサブクラスを考慮に入れることで、与えられた分類問題の本質的を総合的に捉えられることを示した。
|