研究課題/領域番号 |
25420438
|
研究種目 |
基盤研究(C)
|
研究機関 | 神戸大学 |
研究代表者 |
阿部 重夫 神戸大学, 工学(系)研究科(研究院), 名誉教授 (50294195)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | パターン認識 / 特徴選択 / ブロック追加 / ブロック削除 / サポートベクトルマシン |
研究概要 |
特徴量数が膨大で,サンプルデータ数がわずかな大次元小サンプルパターン認識問題で,パターン認識器の入力変数(特徴量)を汎化能力が低下しない範囲で最小化する特徴選択方式の開発を進めた。 これまでに開発していたブロック追加・削除 (BABD) 方式では,従来の逐次選択方式に対して,交差検定による認識率が低下しない範囲で高速に特徴選択ができる。しかしながら,特徴量が膨大でかつサンプル数が少ない場合は,汎化能力が低下し,また特徴選択時間も長くなる問題があった。この問題を解決すべく研究を進め,本年度において以下の研究成果を得た。 (1) BABDを繰り返して適用する,繰り返しBABD法を開発した。BABDでは局所最適解,すなわち特徴量が多い解が得られる可能性がある。これを解決するために,BABDを繰り返し適用する方式を開発した。この方式により,汎化能力は同程度で,特徴量数の少ない解を求めることができる。いくつかのマイクロアレイデータで方式評価を行い,有効性を検証した。 (2) 追加BABDにより,特徴選択を高速化する方式の検討を進めている。全体の教師データに対して,BABDを繰り返す代わりに,特徴量の数をBABDが終了するごとに追加する。これにより,繰り返しの数は増えるが,BABDの処理単位が小さくなるために,追加する単位を調整することにより,高速化が可能になる。関数近似における変数選択に適用し,3000変数で2~14倍,7000変数で2~40倍の高速化が得られた。今後,パターン認識に対する追加BABD方式の開発を進める。 (3) BABDで用いているパターン認識用サポートベクトルマシン(SVM)の学習の高速化の検討を進めている。SVMの学習を2つ以上の教師データで最適化する方法の特性解析を行い,教師データ数と目的関数の上昇の関係を明らかにした。今後,これに基づいて高速化の検討を行う。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究計画時には教師データを分割して汎化能力を向上することを考えていたが,この方式を評価したところ,データ依存性があり,必ずしも汎化能力が向上するとは限らないことが分かった。その後,研究計画段階ではなかった繰り返しBABD法,追加BABD法の着想を得た。特に追加BABD法は関数近似の入力変数選択の評価で,汎化能力が低下せず,高速選択が可能であることが確かめられている。 SVMの学習の高速化に関しても,教師データの同時処理数と解の改善の関係を明らかにしたことにより,高速化方式の検討の道筋が得られた。 マハラノビス距離の学習により特徴選択する方式を高速化する検討はまだ着手できていないが,このまま研究を進めてゆけば,研究当初の目標を達成できると考える。
|
今後の研究の推進方策 |
今後以下の方針で研究を進める。 (1) 追加BABD法の開発。関数近似に対する追加BABD法をパターン認識に拡張して,従来のBABD法と同等以上の汎化能力で,特徴選択を高速化する方式を開発する。 (2) 複数教師データの同時処理によりSVMの学習を高速化する方式を開発する。最適化すべき教師データを選択する方式を開発することにより,従来方式より高速なSVMの学習方式を開発する。 (3) マハラノビス距離の学習により特徴選択する方式の高速化の検討を進める。この方式と追加BABD方式との比較をベンチマークデータを用いて行う。
|