2007 Fiscal Year Annual Research Report
超高次元データの分類手法の導出とその理論的性質の解明,および実データへの応用の研究
Project/Area Number |
19300096
|
Research Institution | Kyushu University |
Principal Investigator |
西井 龍映 Kyushu University, 大学院・数理学研究院, 教授 (40127684)
|
Co-Investigator(Kenkyū-buntansha) |
小西 貞則 九州大学, 大学院・数理学研究院, 教授 (40090550)
二宮 嘉行 九州大学, 大学院・数理学研究院, 准教授 (50343330)
増田 弘毅 九州大学, 大学院・数理学研究院, 助手 (10380669)
坂田 年男 九州大学, 大学院・芸術工学研究院, 教授 (20117352)
田中 章司郎 島根大学, 総合理工学部, 教授 (00197427)
|
Keywords | pattern recognition / ensemble learning / Markov random fields / machine leaning / AdaBoost / Bagging / spatial boosting |
Research Abstract |
人工衛星や飛行機から地表面を観測したデータから各画素のカテゴリを推測することは、地球環境を知る上での重要な課題である。また遺伝子発現量を計測するマイクロアレイのデータから、特定疾患の特徴を把握することも高次元データの判別問題となる。ここでは、ランダムに生成した2分岐型の関数を基底関数とし、そのなかから指数ロスを小さくしていく弱判別機を結合していくアダブーストを提案した。また過学習を回避するため、教師データをランダムに判別機の生成用と評価用に分割し、判別機を生成・評価し、これを繰り返した判別機の多数決原理を用いて、安定した高性能の判別機を得ることに成功した。提案した手法は、各変数が判別にどの程度貢献するかを数値として評価できるため、変数選択に用いることもできる。実データでは、変数の重要度に応じて基底判別機を生成することにより、判別性能を改良することができた。提案手法はシミュレーションデータや実データでSVM、ANN等の高性能として知られる方法を常に上回る性能を示した。なお画像判別について、Nishii&Eguchi(2005)が提案した統計的学習理論に基づく判別手法 SpatialBoost について考察し、その適応範囲を広めた手法をレビューした。
|
Research Products
(15 results)