2007 Fiscal Year Annual Research Report
アンサンブル学習による新たなアルゴリズムと情報論的解析による洗練,及びその応用
Project/Area Number |
19700264
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
竹之内 高志 Nara Institute of Science and Technology, 情報科学研究科, 特任助教 (50403340)
|
Keywords | ブースティング / 多値判別 / 誤り訂正符号 / 局所化尤度 / ロバスト |
Research Abstract |
本研究では近年注目を集めている2種類のアンサンブル学習,ブースティングとECOCに基づぐ多値判別に関する研究を行っている.ブースティングに関しては統計的考察に基づく最もロバストなロス関数の考案とミスラベルを考慮した多値判別アルゴリズムを提案し,アルゴリズムの収束性などに関する考察を行つた.パターン識別問題においては例題に外れ値などが含まれることが多く,このような状況に対してロバストなアルゴリズムは有効に働く.また既存のブースティングアルゴリズム・アダブーストを改良しバイオインフォマティックスに応用した.遺伝子発現データからの疾病状態の判別を目的としているが,データは非常にノイジーであると同時に,ラベル判別に対して同じような働きをする遺伝子が多数存在するため,従来のブースティングアルゴリズムは汎化性能の意味で有効に働かなかった.これに問題に対して,同様の働きをする複数の遺伝子があるというグループ構造の先見知識を積極的に組み込んで利用するアルゴリズムを考案し,これにより高精度でロバストな判別機の構成と関連遺伝子の探索を実現した.ECOCに基づく多値判別問題に関しては,確率モデルを用いて複数の2値判別器を組み合わせて多値判別機(デコーダー)を構成するための枠組みを提案した.提案した方法では確率モデルに基づいてデータ適応的にデコーダーを構成するごとができ,また従来の正則化,変数選択の手法を適用することができる.提案手法をバイオインフォマティックスデータに適用して有効性を示している.また提案手法にカーネル関数を導入することで局所化デコーダーを提案し,更に精度を高めることができた。
|
Research Products
(15 results)