2015 Fiscal Year Research-status Report
変数選択結果の対数線形モデルを用いた再解析による安定性向上と多重変数集合の抽出
Project/Area Number |
15K16064
|
Research Institution | Kobe University |
Principal Investigator |
北園 淳 神戸大学, 工学研究科, 助教 (00733677)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 変数選択 / 安定性 / Minimum Probability Flow |
Outline of Annual Research Achievements |
多くの変数から成る高次元データから,有用な少数の変数を取り出す手法は変数選択と呼ばれる.この変数選択において,データサンプルが少し変わるだけで選択される変数が大きくばらつき,結局何が有用な変数なのかわからないという,変数選択の安定性の問題が存在する.本研究ではこの問題に取り組み,ばらついた結果の中から,真に有用な変数を取り出す枠組みを構築することを目的としている.また,有用な変数の組が多重に存在する場合を考慮することによって,従来見過ごされてきた有用な変数の発見も行う.提案手法により例えば,変数選択の主な適用先の一つである遺伝子解析では,より確度の高い病気リスク診断を提供することが可能となる. 本年度はまず,変数選択の安定性の問題についてより議論を深めるため,網羅的に変数の組合せを評価する手法を提案し,変数選択が不安定な場合には最適な変数を選び出せないことを改めて示した.また本研究では,対数線形モデル(もしくは一般化線形モデル)を用いた推定を行うが,その推定を高速に行うために重要となるMinimum Probability Flow (MPF)法について,その性能の検証を行った.MPF法のテストベッドとして,MPF法を適用することが比較的容易な次元圧縮法の一つであるt分布型確率的近傍埋め込み法を用い,MPF法によって,実際に高速に推定が可能となることを確認した.また,MPF法の利点・欠点も精査した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は,変数選択の安定性の問題についてより議論を深め,網羅的に変数の組合せを評価する手法を提案し,変数選択が不安定な場合には最適な変数を選び出せないことを改めて示すことに成功した.また本研究では対数線形モデル(もしくは一般化線形モデル)を用いた推定を行うが,その推定を高速に行うために重要となるMinimum Probability Flow (MPF)法について,その性能の検証を行い,有効性を確認することに成功した.以上より,おおむね順調に進展しているといえる.
|
Strategy for Future Research Activity |
対数線形モデルにおいて,多数の変数の相関関係を考慮した高次のモデルを用いると推定が困難な場合があると考えられる.そこでまず,少数の変数間にのみ相関関係のある人工データに対して低次のモデルを用いることで,枠組みの検証を行う予定である.
|
Causes of Carryover |
ノートパソコンを購入予定だったが,従来より使用していたものが引き続き使用できたため,購入を次年度初めとした.また旅費については,招待講演等により支出の必要がなかったため,次年度により精力的な成果発表・情報収集を行うべく,繰り越しした.
|
Expenditure Plan for Carryover Budget |
昨年度に購入を見送ったノートパソコンを年度初めに購入する.また,精力的な成果発表・情報収集を行い昨年度未使用分の旅費を使用する.
|