研究課題
多くの変数から成る高次元データから,有用な少数の変数を取り出す手法は変数選択と呼ばれる.この変数選択において,データサンプルが少し変わるだけで選択される変数が大きくばらつき,最終的に何が有用な変数なのか分からない場合が多くある.これは,変数選択の不安定性の問題と呼ばれる.本研究課題では,この問題に取り組み,ばらついた結果の中から,真に有用な変数を取り出す枠組みを構築することを目的としている.また,有用な変数の組が複数存在する場合を考慮することで,従来は見過ごされてしまう可能性のあった有用な変数の発見を可能にすることも目的としている.提案する枠組みが完成することにより,より高い精度での遺伝子診断(病気リスク診断など)を行うことが可能になると期待される.本年度は,昨年度中に取り組んだ,Minimum Probability Flowと呼ばれる手法を用いた推定アルゴリズムの高速化に引き続き取り組み,検証を行った.また,変数同士,および変数とサンプルとの関連性を可視化し分析するために,次元圧縮手法を用いた解析を行った.これにより,選ばれた変数の組同士の関係性,および,どのサンプルの識別にどの変数が有効かといった関係性を明らかにすることが出来る.それに併せて,可視化手法の開発も行った.さらに,多数の変数同士の関係性を議論する際に高次の項まで考慮すると推定が困難になる場合があるため,まず低次のモデルを用いることによって枠組みの検討を行った.
2: おおむね順調に進展している
本年度は,推定アルゴリズムの高速化とその有効性の検証を行った.また変数間及び変数とサンプル間の関係性の分析を可視化を用いて行った.また,それに併せて可視化手法の開発を行った.
引き続き,可視化を用いた検討,および,低次のモデルを用いた検討を行う.
昨年度,余分に使用可能な計算機があり,新規の計算機購入を一時的に遅らせたため.
計算機を追加で購入する.また情報収集・成果発表のための海外出張を行う.
すべて 2017 2016 その他
すべて 国際共同研究 (1件) 雑誌論文 (2件) (うち国際共著 1件、 査読あり 2件、 謝辞記載あり 1件) 学会発表 (2件) (うち国際学会 2件)
Proceedings of the 9th International Conference on Machine Learning and Computing
巻: 印刷中 ページ: 印刷中
Doya K., Ikeda K., Lee M., Liu D. (eds) Neural Information Processing. ICONIP 2016. Lecture Notes in Computer Science
巻: 9949 ページ: 119-128
10.1007/978-3-319-46675-0_14