研究課題/領域番号 |
15K16064
|
研究機関 | 神戸大学 |
研究代表者 |
北園 淳 神戸大学, 工学研究科, 工学研究科研究員 (00733677)
|
研究期間 (年度) |
2015-04-01 – 2019-03-31
|
キーワード | 変数選択 / 安定性 / 可視化 / クラスタリング |
研究実績の概要 |
多くの変数から成る高次元データから,有用な少数の変数を取り出す手法は変数選択と呼ばれる.この変数選択において,データサンプルが少し変わるだけで選択される変数が大きくばらつき,最終的に何が有用な変数なのか分からない場合が多くある.これは,変数選択の不安定性の問題と呼ばれる.本研究課題では,この問題に取り組み,ばらついた結果の中から,真に有用な変数を取り出す枠組みを構築することを目的としている.また,有用な変数の組が複数存在する場合を考慮することで,従来は見過ごされてしまう可能性のあった有用な変数の発見を可能にすることも目的としている.提案する枠組みが完成することにより,より高い精度での遺伝子診断(病気リスク診断など)を行うことが可能になると期待される. 本年度は,昨年度中に取り組んだ,変数同士および変数とサンプルとの関連性を可視化・分析するための手法について,より詳細な検討と拡張を行った.具体的には,従来可視化に用いられていた次元圧縮手法にもとづき,新たなクラスタリング手法を開発した.これにより,局所的な構造にもとづき(埋め込まれた多様体構造に沿って),選択された変数の組同士の類似度,および,どのサンプルの識別にどの変数が有効かといった関係性を,可視化のみならず,グループ分けという形で,明らかにすることが出来ると期待される.また,引き続き,変数同士の関係性を解析するための低次のモデルについて,検討を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度は,選択された変数間の関係性の解析に用いることが出来る,クラスタリング手法の開発を行った.また従来想定していなかった方向性への発展も期待されている.
|
今後の研究の推進方策 |
引き続き,可視化・クラスタリングを用いた検討,低次のモデルを用いた検討を行う.また,情報理論の観点を取り入れた解析を行う.
|
次年度使用額が生じた理由 |
計算機・ソフトウェア等を購入予定だったが,他のものを一時的に使用できたため.次年度は,それらの物品購入費や,出張費用に充てる予定である.
|