研究課題/領域番号 |
16K16024
|
研究機関 | 大阪大学 |
研究代表者 |
寺田 吉壱 大阪大学, 基礎工学研究科, 助教 (10738793)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 教師なし学習 / 選択的推測 / 漸近理論 |
研究実績の概要 |
近年の計算機や計測技術の発展により,データが大規模で複雑になってきている.これらのデータから有用な情報や仮説を得るためには,教師なし学習に代表される探索的データ解析が有用であり,その重要性が再認識されている.そして,教師なし学習によって得られた仮説に対して従来の統計的推測を行うことが事が多い.しかし,仮説の選択がデータに依存していることを無視して従来の方法を適用することは不適切である.そこで,様々な分野で観測される背後にランダムな関数構造が仮定されるような複雑なデータ(関数データ)に対する教師なし学習法の開発とその理論的性質の解明に加えて,教師なし学習に関連した統計的推測の基盤技術の開発とその理論的性質の解明を行った. 具体的には,本年度は以下の2点の基礎研究を行った. (i) 関数データ解析の権威であるJeng-Min Chiou教授 (Academia Sinica)と,関数データの高次元性に着目して,既存の関数データに対するクラスタリング法では背後の構造を捉えることのできないデータに対しても上手く分類を行うことの出来る関数データに対する新しい教師なし判別法の開発を行った. (ii) 階層的クラスタリング法における各クラスタに関する検定 (pvclust; Suzuki and Shimodaira, 2006) では,予め仮説を用意するのではなく,データから得られたクラスタに対して検定を行うことが多い.このような場合は,近年注目されている選択的推測 (selective inference)を行う必要があるが,仮説領域や選択領域が複雑であり既存の方法は適用することができなかった.そこで,マルチスケール・ブートストラップを用いて,一般的な状況でも適用可能な選択的推測の方法を提案し,その理論的性質を明らかにした.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
既存研究では教師なし学習の枠組みにおいて視覚的にwell-separatedな状況以外に良い分類精度を得ることは難しかったが,提案手法では関数データの高次元性を利用することでこのような場合にもデータの背後にあるクラスタ構造の検出と精度の良い分類を可能としている.これは,当初の研究目標であった「高次元データのように関数データも教師なし学習であるクラスタリング法において完璧なクラスタリングが達成できるだろうか?」という問を解明するための足がかりとなっている.また,マルチスケール・ブートストラップを用いた選択的推測に関する研究では,仮説領域や選択領域が滑らかな場合と滑らかでない場合のいずれの状況に対しても提案手法の理論的保証を与えており,pvclustのように実データ解析において重要な問題に対しても広く応用可能な方法となっている.これらの観点から,概ね順調に進展していると評価した.
|
今後の研究の推進方策 |
(i)関数データに対する教師なし学習に関する研究では,提案した関数データに対する教師なし判別法に対して,理論的な保証を与えることを試みる.また,(ii)マルチスケール・ブートストラップを用いた選択的推測に関する研究では,提案手法のR packageへの実装やpvclustへの応用についての論文執筆を行う.これらと並行して,これまでの成果の論文執筆やその他の教師なし学習に関連する研究を進める.
|
次年度使用額が生じた理由 |
本年度は,国際共同研究者との打ち合わせのための旅費を滞在先である研究機関から支給して頂くことができたため,差額が生じた.これらの予算は,来年度の旅費に使用する予定である.
|