研究課題/領域番号 |
18K18010
|
研究機関 | 名古屋工業大学 |
研究代表者 |
梅津 佑太 名古屋工業大学, 工学(系)研究科(研究院), 助教 (60793049)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | モデル選択 / 仮説検定 / selective inference / 逆強化学習 / パターンマイニング |
研究実績の概要 |
変数選択問題や変化点検出問題をはじめ, データから探索的に選択されたモデルに対する推論は選択後の推論の問題と考えられる. 特に, 選択後の推論では, モデル選択によるバイアスを考慮したデータ解析手法の確立が重要であり, 近年のデータ解析におけるホットトピックの一つである. 本年度は, 研究の第一段階として, 選択後の推論のうち, 特にselective inferenceと呼ばれるフレームワークを利用した能動学習法の研究を行った. 具体的には, スパース推定で代表的なLassoによって選択された線形回帰モデルの平均2乗誤差をある意味で最小にするようなサンプリングを行うA-最適性を提案した. ただし, 実際には, データから探索的にモデルが選択されているため, 通常の方法ではA-最適性を評価することができない. そこで, selective inferenceのアイデアを利用し, 特定のモデルが選ばれたという条件のもとでの平均2乗誤差を適切に評価することで, 新たな能動学習法を開発し, その基準を選択的A-最適性と呼んだ. 古典的なA-最適性を用いた能動学習法と比べて, 選択的A-最適性によるサンプリングを行うことで, 実験的に良いサンプリングが行えることを確認した. また, 生物の移動軌跡を対象としたデータ解析において, 逆強化学習による移動軌跡の補完や, パターンマイニングを用いた行動パターンの解析にも着手した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度は, データの正規性に基づく, 非常にシンプルなモデルに対してselective inferenceのフレームワークを用いることで, 効率的にデータをサンプリングできることが確認できた. また, selective inferenceのフレームワークで議論できるような, 多くの探索的データ解析の手法は, 正規性の下で非常にシンプルな理論を展開できることが知られている. そもそも, 正規性の下ですら手法を展開できないようであれば, その後の拡張, 一般化や今後の研究は遂行できないため, この意味で, おおむね順調に進展していると考える.
|
今後の研究の推進方策 |
実際にデータ解析を行う場合, データの正規性が満たされない場合が多く, そのため, モデルの拡張や正規性の緩和は, 応用上非常に重要な問題であると考えられる. ところが, これまでのselective inferenceのフレームワークは, データの正規性が本質的な役割をになっており, この仮定が崩れるとexactな推論は行えなくなってしまう. そこで, 今後はまず, 統計的漸近理論を用いて, 正規性を緩和しつつ, 妥当な推論が行える手法を開発する. 具体的には, 一般化線形モデルのフレームワークで, モデル選択後の回帰係数の検定や信頼区間を構成する手法を開発する.
|
次年度使用額が生じた理由 |
手法の完成を優先し, 大規模な数値実験を行うための高性能な計算機の購入と, 海外での国際会議への参加を控えたことによる. 当該年度に開発した手法に対する議論を求めた国内外での成果発表を予定している(国外旅費: 800千円, 国内旅費: 300千円). また, 手法の有用性を確かめる大規模な数値実験を行うため, 最新のパーソナルコンピュータを購入する予定である(330千円). それ以外では, 書籍や謝金, 国内のワークショップで会場借料などで使用することを計画している(書籍: 160千円, 謝金: 60千円, 会場借料等: 150千円).
|