研究課題/領域番号 |
17K12650
|
研究機関 | 広島大学 |
研究代表者 |
伊森 晋平 広島大学, 理学研究科, 助教 (80747345)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 統計的モデリング / 数理統計学 |
研究実績の概要 |
本研究では,興味の対象である主要変数に加えて,主要変数と関連の深い副次的な情報(補助変数)が訓練データとして得られている状況を考える.テストデータとして補助変数が観測されない場合,入力情報として補助変数を利用したモデルはテストデータに直接活用することはできない.したがって訓練データにおいて観測された補助変数をテストデータにおける主要変数のモデリングに活用する方法の開発は重要である.一方で補助変数の活用は常に主要変数のモデリング性能を向上させるとは限らず,目的に応じて補助変数を適切に選択することが肝要である. 本年度の研究内容は以下の通りである.本研究の主眼である補助変数の活用は一般的な統計的モデリングの枠組みで考えることができるが,具体的なモデルでの活用例を考えることによって,一見無関連に思える先行研究を本研究と関連づけることが可能となった.これにより,本研究内容を適用することが可能な範囲をより明確にすることができた.また,クラスタリングなどに利用される混合正規分布において,未知パラメータの推定に対する補助変数の活用と有効な補助変数のスクリーニング法に関して研究を行なった.さらに,本研究内容と関連の深い,訓練データとテストデータにおける共変量の分布の差異に着目する共変量シフトにおいて,補助変数の活用とそのモデルの良さを測るための情報量規準の導出を行なった.これらの研究内容は,国内学会・国際会議などで発表している.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究では,主要変数のモデリング精度を向上させるために補助変数を活用することに着目し,その有効な活用方法を新たに開発することを目的としている. 教師あり学習に焦点を当てるとしていた当初の予定とは少々異なるものの,現在までに,混合正規分布における補助変数を活用したパラメータの推定方法や変数の数が多い場合の有効な補助変数のスクリーニング方法に関して研究成果を得ている.また共変量シフト下での補助変数の活用や候補の中から有用な補助変数を選択する手法に関して新たな成果を得ており,これらの内容は国内学会・国際会議などで発表されている. しかしながら,これらの成果をはじめ,研究の基盤となる補助変数を選択するための情報量規準に関する研究成果に関しても,論文の執筆や国際雑誌への投稿が完了していない.また,当初の研究計画では,初年度のうちに実データ解析への応用まで行う予定であったがこちらも遅れており,「やや遅れている」という評価とした.
|
今後の研究の推進方策 |
現在までの進捗状況を踏まえて,これまでに得られた研究成果の論文化および手法の拡張・発展に尽力しつつ,新たな研究成果を獲得するために以下の通り進めていく. まず,訓練データとテストデータでデータ環境が異なるという意味で,本研究における補助変数の活用と親和性の高い共変量シフトに関してこれまでに得られた成果を基に,より共変量の数が多い,高次元データの設定に耐えうる手法の開発に取り組む.また,手法のスパース化やロバスト化に関しても,線形回帰モデルのような扱いやすい枠組みで問題を考えることで研究目的の達成を試みる.さらに,開発手法の漸近的性質を導出することで,実用上の性能保証を理論的に与える.一方で,応用研究を本格的に進めるために,ハイスペックPCを購入し,開発手法をFlickrなどの大規模な画像データへの活用を図る.これらの研究成果を国内学会・国際学会などで研究発表することで,研究成果の周知に取り組む.
|
次年度使用額が生じた理由 |
研究進捗状況からPCの購入を見送ったため当該助成金が生じた.これは次年度の使用計画に加え,PC購入に用いる.
|