研究課題/領域番号 |
18K11463
|
研究機関 | 東京工業大学 |
研究代表者 |
小渕 智之 東京工業大学, 情報理工学院, 助教 (40588448)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | 情報統計力学 / スパースモデリング / 統計的逆問題 / 機械学習 |
研究実績の概要 |
本研究は、スパースモデリング(SpM)と情報統計力学の技術を拡張することで,変数選択・パラメータ推定問題の、より深い数理的理解と実用的数値解法を得ること,および,開発手法を生命・経済などの実データ解析へ応用し,それが使える枠組みであることを実証することが目標である. 本年度はまず,スパース線形回帰に対するモンテカルロ法を用いた変数選択アルゴリズムの考案・改良・開発と,その性能を評価するための理論解析を完了した.性能評価の理論解析についてはすでに論文が出版されており,アルゴリズム開発・数値実験の論文も現在執筆中である.SpMのアルゴリズムは多くが緩和もしくはアドホックな近似に頼っているが,本手法はそれらによらない方法である.計算量をどのくらいかけるかで,荒いが早い近似計算から数値的厳密な計算までをカバーする方法論であり,スパース線形回帰をきちんと解くための標準的方法として位置づけられると考えている. 次に,二値変数間の関係性(ネットワーク)を抽出する手法を開発した.利用した枠組みはボルツマンマシンと呼ばれる機械学習の標準的モデルである.我々の寄与は,データをボルツマンマシンの形式に載せるためのデータの「前処理法」と,抽出された関係のうち信頼のおけるものとそうでないものを峻別する「後処理法」の開発にある.これらは情報理論・計算統計学に基づいた系統的かつ客観的手法である.正解ネットワークが存在する状況下での数値実験を行うことで,これらの手法が正解ネットワークを復元することに強力に寄与することを示し,さらに実際の生物のデータにおいても合理的なネットワークを抽出することを示した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
上で述べた1つ目の成果であるスパース線形回帰のモンテカルロ法に基づくアルゴリズムは,申請書類に記載した「課題1」に対応しており,これについてはすでに完了したと考えている.また2つ目のネットワークの推定については,残りの課題である「課題2・3」の一部に対応し,それらについても一定の成果が得られていると考える. ここから当初計画のうち3割以上をすでに達成したと考えており,研究期間がまだ3/4残っていることを考えると,おおむね順調、もしくはそれ以上に進展していると考えるのが妥当である.
|
今後の研究の推進方策 |
上で述べたネットワークの推定に関する研究を進めるうちに,この課題に関する需要が極めて高いことに気がついた.そこでもともとの申請ではガウス型のモデルを主に取り扱う,と課題2で述べていたが,ガウス型に限らずより一般の非線形性を持ったモデルを積極的に取り扱うよう研究方向性を拡張修正する. 課題3については,経済でよく使われる動的モデリングのモデルであるベクトル自己回帰モデルに関する技術調査・論点整理を昨年度行った.本年度ではその結果を元に,動的モデリングによる関係性の抽出に本格的に取り組んでいく.ベクトル自己回帰モデルはあくまで線形のモデルだが,非線形性の高いモデルにおいても平均場近似を用いることでアクセス可能である.この点を追求する予定である.
|