研究実績の概要 |
予測とは,現在の観測量をもとに予測したい量(予測量)の振る舞いを推測することである.地震予測,交通予測,遺伝子機能予測等,様々な予測が社会で活用されている.統計的な予測手法には,予測量の平均を推定する点予測と予測量の従う分布を推定する分布予測がある.予測量の従う分布が分かれば,検定や予測区間の構成ができるため,分布予測がより重要である.分布予測は点予測を包含する.しかし,点予測手法を用いて分布予測を行うと,予測量の分散が過少に評価されるため,精度が悪い.そこで,本研究では分布予測を扱った. 予測に関して,統計学と機械学習では転移学習が近年注目されている.転移学習とは,ある領域での観測量を利用して別の領域にある予測量を予測することである.より詳しくいうと,転移学習は観測量と予測量の分布が異なる状況での予測である.転移学習における既存の分布予測手法は, 問題点 a) 理論的な予測精度は良いが計算コストが大きい, 問題点 b) 冒頭のゲノムワイド回帰のような高次元モデルで予測精度が劣化する, といった欠点をもち,実用化に至っていなかった.そこで,本研究では計算コストを削減しつつ高次元モデルでも高い精度をもつ分布予測手法の構築を目指した. 具体的に以下のような研究を行った.A)擬似ベイズ法に着目したベイズ法における計算コストの削減, B)高次元カウントデータのもつ疎性に着目した分布予測手法の構築. 研究Aでは, 簡便な尤度を利用するベイズ法である擬似ベイズ法に着目し,その事後分布の高次元状況下での性質を調べた. 分布予測では現在はベイズ的な方法が主流であるが,擬似ベイズ法を利用することで「計算コストを抑えつつ性能を劣化させない」分布予測が行えることが本研究により明らかになった.研究Bでは,データのもつ疎性に着目することで,高次元状況下で高い精度をもつ分布予測手法の構築を行った.
|