2016 Fiscal Year Annual Research Report
Establishing statistical inference theory for differential equations using sparse modeling techniques
Publicly Offered Research
Project Area | Initiative for High-Dimensional Data-Driven Science through Deepening of Sparse Modeling |
Project/Area Number |
16H01532
|
Research Institution | The University of Tokyo |
Principal Investigator |
木立 尚孝 東京大学, 大学院新領域創成科学研究科, 准教授 (80415778)
|
Project Period (FY) |
2016-04-01 – 2018-03-31
|
Keywords | 微分方程式 / 仮説駆動型研究 / データサイエンス / 機械学習 / 集団遺伝学 |
Outline of Annual Research Achievements |
本研究の主目的は、観測データが従う微分方程式を自動的に導出する、統計的推定論の開発を行うことである。これにより従来微分方程式を用いて解析されてきた自然現象の研究に対して、自然にデータ駆動型の研究が行えるようになることが期待される。今年度は、人工進化の元で計測された集団ゲノムデータから、各一塩基多型に働く進化選択圧とドミナンスを推定する手法の開発と実装に成功した。アルゴリズムとしては集団遺伝学の基本モデルのライトフィッシャーモデルに対し期待値最大化法を適用してパラメータの点推定を行うとともに、尤度関数の最適パラメータ周辺での曲率を計算し、推定値の信頼区間を計算できるようなものとした。計算機実験を行ったところ、この信頼区間を活用することにより、従来のソフトウェアよりも信頼性の高い推定値を計算できることがわかった。次に寒暖差の大きい環境で人工進化させたショウジョウバエのゲノムのPool-seqデータを用いて各一塩基多型に働く選択圧を計算したところ、3R染色体の中央に強い選択圧が働いている可能性が示唆された。これは、この領域に巨大なインバージョンをもつ部分集団が気候変化に敏感だという過去の報告とコンシステントであった。しかもその選択圧の強度は毎世代7%、インバージョンをもつハエが取り除かれるほど強いものであることが示された。この結果は、英語論文として国際誌Bioinformaticsに投稿し現在リバイスを行っている所である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
一変数確率微分方程式のパラメータ推定に関しては、基本的には完成したと考えている。また、線形微分方程式の範囲内では多変数微分方程式の推定論も確立することができた。ただし、現時点で論文化されたのはまだ数少ない。一変数の微分方程式については、ライト・フィッシャーモデルにしか適用していない。多変数線形微分方程式については一細胞シーケンシングにしか適用していない。開発した方法論は高い一般性をもつことを示すにはより多くの問題に適用していく必要があると思われる。
|
Strategy for Future Research Activity |
一変数非線形確率微分方程式の推定では、より多くの非線形相互作用項を方程式に加えて現象の説明に必要な項のみが、機械学習によって選ばれてくることを示す必要がある。多変数線形確率微分方程式のアルゴリズムは、各変数を、空間離散化を施した、空間点ごとの場の自由度とみなすことで、線形確率偏微分方程式のパラメータ推定に応用することができる。この拡張は応用が広いため、早急に実装し論文化を行う必要があると考えている。
|