2016 Fiscal Year Annual Research Report
Initiative for faster and more precise NMR data measurement and analysis with sparse modeling
Project Area | Initiative for High-Dimensional Data-Driven Science through Deepening of Sparse Modeling |
Project/Area Number |
25120003
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
木川 隆則 国立研究開発法人理化学研究所, 生命システム研究センター, チームリーダー (20270598)
|
Co-Investigator(Kenkyū-buntansha) |
池谷 鉄兵 首都大学東京, 理工学研究科, 助教 (30457840)
|
Project Period (FY) |
2013-06-28 – 2018-03-31
|
Keywords | スパースモデリング / NMR / 圧縮センシング / スペクトル解析 / ベイズ統計 / レプリカ交換モンテカルロ法 |
Outline of Annual Research Achievements |
核磁気共鳴法(NMR)は,非侵襲的に分子構造動態を探る最も強力で汎用性の高い計測手法の一つである.近年の装置技術の著しい進展により,タンパク質等の複雑な生命分子の計測が可能となったが,計測データ量が多く計測時間が長く,得られるスペクトルは複雑でデータ解析は煩雑である.さらに解析データ数の増大により,立体構造を得るための計算も煩雑で時間を要し,広域な構造空間の探索が困難で局所解へトラップされ最適解の導出が困難となっていることが問題となっていた.本研究では,NMRデータや生命分子の構造情報が有するスパース性に着目して,スパースモデリング(SpM)の導入により解析の複雑さ・煩雑さに起因する上記の問題を解決することにより,特に複雑な生命分子系を対象にした計測やデータ解析の高速高精度化の実現し、当該分野の飛躍的発展を目指している.平成28年度においては,以下の四課題に関して研究を進めた. 【課題1】NMR計測の高速・高精度化においては,スパースに計測した信号を再構成するアルゴリズムのうち,圧縮センシングを用いる方法に関して,ハイパーパラメータの設定方法に関する検討をおこない,データ品質との相関関係に関して考察した. 【課題2】データ解析の高速・高精度化においては,ベイジアンスペクトル分解の手法に関して,アミノ酸配列と標識パターンを事前知識として活用することで探索空間を制限し,観測されたスペクトルをもっともよく説明するモデルを選択するアルゴリズムを構築することにより,多数のシグナルが重複するスペクトルにおける分離を可能とした. 【課題3】立体構造計算の高速・高精度化においては,複数のタンパク質に関して生きた真核細胞内での立体構造を決定することに成功した. 【課題4】NMR計測・解析・立体構造計算を一体化した手法の開発,においては,符号化標識法にテンソルの概念を導入した新たな手法を構築した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
【課題1】NMR計測の高速・高精度化において,スパースに計測した信号からスペクトルを再構成する手法は,複雑な生命分子系を対象にしたNMR計測において特に有効である.この再構成アルゴリズムのうち圧縮センシングを用いた方法について,ハイパーパラメータ設定が再構成スペクトルの品質に与える影響を調べた.また,データ品質との相関関係に関しても調べた結果,特にデータ品質が低い場合において,高品質スペクトルを再構成するためにハイパーパラメータの適切な設定が重要であることがわかった. 【課題2】データ解析の高速・高精度化においては,ベイジアンスペクトル分解の手法の検討を引き続き進めた.アミノ酸配列と標識パターンを事前知識として活用することで探索空間を制限し,観測されたスペクトルをもっともよく説明するモデルを選択するアルゴリズムを構築した結果,多数のシグナルが重複するスペクトルにおける分離が可能となった. 【課題3】立体構造計算の高速・高精度化は,in-cell NMRデータに開発した新規アルゴリズムを適用することにより,複数のタンパク質に関して生きた真核細胞内での立体構造を決定することに成功した. 【課題4】NMR計測・解析・立体構造計算を一体化した手法の開発,においては,符号化標識法にテンソルの概念を導入した新たな手法を構築した.この手法により,従来は順次実施していたNMR計測データからのスペクトル取得と,その解析による構造特性データの取得を,同時に実施することが可能であることを示した.
|
Strategy for Future Research Activity |
【課題1】NMR計測の高速・高精度化においては,ハイパーパラメータの適切な設定に関して,より複雑な多次元スペクトルへの適用検討と性能評価を進めていく.大自由度班と連携して進める. 【課題2】データ解析の高速・高精度化においては,ベイジアンスペクトル分解の手法に関して,新規アルゴリズムをスペクトル品質が著しく劣るin-cell NMRデータに適用し,性能評価を進める. 【課題3】立体構造計算の高速・高精度化は,常磁性効果による長距離情報も活用できるようにアルゴリズムの拡張を進めていく. 【課題4】NMR計測・解析・立体構造計算を一体化した手法の開発,に関しては,新規開発手法の性能評価を進める.計測モデリング班と連携して進める. 【課題1】,【課題2】,【課題3】,【課題4】を推進することにより,スパースモデリングの導入によりNMR解析の複雑さ・煩雑さに起因する問題を解決して,生命分子のNMR計測やデータ解析の高速・高精度化を実現する.
|