2018 Fiscal Year Research-status Report
Project/Area Number |
18K06152
|
Research Institution | Osaka University |
Principal Investigator |
小林 直宏 大阪大学, 蛋白質研究所, 特任准教授(常勤) (80272160)
|
Co-Investigator(Kenkyū-buntansha) |
児嶋 長次郎 横浜国立大学, 大学院工学研究院, 教授 (50333563)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | NMR / 深層学習 / 人工知能 / 自動解析 |
Outline of Annual Research Achievements |
核磁気共鳴法 (NMR) は生体高分子などに対して原子分解能レベルで立体構造、動的状態、薬剤相互作用など多様な情報を得る事ができる分光学上特異な存在であると言える。この10年までにX線結晶解析、クライオ電子顕微鏡などの構造解析技術が大規模に自動化されている一方でNMR解析は現在もなお経験論や手動解析に依存した部分が多い。申請者は高い自動化性能を求める目的で深層学習の技術を取り入れる世界初の試みに成功し、平成31年度においてはこれらの技術的基盤をさらに発展させ、NMR研究の経験が無い初学者も高速かつ高精度に解析を達成し、創薬研究に取り組めるシステムとして公開することを目的とした。NMR解析では安定同位体ラベル化されたタンパク質を用いる場合、多数の多次元スペクトルより得るべきNMRシグナル数は例えば76残基のタンパク質ですら4,000個近い真のピークを検出する必要がある。これは簡便な自動ピーク検出法で得ようとするならば多数のノイズを含む20,000個以上のシグナルを検出してしまう。研究代表者は世界に先駆けて深層学習によるノイズ・シグナル判別機能を実装した解析ツールを公開し、国際誌への掲載に成功した。入力として2次元あるいは3次元スペクトルから検出されたピーク位置近傍のデータをグレースケール化し、畳込みニューラルネットに入力させ、期待されるピーク数と強度分布による統計的情報を最終段のニューラルネットへ入力し、ノイズであるか否かを総合判定する。この機能は単純なピーク強度の統計分布のみならず、シグナル近傍の状態を視覚的にAIが経験したイメージに基づいた判別が行われており、人間の直感に近い処理が実行されている点が特色である。このシステムを使ってFLYA, CYANA, TALOS+を連携させ、通常NMR専門の研究者が数週間かかる解析をわずか数時間で完了可能となった。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
研究代表者により開発されたシステムはMagROと呼ばれる統合型NMRデータ解析システムに実装され、深層学習機能はその洗練されたGUIとともに極シンプルかつ高機能な解析性能を実現した。投稿された論文は一流国際誌であるBioinformaticsに掲載され、世界初の人工知能型解析システムとしての地位を獲得した。その一方で解析結果を客観評価するシステムとしてNMR信号にのシュミレーション機能を人工知能の一種である有限オートマトン・グラフ理論により実装し、残余双極子実験(RDC)の解析支援を行う機能を実装させる事にも成功した。これらの客観評価機能によって従来手動解析あるいは自動解析においても解析の進行状況や完成度を判断する事が容易になり、結果として解析プロジェクト自体の終了判定できるようになった事は重要な成果である。これらのプロトコールをまとめた論文は国際誌への投稿準備中である。 また平成31年度における共同研究者との連携により既に8個以上の新規フォールドタンパク質を研究代表者のみによる解析で実施され、これらの結果は国際誌への投稿準備中である。新規フォールドのタンパク質解析は従来ハイリスクである一方、タンパク質科学において極めて重要であり、それらが極短期間で高精度に決定できる性能を得た事は特筆に価する。
|
Strategy for Future Research Activity |
今後は更なる自動化の補助機能として信号の重なり判定を深層学習で実現する性能を実装する予定である。NMR解析においては近接した2~3つの信号ですら数理科学的に解析する事は困難であるが研究代表者は10層および12層よりなる畳み込みニューラルネットワークによって人間の直感に近い信号分離性を実現するツールの開発に成功している。これを現在の解析システムへ組み込むことによってより効率的に自動解析できるシステムへと拡張していく。またタンパク質、RNA、DNAばかりではなく他の有機化合物分子も解析対象とできるようなライブラリ拡張を行い、創薬科学研究への応用の窓口を広げていく。現在のシステムではNMR信号帰属の問題解決性能が充分ではないため有限オートマトン・グラフ理論を応用した信号シミュレーション技術を発展させて信号帰属の自動化・効率化を図り、難度の高い解析サンプルデータとして固体NMRデータ群を対象としたシステムの最適化を行っていく。自動帰属・解析のスループットは大規模に改善される事が予想されるため平成32年度においても外部のユーザーとの連携により複数のサンプルデータの解析を行い、構造生物学への貢献を続けていく。
|
Remarks |
MagRO, Filt_Robotを始めとする深層学習を利用した人工知能型NMR解析ツール群の紹介、およびダウンロードページ。デモデータ、説明ファイルなど初心者でも解析に取り組めるような配慮がなされている
|
Research Products
(4 results)