• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実施状況報告書

人工知能を有する自動回折データ収集システムの開発

研究課題

研究課題/領域番号 22K06107
研究機関国立研究開発法人理化学研究所

研究代表者

平田 邦生  国立研究開発法人理化学研究所, 放射光科学研究センター, 専任技師 (20373524)

研究期間 (年度) 2022-04-01 – 2025-03-31
キーワード機械学習 / 結晶学
研究実績の概要

研究の目的はタンパク質結晶の自動測定へ即時フィードバックが可能な回折強度データのクオリティ判定を実施する人工知能の開発である。システムは自動測定により得られた大量のデータを即時解析し、できるだけ早い段階でのデータクオリティの定量的評価を目指している。このため、まず教師あり機械学習を実施し、指標となりうるデータ評価ポイントの選定を実施する予定であった。今年度は、研究実施計画書にある通り、教師ありの機械学習のために、標準試料結晶であるソーマチン、サーモライシン、計画書に無かったがトリプシンの回折データを大量に収集し、データ処理を実施した。結果として、機械学習に進む前段階にデータをフィルタリングすることの有用性に予期せず気づくことができた。具体的には2点ある。1点目は「明らかに低品質なデータの混在」をフィルタリングすることである。より信頼度の高い機械学習のモデルパラメータを得るためには、できるだけ他のアノーマルデータを排除したほうが良い。この観点から実際に得られたデータの中で分解能が著しく低いデータについては早い段階で検討から除外することが望ましい。当初想定していなかったことだが、このフィルタリングの成績も実験へのフィードバックに非常に有用なステップであることが判明した。2点目はより詳細なフィルタリングとなるが、構造多型に関連するものである。タンパク質結晶は同じもののように見えても含まれる分子の構造が微妙に異なる場合があり、それらは多くの場合軽視され、特に自動測定では気づけ無いことがよくある。今年度、自動データ処理システムを利用した階層的クラスタリング(特に強度のCCを利用するもの)を利用すれば構造の微小な違いを分類することができることを見出し、それについて現在論文化を進めている。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

本年度、申請書の計画どおり、ソーマチン、サーモライシンなどの標準結晶試料から位相決定に必要な回折データを大量に収集した。それらのデータは処理を実施し、回折強度の統計データを抽出するためのソフトウェアについてブラッシュアップも行った。この過程の中で、大きな結晶の内部の不均一性(格子定数のばらつき、回折能のばらつき)による「理想的ではない」振る舞いをするデータがあることに気づいた。わかりやすい例で見ると結晶の両端から得られるデータは回折能が低く、データ精度が低いことが多い。申請した機械学習ではこのような理想的ではない回折データの抽出および排除について予期していなかったが、以降のデータ精度の議論に非常に重要なデータ分類ステップであると認識し、検討を重ねた。現時点ではまだ適切なフィルター法が見いだせていないが、「明らかな」データクオリティの低さに従って「以降精度検討に利用するかどうか」を判定することの有用性に気づくことができた。関連して、結晶構造の多型性に関する課題にも取り組みました。階層的クラスタリングを使用して、構造多型の抽出を行い、より純度の高いデータ解析が可能になることを見出した。この技術を機械学習の基盤として応用することで、申請した内容に加え、結晶の物理的なクオリティの定量化・分類を実施し、より深い洞察が得られると期待できる。
以上のように、予期せぬ問題に直面しながらも、機械学習の基盤を構築することに成功した。

今後の研究の推進方策

計画上には若干の遅れがあるものの、回折データを処理し、何段階かに分けたクオリティ評価を実施するというより高機能なシステム構築に向けた情報収集と開発をすすめることができている。今年度は、まずR4年度に見出した2種類のフィルタリング(回折強度の明らかな品質の違い、階層的クラスタリングによる微小な構造の違いの分類)を実施し、残された高品質かつ構造純度の高いデータを利用した機械学習パラメータの推定を行っていく。計画書に書いたとおり、これには微弱な回折強度シグナルの検出に有用な位相決定(SAD法)を実施し、位相決定の可否・正解とのCCなどを「学習データの答え」として与えることで、古典的な回折強度データの統計値や他の統計値を利用した線形回帰モデルの構築を実施する。

  • 研究成果

    (6件)

すべて 2023 2022 その他

すべて 国際共同研究 (3件) 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (1件) (うち国際学会 1件、 招待講演 1件)

  • [国際共同研究] University of California San Diego/Stanford University(米国)

    • 国名
      米国
    • 外国機関名
      University of California San Diego/Stanford University
  • [国際共同研究] Tsinghua University(中国)

    • 国名
      中国
    • 外国機関名
      Tsinghua University
  • [国際共同研究] Friedrich-Alexander University(ドイツ)

    • 国名
      ドイツ
    • 外国機関名
      Friedrich-Alexander University
  • [雑誌論文] Constrained catecholamines gain β2AR selectivity through allosteric effects on pocket dynamics2023

    • 著者名/発表者名
      Xu Xinyu、Shonberg Jeremy、Kaindl Jonas、Clark Mary J.、Strobel Anne、Maul Luis、Mayer Daniel、Hubner Harald、Hirata Kunio、Venkatakrishnan A. J.、Dror Ron O.、Kobilka Brian K.、Sunahara Roger K.、Liu Xiangyu、Gmeiner Peter
    • 雑誌名

      Nature Communications

      巻: 14 ページ: online

    • DOI

      10.1038/s41467-023-37808-y

    • 査読あり / オープンアクセス
  • [雑誌論文] Mechanistic insights into intramembrane proteolysis by E. coli site-2 protease homolog RseP2022

    • 著者名/発表者名
      Imaizumi Yuki、Hirata Kunio、Nogi Terukazu et al.
    • 雑誌名

      Science Advances

      巻: 8 ページ: -

    • DOI

      10.1126/sciadv.abp9011

    • 査読あり / オープンアクセス
  • [学会発表] Is there a best method in data collection? ~an Asian Perspective~2022

    • 著者名/発表者名
      Kunio Hirata
    • 学会等名
      Gordon Conference (Diffraction Methods in Structural Biology)
    • 国際学会 / 招待講演

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi