2019 Fiscal Year Annual Research Report
Development of novel algorithm for quality control of metabolomics data
Project/Area Number |
17K00416
|
Research Institution | Tokyo Medical University |
Principal Investigator |
杉本 昌弘 東京医科大学, 医学部, 教授 (30458963)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | メタボローム / ソフトウェア / 人工知能 |
Outline of Annual Research Achievements |
本研究では質量分析装置を用いたメタボローム解析を対象とし、全てのシグナルの検出や解釈を行うノンターゲット解析を自動的に行う環境構築に取り組んだ。(1)ある程度の自動化を機種に合わせて行う、(2)ユーザがGUIを用いて精査した解析結果をAIを用いて再現する、という2つの方針にてアルゴリズムの開発を実施した。 上記の達成のため、質量分析の機種やメーカーの違いがある個々のデータの特徴を抽出して、自動化のための処理のパラメータを決定するためのツールとしてMassViewを開発した。また、これまでにも開発してきたCE-MS自動解析ソフトMassHunterにAPIを実装し、Pythonからプログラム化できる環境を開発し、様々な人工知能などの外部ライブラリを結合できる機能とした。既に多数の熟練ユーザがデータごとにGUIを用いて精査した解析結果と、精査前の解析結果の差分を自動的に小さくする機能がゴールではあるが、リファレンスとのずれ、アライメント後のピークのミスマッチ、小さなピークの取りこぼしなど、単一検体の解析ではなく、複数検体の重ね合わせによって、解析結果が劣化している点を同定し、これらを自動的に修正するプログラムとして実装した。大規模な検体数のコホートデータを用いてこれらの定量的な検証を行い、その性能の評価を実施した。 また、ノンターゲット解析を実施するための測定方法の工夫も行い、最初に測定検体の濃度を多段階に希釈して測定し、そこから定量値の再現性の高いデータだけを抽出し、抽出したデータだけを残りの検体でターゲット解析を行う方法を考案した。実際にLC-MSを用いて脂質の解析を行う評価も実施し、公開データベースを利用した物質推測などを実施した。
|