2021 Fiscal Year Annual Research Report
Developing machine learning based bioinformatics to decipher hidden biology of depression symptoms
Project/Area Number |
20F20809
|
Research Institution | Kyoto University |
Principal Investigator |
馬見塚 拓 京都大学, 化学研究所, 教授 (00346107)
|
Co-Investigator(Kenkyū-buntansha) |
PETSCHNER PETER 京都大学, 化学研究所, 外国人特別研究員
|
Project Period (FY) |
2020-11-13 – 2023-03-31
|
Keywords | バイオインフォマティクス |
Outline of Annual Research Achievements |
本研究の対象は、うつ病で、特に、insomnia-hypersomniaと呼ばれる対の症状に着目し、その背景にある生命科学のメカニズムを、データベースと、データからの機械学習により解明することを目的としている。昨年度に、解明に必要なデータベースを整備した。具体的には、臨床コホートデータとして定評のある、UKバイオバンクの50万件ほどの個人データから幅広いデータを抽出し、各個人の遺伝情報と環境情報をデータとして整備した。本年度は、このデータを入力とする機械学習手法のモデル設計・構築に取り組んだ。入力となるUK Biobankの個人データは50万件ほどに達するため非常に大規模で、モデル設計後の実装においては、モデルのみならず学習手法の効率化に取り組む必要があった。モデルは、入力として遺伝情報のみならず環境情報をも入力とする深層学習手法であり、実装後、モデルの有効性を検証しつつ、モデル及び学習手法の改良を行った。このモデル学習は、以下の特徴を有する:1,50万件にも及び大規模個人データを入力する、2, 遺伝情報及び環境情報をも入力する、3, 学習後のモデルからデータの内容を説明可能な、いわゆるExplainable AIの機能を考慮することにより、メカニズム解明を行う。このような特徴を持つデータ解析手法は、未だ開発されておらず、また、データからの解明手法として、既存手法を凌駕する性能を持つことが期待できる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題の当該年度の研究実施計画は、うつ病において、insomia-hypersomiaと呼ばれる症状の対の背景となっている生命科学のメカニズムを、データベースと機械学習手法により解明するために、この症状の対に関連する生命科学の因子(遺伝子や低分子化合物)を既存の複数のデータベースから抽出するための機械学習手法を設計・実装することであった。現在、既に、UKバイオバンクを中心とした大規模臨床コホートデータを入力可能な機械学習手法を構築・実装し、さらに改良を試みた。以上から、計画を十分に達成したと考えている。
|
Strategy for Future Research Activity |
前述のように、本研究課題では、外国人特別研究員が博士課程在学時から研究対象としているうつ病において、insomia-hypersomiaと呼ばれる症状の対の背景となっている生命科学のメカニズムを、データベースと機械学習手法により解明することを目的とする。この目的を達成するために以下の2つのステップを用いる。1)まず、この症状の対に関連する生命科学の因子を既存の複数のデータベースを使うことにより抽出する。ここでの生命科学の因子とは遺伝子や低分子化合物を指す。また、データベースは、UKバイオバンクを中心とした臨床コホートデータとともに、遺伝子ネットワーク、遺伝子発現、低分子化合物情報、代謝等に関するデータベースを指す。2)次に、症状の対が見られる場合に、これら因子間の相互作用を上記複数のデータベースから機械学習手法により抽出し、相互作用をグラフ化することによりメカニズムを視覚的に理解する。 本年度の研究計画では、上記1のステップを達成し、上記2のステップを開始した。今後は、上記2のステップの完成を目標とする。
|