2018 Fiscal Year Annual Research Report
AI-based drug discovery approach based on biomedical big data and its application to refractory diseases
Project/Area Number |
18H03334
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
山西 芳裕 九州工業大学, 大学院情報工学研究院, 教授 (60437267)
|
Co-Investigator(Kenkyū-buntansha) |
土方 康基 東京大学, 医科学研究所, 特任助教 (80460856)
沖米田 司 関西学院大学, 理工学部, 教授 (90398248)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 機械学習 / ビッグデータ / 創薬 / 人工知能 / 難治性疾患 |
Outline of Annual Research Achievements |
本研究では、医薬ビッグデータと人工知能(AI)の基盤技術である機械学習を用いた創薬「AI創薬」を提唱し、それを実現するための情報基盤技術を構築する。開発手法で数千万個の化合物をインシリコスクリーニングし、予測結果をウェット実験で検証し、有望な治療薬候補化合物を同定することを目標とする。 平成30年度は、化合物、タンパク質、疾患に関する医薬ビッグデータを、インターネットや文献、データベースから適時収集して整備した。化合物に関する情報を、KEGGなど様々なデータベースから得て、情報解析可能な形に整備した。タンパク質に関する情報を、UniProtなど様々なデータベースから得て、情報解析可能な形に整備した。難治性疾患に関する情報は、OMIMなどのデータベースから得て、情報解析可能な形に整備した。 そして、化合物の標的タンパク質プロファイルを構築した。申請者はこれまでに化合物の標的タンパク質を予測する機械学習手法の開発に取り組んできているが、その拡張を行った。深層学習のニューラルネットワークで、化合物の標的タンパク質プロファイルを予測するためのモデルのプロトタイプを構築した。化合物の化学構造の適用範囲を考慮した予測モデルも構築した。 次に、疾患に対して効能を持つ化合物を予測する手法の開発を行った。疾患の多層オミックスデータを用いて、疾患の分子機序の類似性を評価する手法を開発した。現在、疾患の分子プロファイルの類似性とパスウェイ異常の類似性の2種類を計算するアルゴリズムを提案し、その性能の評価を行った。 予測結果が得られたら迅速に実験的検証に移れるように実験プラットフォームを構築した。抗がん作用を評価できる試薬やプロトタイプの手法で予測された化合物を用意し、がんに対する検証の準備を行った。嚢胞性線維症の治療効果は、CFTRへの作用などで評価するため、その評価系構築を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成30年度は、予定通り、化合物、タンパク質、疾患に関する医薬ビッグデータを、インターネットや文献、データベースから適時収集して整備することができた。 予定通り、化合物の標的タンパク質プロファイルを構築をすることができた。申請者はこれまでに化合物の標的タンパク質を予測する機械学習手法の開発に取り組んできているが、その拡張を行った。機械学習による予測モデルは学習データの中の化合物とかけ離れた化合物に対しては、高い精度で予測することは不可能であるため、適用範囲を考慮した機械学習の予測モデルの構築を行った。適用範囲外にある化合物は考慮しない手順を組み込むことによって、予測スコア上位の化合物の精度が大幅に向上することを確認できた。その結果は論文で発表した。 予定通り、深層学習のニューラルネットワークで、化合物の標的タンパク質プロファイルを予測するためのモデルのプロトタイプを構築することができた。次に、疾患のオミックスデータを用いて、疾患の分子機序の類似性を評価する機械学習の手法を開発することができた。現在、疾患の分子プロファイルの類似性とシステム生物学の視点からパスウェイ異常の類似性の2種類を計算するアルゴリズムを提案し、その性能の評価中である。予定通り、予測結果が得られたら迅速に実験的検証に移れるように実験プラットフォームを構築した。 これらの研究成果や部分的な成果は、論文発表(2件)や学会口頭発表(10件、そのうち招待講演は7件)した。以上より、おおむね順調に進展していると考えることができる。
|
Strategy for Future Research Activity |
前年度に引き続き、化合物、タンパク質、疾患に関するデータを、インターネットや文献、データベースから適時収集して情報整備する。化合物に関する情報やタンパク質に関する情報、本研究の対象疾患に関する分子機序情報を、世界中の様々なデータベースから得て、最新版に更新する。特に本年度は疾患のSNPなどゲノム関連データや化合物の物理化学的性質のデータを充実させ、より正確に疾患や化合物の特徴を捉えることができるように情報解析を行う。 化合物の特徴ベクトルを、化学構造情報、副作用情報、化合物応答遺伝子発現情報から構築する。疾患に対して、医薬品候補となる化合物をスクリーニングする手法を実装する。疾患の分子プロファイルの類似性とパスウェイ異常の類似性を用いて、化合物予測における性能の評価を行う。化合物の特徴ベクトルを明示的に作らないグラフ畳み込みニューラルネットワークも検討する。ニューラルネットワークのハイパーパラメータの選び方が実際の応用では問題となるが、ベイズ最適化を用いて行う方法を検討する。 引き続き実験プラットフォームを構築し、迅速に実験的検証に移れるように準備を進める。提案する機械学習手法によって大規模予測を行い、予測結果が得られたら直ちに、その化合物の抗癌作用や嚢胞性線維症の治療効果を評価する。
|
Research Products
(12 results)