研究課題/領域番号 |
18H03334
|
研究機関 | 九州工業大学 |
研究代表者 |
山西 芳裕 九州工業大学, 大学院情報工学研究院, 教授 (60437267)
|
研究分担者 |
土方 康基 東京大学, 医科学研究所, 特任助教 (80460856)
沖米田 司 関西学院大学, 理工学部, 教授 (90398248)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 機械学習 / ビッグデータ / 創薬 / 人工知能 / 難治性疾患 |
研究実績の概要 |
本研究では、医薬ビッグデータと人工知能(AI)の基盤技術である機械学習を用いた創薬「AI創薬」を提唱し、それを実現するための情報基盤技術を構築する。開発手法で数千万個の化合物をインシリコスクリーニングし、予測結果をウェット実験で検証し、有望な治療薬候補化合物を同定することを目標とする。 平成30年度は、化合物、タンパク質、疾患に関する医薬ビッグデータを、インターネットや文献、データベースから適時収集して整備した。化合物に関する情報を、KEGGなど様々なデータベースから得て、情報解析可能な形に整備した。タンパク質に関する情報を、UniProtなど様々なデータベースから得て、情報解析可能な形に整備した。難治性疾患に関する情報は、OMIMなどのデータベースから得て、情報解析可能な形に整備した。 そして、化合物の標的タンパク質プロファイルを構築した。申請者はこれまでに化合物の標的タンパク質を予測する機械学習手法の開発に取り組んできているが、その拡張を行った。深層学習のニューラルネットワークで、化合物の標的タンパク質プロファイルを予測するためのモデルのプロトタイプを構築した。化合物の化学構造の適用範囲を考慮した予測モデルも構築した。 次に、疾患に対して効能を持つ化合物を予測する手法の開発を行った。疾患の多層オミックスデータを用いて、疾患の分子機序の類似性を評価する手法を開発した。現在、疾患の分子プロファイルの類似性とパスウェイ異常の類似性の2種類を計算するアルゴリズムを提案し、その性能の評価を行った。 予測結果が得られたら迅速に実験的検証に移れるように実験プラットフォームを構築した。抗がん作用を評価できる試薬やプロトタイプの手法で予測された化合物を用意し、がんに対する検証の準備を行った。嚢胞性線維症の治療効果は、CFTRへの作用などで評価するため、その評価系構築を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成30年度は、予定通り、化合物、タンパク質、疾患に関する医薬ビッグデータを、インターネットや文献、データベースから適時収集して整備することができた。 予定通り、化合物の標的タンパク質プロファイルを構築をすることができた。申請者はこれまでに化合物の標的タンパク質を予測する機械学習手法の開発に取り組んできているが、その拡張を行った。機械学習による予測モデルは学習データの中の化合物とかけ離れた化合物に対しては、高い精度で予測することは不可能であるため、適用範囲を考慮した機械学習の予測モデルの構築を行った。適用範囲外にある化合物は考慮しない手順を組み込むことによって、予測スコア上位の化合物の精度が大幅に向上することを確認できた。その結果は論文で発表した。 予定通り、深層学習のニューラルネットワークで、化合物の標的タンパク質プロファイルを予測するためのモデルのプロトタイプを構築することができた。次に、疾患のオミックスデータを用いて、疾患の分子機序の類似性を評価する機械学習の手法を開発することができた。現在、疾患の分子プロファイルの類似性とシステム生物学の視点からパスウェイ異常の類似性の2種類を計算するアルゴリズムを提案し、その性能の評価中である。予定通り、予測結果が得られたら迅速に実験的検証に移れるように実験プラットフォームを構築した。 これらの研究成果や部分的な成果は、論文発表(2件)や学会口頭発表(10件、そのうち招待講演は7件)した。以上より、おおむね順調に進展していると考えることができる。
|
今後の研究の推進方策 |
前年度に引き続き、化合物、タンパク質、疾患に関するデータを、インターネットや文献、データベースから適時収集して情報整備する。化合物に関する情報やタンパク質に関する情報、本研究の対象疾患に関する分子機序情報を、世界中の様々なデータベースから得て、最新版に更新する。特に本年度は疾患のSNPなどゲノム関連データや化合物の物理化学的性質のデータを充実させ、より正確に疾患や化合物の特徴を捉えることができるように情報解析を行う。 化合物の特徴ベクトルを、化学構造情報、副作用情報、化合物応答遺伝子発現情報から構築する。疾患に対して、医薬品候補となる化合物をスクリーニングする手法を実装する。疾患の分子プロファイルの類似性とパスウェイ異常の類似性を用いて、化合物予測における性能の評価を行う。化合物の特徴ベクトルを明示的に作らないグラフ畳み込みニューラルネットワークも検討する。ニューラルネットワークのハイパーパラメータの選び方が実際の応用では問題となるが、ベイズ最適化を用いて行う方法を検討する。 引き続き実験プラットフォームを構築し、迅速に実験的検証に移れるように準備を進める。提案する機械学習手法によって大規模予測を行い、予測結果が得られたら直ちに、その化合物の抗癌作用や嚢胞性線維症の治療効果を評価する。
|