Project/Area Number |
23K21721
|
Project/Area Number (Other) |
21H03547 (2021-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2021-2023) |
Section | 一般 |
Review Section |
Basic Section 62010:Life, health and medical informatics-related
|
Research Institution | Nagahama Institute of Bio-Science and Technology |
Principal Investigator |
白井 剛 長浜バイオ大学, バイオサイエンス学部, 教授 (00262890)
|
Project Period (FY) |
2021-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥15,340,000 (Direct Cost: ¥11,800,000、Indirect Cost: ¥3,540,000)
Fiscal Year 2025: ¥3,250,000 (Direct Cost: ¥2,500,000、Indirect Cost: ¥750,000)
Fiscal Year 2024: ¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Fiscal Year 2023: ¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Fiscal Year 2022: ¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Fiscal Year 2021: ¥3,120,000 (Direct Cost: ¥2,400,000、Indirect Cost: ¥720,000)
|
Keywords | 生命分子計算 / 生体超分子構造 / データサイエンス医療 / グラフ理論 |
Outline of Research at the Start |
疾患とその治療薬の関係は分子構造・分子間相互作用データにより一般的に定義可能か?この問に既存の疾患原因となる遺伝子・タンパク質、既存の治療薬、およびそれらの分子相互作用グラフデータの高次元化により答え、新規の疾患に対する新規の治療薬ターゲットを発見するアルゴリズムを定義する。
|
Outline of Annual Research Achievements |
昨年度の研究で、疾患-治療薬経路グラフデータ高次化のために、主として医薬品(ドラッグ)立体構造モデルの構築および立体構造データの疾患-治療薬経路グラフへの連結するためのモデリングのためのパイプラインを構築し高分子薬(抗体・核酸など約500分子)を除く約21,000の構造モデルを構築した。引き続き本年度は2024年度計画に従い、高分子薬の構造モデリングについて必要となる翻訳後修飾・人為的修飾など手動モデリングの過程を、alphafold2などを活用しながら構築をすすめ、主に核酸医薬品など全体の80%程度(医薬品の全数としては22,148分子)のモデルを構築した。さらに医薬品アノーテーションの高度化を目的として、高分子薬の種別(タンパク質(713分子)、核酸(77分子)、糖鎖(36分子)、抗体(620分子)、ワクチン成分(26分子)、その他の高分子(229分子))の判別子および解剖治療化学分類(ATC: Anatomical Therapeutic Chemical)コード(5587分子)のデータをグラフデータに付け加えた。また、これまで機械学習で使用する、医薬品と疾患をつなぐタンパク質の識別コードは既成のAutoEncoderの出力を使用していたが、独自のエンコーディングを実装するために、タンパク質配列ペアの頻度マトリックスをオートエンコーディングする機械学習器を試作しテストした。テストでは、配列(正確にはタンパク質配列ペアの頻度マトリックス)を、20次元程度のベクトルにエンコーディグ(これがタンパク質のコードとなる)して、相関係数0.7程度で元のマトリックスを再現可能であった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2023年度実績の概要に述べた様に、当初計画から変更なく概ね計画に沿って進行していると判断した。
|
Strategy for Future Research Activity |
今年度は引き続き、高分子薬の構造モデルの構築とターゲットタンパク質との複合体構造データの作成を行い、疾患-治療薬経路グラフへの連結を推進する。モデリングのためのパイプラインは引き続き翻訳後修飾の処理などのため改善する。また、ターゲットタンパク質複合体構造とSIRD(https://sird.nagahama-i-bio.ac.jp/sird/)など独自開発した構造分類データベースを融合して、ドメインなどの分割を考慮した疾患-治療薬経路グラフの高度化と機械学習の高度化を引き続き行う。基礎的なデータが整いつつあるので、本年度はrandom forest(RF)またはGNN(graph neural network)などの、現状(GBDT, Gradient Boosted Decision Tree)とは異なるモデルによる機械学習器の構築を行い、判別・予測性能の比較を行う。特に2023年度から着手した、独自のAuto Encoder により予測性能が向上するか否かを検証する。また同様の試みとして、医薬品の分子構造をグラフコンボリューショナルニューラルネットを介して入力データとする方法も検討する。これにより、医薬品の構造類似性の判別性能が向上することが期待できる。
|