Project/Area Number |
23K24947
|
Project/Area Number (Other) |
22H03692 (2022-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
Section | 一般 |
Review Section |
Basic Section 62010:Life, health and medical informatics-related
|
Research Institution | Aichi Cancer Center Research Institute |
Principal Investigator |
山口 類 愛知県がんセンター(研究所), システム解析学分野, 分野長 (90380675)
|
Co-Investigator(Kenkyū-buntansha) |
衣斐 寛倫 愛知県がんセンター(研究所), がん標的治療TR分野, 分野長 (00645145)
宮野 悟 東京医科歯科大学, M&Dデータ科学センター, 特任教授 (50128104)
丸橋 弘治 富士通株式会社(富士通研究所), その他部局等, 研究員 (20417504)
PARK HEEWON 東京医科歯科大学, M&Dデータ科学センター, 非常勤講師 (70756642)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥17,420,000 (Direct Cost: ¥13,400,000、Indirect Cost: ¥4,020,000)
Fiscal Year 2024: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2023: ¥5,590,000 (Direct Cost: ¥4,300,000、Indirect Cost: ¥1,290,000)
Fiscal Year 2022: ¥7,280,000 (Direct Cost: ¥5,600,000、Indirect Cost: ¥1,680,000)
|
Keywords | 一細胞計測 / 説明可能AI / ネットワーク / ネットワーク解析 / シングルセルデータ解析 / ネットワーク推定 |
Outline of Research at the Start |
計測技術の進展により、多種の情報を多様なコンテキストに沿って単一細胞レベルで得られるようになってきた。これらの一細胞計測情報からコンテキストを反映して変化する生体ネットワーク構造の持つ意味を抽出できれば、分化、薬剤感受性等、様々な細胞機能および性質のシステム的理解が進むことが期待される。本研究の目的は、コンテキストに沿って変化する単一細胞レベルのネットワーク群の推定技術を開発するとともに、大規模ネットワーク群から解釈可能な有用情報を抽出するAI技術(XAI: Explainable AI)を開発し適用することで、ネットワーク構造の変化の意味を説明しうる深い知識の発見を目指すことである。
|
Outline of Annual Research Achievements |
計測技術の進展により、多種の情報を多様なコンテキストに沿って単一細胞レベルで得られるようになってきた。これらの一細胞計測情報から コンテキストを反映して変化する生体ネットワーク構造の持つ意味を抽出できれば、分化、薬剤感受性等、様々な細胞機能および性質のシステ ム的理解が進むことが期待される。しかしながら、特に細胞集団が置かれているコンテキストを反映して変化する一細胞ネットワーク推定技術 は未開発である。さらに、それらの高次元関係性データから人間が解釈可能な情報を抽出することには、大きな障壁が存在する。本研究の目的 は、コンテキストに沿って変化する単一細胞レベルのネットワーク群の推定技術を開発するとともに、大規模ネットワーク群から解釈可能な有 用情報を抽出する説明可能AI技術を開発し適用することで、ネットワーク構造の変化の意味を説明しうる深い知識の発見を目指すことである。 今年度は、一細胞遺伝子発現データの計測を行うと共に大規模ネットワーク群から有用情報を抽出する説明可能AI技術の改良を進めた。まず提案した手法の改良を進め、また薬剤耐性の異なる細胞(株)群のネットワークの情報(エッジの重みの差異)を統合して、薬剤耐性能に関わるネットワーク構造を検出する統計的手法の開発を行った。また上述の手法に加えて、個々の遺伝子ネットワーク内の、遺伝子間の制御効果を統合することにより、性質の異なる細胞間の性質の差異に関わるサブネットワークを検出する手法の開発も進めた。さらにmRNAのライフサイクルを表現する微分方程式モデルの情報を事前情報として柔軟なニューラルネットワークモデルの学習時に活用することで、遺伝子発現のダイナミクスを司るパラメーターを(一細胞/バルク)RNA-seqデータに含まれる成熟/未成熟mRNA由来のリードデータから、時変かつ説明可能性が高い形で推定する手法を開発した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の目的は、コンテキストに沿って変化する単一細胞レベルのネットワーク群の推定技術を開発するとともに、大規模ネットワーク群から解釈可能な有 用情報を抽出する説明可能AI技術を開発し適用することで、ネットワーク構造の変化の意味を説明しうる深い知識の発見を目指すことである。 本年度は、目的を達成するために、昨年度に引き続き説明可能AI技術の開発を進めた。 まず我々が提案した説明可能AI技術であるTRIP法の改良を進めた。さらにネットワーク情報からの情報抽出モデルの構成法と推定法の開発を以下のように進めた。コンテキストに沿って変化する、多数の要素間の因果構造を表すネットワーク群が得られる状況において、解釈可能性を上げる方策としては、性質が変化する細胞間で、その性質の差異に関わるネットワークの部分構造(サブネットワーク)を検出することである。本年度は、そのために二種類の検出方法を開発した、一つはネットワークのエッジの重みの差異を要約する方法。もう一つは、ネットワーク上で離れた場所にある遺伝子間の制御効果の差異を要約し検出する方法である。それぞれの手法を薬剤感受性の異なるがん細胞株に適用し、解釈可能なサブネットワーク群を抽出することに成功した。さらに、偽時間軸もしくは実時間軸に沿って性質(状態)を変化させる、細胞における遺伝子発現プロセスに関わる動的パラーメータを、人間の持つ背景知識を表現した微分方程式系のモデルと柔軟なニューラルネットワークを組み合わせることで、解釈可能性の高い形で推定する手法を開発した。また、大腸がんサンプルから一細胞計測データの計測も進め、上記の手法の適用と検討を進めた。以上より、目的達成のための手法の検討および開発は概ね順調に進展している。
|
Strategy for Future Research Activity |
最終年度である、次年度は、これまでに開発を進めてきた手法と検討を基に、一細胞計測データからの深い情報抽出法の開発をさらに進める。近年の公共データベースには大規模一細胞計測データセットが充実してきている。それらの多様なデータセットに対して開発した手法の適用を進める。また我々が実験により取得した一細胞計測データについても適用を進める。背景が良く分かったデータセットに適用することで、さらに深い情報抽出へ至ることが期待される。また、これまで主に遺伝子発現データを想定したネットワーク推定手法およびそこからの情報抽出手法の開発を進めてきたが、近年の計測技術の進展により、一細胞HI-C計測等のクロマチンの立体構造を反映した計測データも得られるようになっている。またマルチモーダル化も進んでいる。それらの情報を統合したネットワーク推定技術の開発も進める。一細胞計測におけるマルチモーダルデータにおいては、同一の細胞から同時に複数の計測(遺伝子発現、ゲノム変異、クロマチン構造等)を計測するのは困難である。そのため実際には別々の細胞の情報を統合する必要がある。情報統合には機械学習における最適輸送に基づく方法等が提案されているが、方法を検討する。また深層学習モデルを用いた、時系列データからの転写制御ダイナミクスおよび機構に関わる情報抽出法の開発も進める。そこでは、転写制御ダイナミクスに関わる知識を微分方程式系で表現し、 深層学習モデルに反映させることで、データだけからは得ることのできない情報の抽出を目指す。また逆に計測された時系列データを生成するシステムとして、説明可能な微分方程式系のモデルを推定する手法の開発を進める。
|