| 研究課題/領域番号 |
24K11055
|
| 研究種目 |
基盤研究(C)
|
| 配分区分 | 基金 |
| 応募区分 | 一般 |
| 審査区分 |
小区分52050:胎児医学および小児成育学関連
|
| 研究機関 | 昭和大学 |
研究代表者 |
加藤 光広 昭和大学, 医学部, 教授 (10292434)
|
| 研究分担者 |
山口 敦子 東京都市大学, デザイン・データ科学部, 教授 (10346108)
宮 冬樹 慶應義塾大学, 医学部(信濃町), 准教授 (50415311)
|
| 研究期間 (年度) |
2024-04-01 – 2027-03-31
|
| 研究課題ステータス |
交付 (2024年度)
|
| 配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2026年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2025年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2024年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
| キーワード | 人工知能 / 脳形成異常 / てんかん / 画像診断 / ロングリードシーケンス / 深層学習 / ゲノム / 遺伝子 |
| 研究開始時の研究の概要 |
脳形成異常とてんかん性脳症で全エクソーム解析を行い、多数の原因遺伝子を明らかにしたが、全ゲノム解析でも約40%は原因が分からず、新たな発想による解析法の開発が必要である。人工知能(AI)の深層学習モデルによる解析が急速に進歩しており、希少疾患でありながら多数の検体と画像の集積がある優位性を生かして、AIによる遺伝子解析とMRI画像解析を連携させた解析を行う。モザイクもしくは反復配列の挿入が隠れた原因と仮説を立て、AIによる変異検出と検証、AI画像診断による原因遺伝子予測法の開発を行う。
|
| 研究実績の概要 |
ヒト脳では他臓器に比べてたくさんの遺伝子が発現し、遺伝性疾患が多い。希少疾患における遺伝素因の探索には全エクソーム解析(WES)が行われ、全ゲノム解析(WGS)例も増えている。しかしまだ約40%の症例は原因遺伝子が未同定であり、ゲノム医療・精密医療の多層的・統合的に推進するためには、新たな発想による解析手法の開発が必要である。私たちは、脳形成異常とてんかん性脳症1500家系以上で全エクソーム解析を行い、世界に先駆けて多数の原因遺伝子を明らかにしたが、表現型から明らかに単一遺伝子バリアントによる遺伝性と考えられる家系でも原因未同定例を多数有している。人工知能(AI)の深層学習モデルによる解析が急速に進歩しており、希少疾患でありながら多数の検体集積がある優位性を生かして、AIによる遺伝子解析とMRI画像解析を連携させた新たな解析法を着想した。 SpliceAIによる変異同定と、NGSまたはデジタルPCRによる低頻度アレル変異検出、ロングリードシーケンスによる反復配列同定の実績から、原因が未同定の理由はモザイクもしくは反復配列の挿入と仮説を立てた。最近、可視化モジュールと畳み込みニューラルネットワーク(CNN)モジュールを組み合わせたモザイク変異の検出アルゴリズムDeepMosaicが報告され、WES, WGSデータで予備実験を行っている。また、k-分割交差検証を用いた深層学習モデルで、比較的少ない例数でも人間が見逃すような変化をAIが検出することが報告されており、AIを用いた脳形成異常の原因遺伝子予測を開発中である。
|
| 現在までの達成度 |
現在までの達成度
2: おおむね順調に進展している
理由
令和6年度に発達性てんかん性脳症114家系、脳形成異常46家系の遺伝子解析用検体を収集し、脳形成異常については全家系で解析用MRI画像データを収集し、随時候補遺伝子のSangerシーケンスと全エクソーム解析を行ない、LIS1(PAFAH1B1)変異2例、DCX変異1例を同定した。古典型滑脳症については、LIS1, DCXの全エクソンを含む領域についてMultiplex Ligation-dependent Probe Amplification (MLPA)法を用いて解析し、LIS1欠失17例、LIS1重複1例、DCX欠失2例、YWHAEとHIC1欠失1例を同定した。 DeepMosaicを用いた既知モザイク検体の予備実験では、全エクソーム解析データではモザイクバリアントが検出されなかったが、全ゲノム解析データでは約半数でモザイクバリアントが検出された。しかし、コール数が少ないバリアントでは検出されず、DeepMosaicを用いたモザイクバリアントの検出には限界があった。 既存の古典型滑脳症330例について、原因遺伝子と画像情報について調査した。DICOM形式の脳MRI画像は、228例289画像(1画像にはT1強調画像やT2強調画像、軸状断、冠状断など複数のシーケンスを含む)で得られた。うちLIS1変異例37例42画像、DCX変異36例39画像について、T1強調とT2強調の軸状断画像(各々LIS1は30画像:30画像、DCXは28画像:32画像)を抽出した。訓練データ100枚とテストデータ20枚で分割して、三次元画像処理モデルを用いて教師あり学習を行った。モデルの評価には、データセットに対してk-fold交差検証を行い、正答率の平均を算出した。その結果、交差検証による平均正答率は84%であった。もっとも正答率が高いk-foldでは、95%の正答率が得られた。
|
| 今後の研究の推進方策 |
引き続き発達性てんかん性脳症と脳形成異常の症例集積を行い、全エクソーム解析を中心とした原因遺伝子の探索を行う。全エクソーム解析で、ACMGガイドラインにおいてpathogenicもしくはlikely pathogenicと判断されるが、コール数の比率が少なくモザイクが疑われるバリアントについては、同バリアントを含む領域をPCRで増幅し、その産物を用いてNanoporeシーケンスライブラリを作成し、シーケンスを行い超低頻度モザイクバリアントの検出を行う。 三次元画像学習については、MLPA法で変異が確認された症例の画像データを追加する。研究としての遺伝子解析以外に、保険適用されたfluorescence in situ hybridization (FISH)法による商業ベースで判明したLIS1欠失例が多く、Proof-of-concept (POC)として行った今回の予備実験では高い正答率が得られたので、小児神経ネットワークを活用して、FISH法で判明したLIS1欠失例の画像データの収集を行う。原因遺伝子が判明していない症例の画像データを用いて、教師なし学習による分類を試みる。その後、教師あり学習のモデルによる予測結果と教師なし学習のモデルによる予測結果を比較することで、二つのモデルを相互に改善する。
|