研究課題/領域番号 |
23K11014
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 帝京大学 |
研究代表者 |
松浦 正明 帝京大学, 公私立大学の部局等, 客員教授 (40173794)
|
研究分担者 |
安藤 宗司 東京理科大学, 創域理工学部情報計算科学科, 講師 (40803226)
小森 理 成蹊大学, 理工学部, 准教授 (60586379)
松井 茂之 名古屋大学, 医学系研究科, 教授 (80305854)
鈴木 明日香 (根本明日香) 帝京大学, 公私立大学の部局等, 講師 (20722482)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2025年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2024年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2023年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | 統計学 / 予測問題 / 個別化医療 / 深層学習 / バイオインフォマティクス / 遺伝子 |
研究開始時の研究の概要 |
本研究では、これまでAMED研究で開発した方法を乳癌以外のがん種に拡張し、さらに以前の基盤(B)の成果を基に、患者とその臨床情報などの行と列からなるテーブルデータに対し、統計学的手法を用いて「人工知能・深層学習における各変数の寄与度の数値化」を行うための新規方法を開発する。
|
研究実績の概要 |
本研究では家族性乳がんの原因遺伝子BRCA1を世界で初めて発見した三木義男先生(研究協力者)との2021年度までのAMED共同研究で行った研究内容を延長・進展させ、遺伝子変異が病的かどうか区別のつかない変異VUS(Variant of Unknown Significance)を判定するための統計学的方法および人口知能・深層学習を含む種々のin silico統合予測モデルを開発し、その性能を比較評価し、2023年度に論文発表を行った。また、統合予測モデルとして人口知能の深層学習を用いた場合に、最終結果に対する各変数の寄与度に関してはブラックボックスであるという医学・生物学的に因果関係を検討するために必要な情報が得られないという大きな問題点を解決するため、統計学的手法を用いて「人工知能・深層学習における各変数の寄与度の数値化」を行うための新規方法を開発し、2023年度の日本計量生物学会にて学会発表を行なった。これに関しては、さらに2024年度にギリシャで開催される国際臨床生物統計学会の学会報告準備も初年度に行った。また深層学習の予測能力に関しては、研究協力者の旦慎吾先生との抗がん作用を示す化合物のがん細胞株に対するハイコンテント画像経時測定データを用いた細胞周期予測モデルを構築し、他の統計モデルや機械学習モデルとの性能比較を行い、その結果を英国薬学学会誌にも投稿した。 さらに本研究では、今後の個別化医療・がんゲノム医療の加速化のためには、乳癌で行った解析を他の癌に拡張してデータ解析を行うことを試みる。そのため初年度は対象癌種の選定の検討し、その結果、家族性大腸腺腫症はAPCが関連し、遺伝性非ポリポージス性大腸がんでは、MSH2, MLH1などの各遺伝子が関連していることから、大腸癌を対象とする事とし、VUSに対する5種の公開in silico予測モデル解析の準備を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
家族性乳がんの原因遺伝子BRCA1の発見者である三木義男先生(研究協力者)とのAMED共同研究で行った研究内容を延長・進展させ、本研究開始初年度の2023年12月にJ Hum Genet誌に論文発表を行なうことができた。また、この研究に関連して統合予測モデルで使用した人口知能の深層学習を用いた解析に対しては、統計学的手法を用いて「人工知能・深層学習における各変数の寄与度の数値化」を行うための新規方法を開発し、2023年度の日本計量生物学会にて学会発表を行なうこともできた。この研究成果に関しては2024年度にギリシャで開催される国際臨床生物統計学会の学会報告の申請を今年度行ない、発表の採択を受けることができ、論文投稿の準備を進める事ができた。さらに、深層学習の予測能力に関しては、研究協力者の旦慎吾先生との抗がん作用を示す化合物のがん細胞株に対するハイコンテント画像経時測定データを用いた細胞周期予測モデルを構築し、他の統計モデルや機械学習モデルとの性能比較を行い、その結果を英国薬学学会誌であるPharmacology Research & Perspectives誌にも投稿したところ、2024年度4月に採択され、重要な知見を得る事ができた(来年度の業績)。この研究内容は計画には記載していなかったが、本研究と強く関連する結果を得る事ができた。 さらに本研究では、今後の個別化医療・がんゲノム医療の加速化のためには、乳癌で行った解析を他の癌に拡張してデータ解析を行うことを試み、対象癌種の選定の検討をない、対象を大腸癌に設定し、遺伝子変異情報をClinvarよりダウンロードし、研究計画の予定どおり、VUSに対するin silico予測モデル解析の準備を行なうことができたため、上記の評価を付けた。
|
今後の研究の推進方策 |
研究1:AMED研究で開発した深層学習を乳癌以外に適用し、Clinvar内のVUSの変異に対して判定を行ない、その結果を時系列的検証で評価できないか?これに関しては、Clinvar自体が更新されており、乳癌の場合は、最初にダウンロードした年から5年は経っており、以前不明だったVUSに対して新規の結果を付与された結果を調べることにより、どの程度が検証データとして使用できるか判定できる。乳癌以外の癌種として大腸癌を選択したが、大腸癌においても乳癌と同様の時系列検証が可能であるため、今後は実際にデータをダウンロードし、不明データの更新結果を追跡する。 研究2:AMED研究ではin silico予測結果を全て2値化して学習データとし、この予測モデルに対して説明変数寄与度の評価方法のプロトタイプを作成した。2値以外の連続量を含めたデータに対しても、考案手法を拡張できるかどうか?これに関しては、説明変数の寄与度の数値化に関して、重回帰分析を適用することで連続量のデータにも適用可能なため、既に問題を解決している。今後は具体例のデータを用いて論文化する予定である。 研究3: in silico予測結果を利用する場合に、必ず結果が不明の出力が存在し、さらに過学習の問題も存在するが、これに対応する方法を開発できないか?不明の出力結果に対しては、連続データであった場合でもダミー変数化する事を検討し、今後の課題とし大腸癌のデータで具体的な解析を検討する予定である。
|