研究課題/領域番号 |
20H00601
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
中区分61:人間情報学およびその関連分野
|
研究機関 | 名古屋大学 (2022-2024) 名古屋工業大学 (2020-2021) |
研究代表者 |
竹内 一郎 名古屋大学, 工学研究科, 教授 (40335146)
|
研究分担者 |
花田 博幸 国立研究開発法人理化学研究所, 革新知能統合研究センター, 研究員 (00793035)
寺田 吉壱 大阪大学, 大学院基礎工学研究科, 准教授 (10738793)
稲津 佑 名古屋工業大学, 工学(系)研究科(研究院), 助教 (20869896)
本谷 秀堅 名古屋工業大学, 工学(系)研究科(研究院), 教授 (60282688)
津田 宏治 東京大学, 大学院新領域創成科学研究科, 教授 (90357517)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
43,290千円 (直接経費: 33,300千円、間接経費: 9,990千円)
2024年度: 6,110千円 (直接経費: 4,700千円、間接経費: 1,410千円)
2023年度: 10,010千円 (直接経費: 7,700千円、間接経費: 2,310千円)
2022年度: 10,010千円 (直接経費: 7,700千円、間接経費: 2,310千円)
2021年度: 10,920千円 (直接経費: 8,400千円、間接経費: 2,520千円)
2020年度: 6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
|
キーワード | 機械学習 / データサイエンス / 統計的仮説検定 / 統計科学 / 人工知能 / 選択的推論 / 生命科学 / 教師なし学習 / 統計的推測 / 医療情報学 |
研究開始時の研究の概要 |
機械学習などのデータ科学に基づく科学研究はデータ駆動型科学と呼ばれ,データ分析によって仮説を自動生成するため,研究者の知識や経験からは想起できないような新しい仮説を生み出せる可能性がある.しかし,複雑なデータを複雑なアルゴリズムで分析して得られる「データ駆動型仮説」はデータに過剰に適合している可能性があり,信頼性評価が難しい.生命医療分野など誤った判断のもたらすリスクが大きい場合,データ駆動型仮説の信頼性を適切に評価する枠組が不可欠である.本研究では,探索的データ分析によって得られたデータ駆動型仮説の信頼性評価を行う方法を開発する.
|
研究実績の概要 |
機械学習などのデータ分析技術を利用する科学研究のアプローチはデータ駆動型科学と呼ばれさまざまな分野で有望視されている.データ駆動型科学では研究対象に関するデータを分析することによって科学的仮説を生成するため,従来のアプローチでは思いつかないような仮説を生み出せる可能性がある. 一方,複雑なデータを複雑なアルゴリズムで分析して得られた仮説の信頼性を評価するのは難しい.特に,教師なし学習と呼ばれる探索的なデータ分析によって仮説が生成される場合,信頼性を保証する方法は確立されていない.特に,生命医療分野など,誤った判断のもたらすリスクが大きい状況ではデータ駆動型仮説の信頼性を確保することが不可欠である.本研究では,探索的データ分析によって得られたデータ駆動型仮説の信頼性を定量化する数理・情報基盤を構築し,その有用性を生命医療分野において実証する.教師なし学習アルゴリズムが強力であればあるほど(データへの適合力が大きければ大きいほど),有望な仮説が生成できる可能性が高まる一方,仮説選択バイアスも大きくなってしまう.データ駆動型仮説の信頼性保証は,仮説選択バイアスを正しく定量化し,その補正を行うことによって実現できる.本研究では仮説選択バイアスを適切に補正し,アルゴリズムが仮説を生成したという条件のもとで統計的推論(仮説検定の枠組による偽陽性率(p値)や信頼区間の計算)を行う方法を確立する.2023年度は,深層生成モデルによって生成された仮説に対する信頼性保証を行うための選択的推論の理論構築,アルゴリズム開発にとりくんだ.特に,開発した方法を異常検知の問題へ適用した.生成モデルを用いた異常検知では,異常を含む画像から正常画像を生成し,その差分によって異常を同定することができるが,開発した方法を用いると,この異常検知の結果に対して理論的妥当性を持つp値を計算することができる.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2023年度は,方法面では,前年度に引き続き,深層学習によって駆動される知識の信頼性評価法を選択的推論の枠組で発展させた.これまでは,予測のための深層学習モデルを対象としてきたが,今年度の研究では,生成のための深層学習モデルを対象とした.特に,開発した方法を異常検知の問題へ適用した.生成モデルを用いた異常検知では,異常を含む画像から正常画像を生成し,その差分によって異常を同定することができるが,開発した方法を用いると,この異常検知の結果に対して理論的妥当性を持つp値を計算することができる利点を持つ.本研究に関連する成果は,機械学習や関連分野の難関国際会議であるICMLなどに採択され,国内外から注目を集めている.
|
今後の研究の推進方策 |
2024年度以降も,選択的推論を基軸とし,方法面の発展と適用先の開拓を並列して実施する予定である.特に、Diffusion Modelなどの深層生成モデルに対する選択的推論を行えるように適用範囲を拡げること、また,実装コストを減らすためのライブラリ開発にに取り組む。また、新たな問題設定として、ドメイン適応後のデータ分析に対する選択的推論の理論構築,アルゴリズム開発,ソフトウェア設計を行う.
|