探索的分析によるデータ駆動型仮説の信頼性評価法の確立と生命科学分野における実証

研究課題

研究課題/領域番号	20H00601
研究種目	基盤研究(A)
配分区分	補助金
応募区分	一般
審査区分	中区分61:人間情報学およびその関連分野
研究機関	名古屋大学 (2022-2024) 名古屋工業大学 (2020-2021)
研究代表者	竹内一郎名古屋大学, 工学研究科, 教授 (40335146)
研究分担者	花田博幸国立研究開発法人理化学研究所, 革新知能統合研究センター, 研究員 (00793035) 寺田吉壱大阪大学, 大学院基礎工学研究科, 准教授 (10738793) 稲津佑名古屋工業大学, 工学(系)研究科(研究院), 助教 (20869896) 本谷秀堅名古屋工業大学, 工学(系)研究科(研究院), 教授 (60282688) 津田宏治東京大学, 大学院新領域創成科学研究科, 教授 (90357517)
研究期間 (年度)	2020-04-01 – 2025-03-31
研究課題ステータス	交付 (2024年度)
配分額 *注記	43,290千円 (直接経費: 33,300千円、間接経費: 9,990千円) 2024年度: 6,110千円 (直接経費: 4,700千円、間接経費: 1,410千円) 2023年度: 10,010千円 (直接経費: 7,700千円、間接経費: 2,310千円) 2022年度: 10,010千円 (直接経費: 7,700千円、間接経費: 2,310千円) 2021年度: 10,920千円 (直接経費: 8,400千円、間接経費: 2,520千円) 2020年度: 6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
キーワード	機械学習 / データサイエンス / 統計的仮説検定 / 統計科学 / 人工知能 / 選択的推論 / 生命科学 / 教師なし学習 / 統計的推測 / 医療情報学
研究開始時の研究の概要	機械学習などのデータ科学に基づく科学研究はデータ駆動型科学と呼ばれ，データ分析によって仮説を自動生成するため，研究者の知識や経験からは想起できないような新しい仮説を生み出せる可能性がある．しかし，複雑なデータを複雑なアルゴリズムで分析して得られる「データ駆動型仮説」はデータに過剰に適合している可能性があり，信頼性評価が難しい．生命医療分野など誤った判断のもたらすリスクが大きい場合，データ駆動型仮説の信頼性を適切に評価する枠組が不可欠である．本研究では，探索的データ分析によって得られたデータ駆動型仮説の信頼性評価を行う方法を開発する．
研究実績の概要	機械学習などのデータ分析技術を利用する科学研究のアプローチはデータ駆動型科学と呼ばれさまざまな分野で有望視されている．データ駆動型科学では研究対象に関するデータを分析することによって科学的仮説を生成するため，従来のアプローチでは思いつかないような仮説を生み出せる可能性がある．一方，複雑なデータを複雑なアルゴリズムで分析して得られた仮説の信頼性を評価するのは難しい．特に，教師なし学習と呼ばれる探索的なデータ分析によって仮説が生成される場合，信頼性を保証する方法は確立されていない．特に，生命医療分野など，誤った判断のもたらすリスクが大きい状況ではデータ駆動型仮説の信頼性を確保することが不可欠である．本研究では，探索的データ分析によって得られたデータ駆動型仮説の信頼性を定量化する数理・情報基盤を構築し，その有用性を生命医療分野において実証する．教師なし学習アルゴリズムが強力であればあるほど（データへの適合力が大きければ大きいほど），有望な仮説が生成できる可能性が高まる一方，仮説選択バイアスも大きくなってしまう．データ駆動型仮説の信頼性保証は，仮説選択バイアスを正しく定量化し，その補正を行うことによって実現できる．本研究では仮説選択バイアスを適切に補正し，アルゴリズムが仮説を生成したという条件のもとで統計的推論（仮説検定の枠組による偽陽性率（p値）や信頼区間の計算）を行う方法を確立する．2023年度は，深層生成モデルによって生成された仮説に対する信頼性保証を行うための選択的推論の理論構築，アルゴリズム開発にとりくんだ．特に，開発した方法を異常検知の問題へ適用した．生成モデルを用いた異常検知では，異常を含む画像から正常画像を生成し，その差分によって異常を同定することができるが，開発した方法を用いると，この異常検知の結果に対して理論的妥当性を持つp値を計算することができる．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由 2023年度は，方法面では，前年度に引き続き，深層学習によって駆動される知識の信頼性評価法を選択的推論の枠組で発展させた．これまでは，予測のための深層学習モデルを対象としてきたが，今年度の研究では，生成のための深層学習モデルを対象とした．特に，開発した方法を異常検知の問題へ適用した．生成モデルを用いた異常検知では，異常を含む画像から正常画像を生成し，その差分によって異常を同定することができるが，開発した方法を用いると，この異常検知の結果に対して理論的妥当性を持つp値を計算することができる利点を持つ．本研究に関連する成果は，機械学習や関連分野の難関国際会議であるICMLなどに採択され，国内外から注目を集めている．
今後の研究の推進方策	2024年度以降も，選択的推論を基軸とし，方法面の発展と適用先の開拓を並列して実施する予定である．特に、Diffusion Modelなどの深層生成モデルに対する選択的推論を行えるように適用範囲を拡げること、また，実装コストを減らすためのライブラリ開発にに取り組む。また、新たな問題設定として、ドメイン適応後のデータ分析に対する選択的推論の理論構築，アルゴリズム開発，ソフトウェア設計を行う．

報告書

(5件)

研究成果
(37件)

すべて 2024 2023 2022 2021 2020

すべて雑誌論文 (23件) (うち国際共著 5件、査読あり 23件、オープンアクセス 17件) 学会発表 (14件) (うち国際学会 13件、招待講演 1件)

[雑誌論文] A Confidence Machine for Sparse High-Order Interaction Model2024
- 著者名/発表者名
  Das D., Ndiaye E. and Takeuchi I.
- 雑誌名
  
  Stat
  
  巻: -
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Case-based Similar Image Retrieval for Weakly Annotated Large Histopathological Images of Malignant Lymphoma Using Deep Metric Learning2023
- 著者名/発表者名
  Hashimoto N., Takagi Y., Masuda H., Miyoshi H., Kohno K., Nagaishi M., Sato K., Takeuchi M., Furuta T., Kawamoto K., Yamada K., Moritsubo M., Inoue K., Shimasaki Y., Ogura Y., Imamoto T., Mishina T., Tanaka K., Kawaguchi Y., Nakamura S., Ohshima K., Hontani H., Takeuchi I.
- 雑誌名
  
  Medical Image Analysis
  
  巻: -
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Generalized Low-Rank Update: Model Parameter Bounds for Low-Rank Training Data Modifications2023
- 著者名/発表者名
  Hanada H., Hashimoto N., Taji K. and Takeuchi I.
- 雑誌名
  
  Neural Computation
  
  巻: -
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Root-finding Approaches for Computing Conformal Prediction Set.2022
- 著者名/発表者名
  Ndiaye E., Takeuchi I.
- 雑誌名
  
  Machine Learning
  
  巻: -
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] More Powerful Conditional Selective Inference for Generalized Lasso by Parametric Programming.2022
- 著者名/発表者名
  Duy V.N.L., Takeuchi I.
- 雑誌名
  
  Journal of Machine Learning Research
  
  巻: -
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Conditional Selective Inference for Robust Regression and Outlier Detection using Piecewise-Linear Homotopy Continuation.2022
- 著者名/発表者名
  Tsukurimichi T., Inatsu Y., Duy V.N.L., Takeuchi I.
- 雑誌名
  
  Annals of Institute of Statistical Mathematics
  
  巻: -
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Subtype Classification of Malignant Lymphoma Using Immunohistochemical Staining Pattern2022
- 著者名/発表者名
  Noriaki Hashimoto, Kaho Ko, Tatsuya Yokota, Kei Kohno, Masato Nakaguro, Shigeo Nakamura, Ichiro Takeuchi, Hidekata Hontani
- 雑誌名
  
  International Journal of Computer Assisted Radiology and Surgery
  
  巻: 17
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Fast and More Powerful Selective Inference for Sparse High-order Interaction Model2022
- 著者名/発表者名
  Diptesh Das, Vo Nguyen Le Duy, Hiroyuki Hanada, Koji Tsuda, Ichiro Takeuchi
- 雑誌名
  
  Proceedings of AAAI Conference on Artificial Intelligence (AAAI2022)
  
  巻: NA
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Bayesian Quadrature Optimization for Probability Threshold Robustness Measure2021
- 著者名/発表者名
  Shogo Iwazaki, Yu Inatsu, Ichiro Takeuchi
- 雑誌名
  
  Neural Computation
  
  巻: 33 ページ: 3413-3466
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] Distance Metric Learning for Graph Structured Data2021
- 著者名/発表者名
  Tomoki Yoshida, Ichiro Takeuchi, Masayuki Karasuyama
- 雑誌名
  
  Machine Learning
  
  巻: 110 ページ: 1765-1811
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] Parametric Programming Approach for More Powerful and General Lasso Selective Inference2021
- 著者名/発表者名
  Vo Nguyen Le Duy, Ichiro Takeuchi
- 雑誌名
  
  Proceedings of International Conference on Artifical Intelligence and Statistics (AISTATS2021)
  
  巻: NA
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Mean-Variance Analysis in Bayesian Optimization under Uncertainty2021
- 著者名/発表者名
  Shogo Iwazaki, Yu Inatsu, Ichiro Takeuchi
- 雑誌名
  
  Proceedings of International Conference on Artifical Intelligence and Statistics (AISTATS2021)
  
  巻: NA
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Active Learning for Distributionally Robust Level-Set Estimation2021
- 著者名/発表者名
  Yu Inatsu, Shogo Iwazaki, Ichiro Takeuchi
- 雑誌名
  
  Proceedings of International Conference on Machine Learning 2021 (ICML2021)
  
  巻: NA
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] More Powerful and General Selective Inference for Stepwise Feature Selection using Homotopy Method2021
- 著者名/発表者名
  Kazuya Sugiyama, Vo Nguyen Le Duy, Ichiro Takeuchi
- 雑誌名
  
  Proceedings of International Conference on Machine Learning 2021 (ICML2021)
  
  巻: NA
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Exploration of natural red-shifted rhodopsins using a machine learning-based Bayesian experimental design2021
- 著者名/発表者名
  Inoue Keiichi、Karasuyama Masayuki、Nakamura Ryoko、Konno Masae、Yamada Daichi、Mannen Kentaro、Nagata Takashi、Inatsu Yu、Yawo Hiromu、Yura Kei、Beja Oded、Kandori Hideki、Takeuchi Ichiro
- 雑誌名
  
  Communications Biology
  
  巻: 4 号: 1 ページ: 362-362
- DOI
  10.1038/s42003-021-01878-9
- 関連する報告書
  2020 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Selective inference for high-order interaction features selected in a stepwise manner2021
- 著者名/発表者名
  Shinya Suzumura, Kazuya Nakagawa, Yuta Umezu, Koji Tsuda, Ichiro Takeuchi
- 雑誌名
  
  IPSJ Transactions on Bioinformatics
  
  巻: 14 号: 0 ページ: 1-11
- DOI
  10.2197/ipsjtbio.14.1
- NAID
  130007985966
- 関連する報告書
  2020 実績報告書
- 査読あり
[雑誌論文] Bayesian Experimental Design for Finding Reliable Level Set under Input Uncertainty2020
- 著者名/発表者名
  Shogo Iwazaki, Yu Inatsu, Ichiro Takeuchi.
- 雑誌名
  
  IEEE Access
  
  巻: 8 ページ: 203982-203993
- DOI
  10.1109/access.2020.3036863
- 関連する報告書
  2020 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Computing Valid p-value for Optimal Changepoint by Selective Inference using Dynamic Programming.2020
- 著者名/発表者名
  Vo Nguyen Le Duy, Hiroki Toda, Ryota Sugiyama, Ichiro Takeuchi
- 雑誌名
  
  Proceedings of 34th Conference on Neural Information Processing Systems (NeurIPS2020)
  
  巻: NA
- 関連する報告書
  2020 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Active Learning for Level Set Estimation Under Input Uncertainty and Its Extensions2020
- 著者名/発表者名
  Yu Inatsu, Masayuki Karasuyama, Keiichi Inoue, Ichiro Takeuchi
- 雑誌名
  
  Neural Computation
  
  巻: 32 号: 12 ページ: 2486-2531
- DOI
  10.1162/neco_a_01332
- 関連する報告書
  2020 実績報告書
- 査読あり
[雑誌論文] Active Learning of Bayesian Linear Models with High-Dimensional Binary Features by Parameter Confidence-Region Estimation2020
- 著者名/発表者名
  Inatsu Yu、Karasuyama Masayuki、Inoue Keiichi、Kandori Hideki、Takeuchi Ichiro
- 雑誌名
  
  Neural Computation
  
  巻: 32 号: 10 ページ: 1998-2031
- DOI
  10.1162/neco_a_01310
- 関連する報告書
  2020 実績報告書
- 査読あり
[雑誌論文] Active Learning for Enumerating Local Minima Based on Gaussian Process Derivatives2020
- 著者名/発表者名
  Inatsu Yu、Sugita Daisuke、Toyoura Kazuaki、Takeuchi Ichiro
- 雑誌名
  
  Neural Computation
  
  巻: 32 号: 10 ページ: 2032-2068
- DOI
  10.1162/neco_a_01307
- 関連する報告書
  2020 実績報告書
- 査読あり
[雑誌論文] Computing Valid P-Values for Image Segmentation by Selective Inference2020
- 著者名/発表者名
  Tanizaki Kosuke、Hashimoto Noriaki、Inatsu Yu、Hontani Hidekata、Takeuchi Ichiro
- 雑誌名
  
  Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition 2020 (CVPR2020)
  
  巻: - ページ: 9550-9559
- DOI
  10.1109/cvpr42600.2020.00957
- 関連する報告書
  2020 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Multi-scale Domain-adversarial Multiple-instance CNN for Cancer Subtype Classification with Unannotated Histopathological Images2020
- 著者名/発表者名
  Hashimoto Noriaki、Fukushima Daisuke、Koga Ryoichi、Takagi Yusuke、Ko Kaho、Kohno Kei、Nakaguro Masato、Nakamura Shigeo、Hontani Hidekata、Takeuchi Ichiro
- 雑誌名
  
  Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition 2020 (CVPR2020)
  
  巻: - ページ: 3851-3860
- DOI
  10.1109/cvpr42600.2020.00391
- 関連する報告書
  2020 実績報告書
- 査読あり / オープンアクセス
[学会発表] Multi-objective Bayesian Optimization with Active Preference Learning2024
- 著者名/発表者名
  Ozaki R., Ishikawa K., Kanzaki Y., Takeno S., Takeuchi I., Karasuyama M.
- 学会等名
  AAAI Conference on Artificial Intelligence
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] A Stopping Criterion for Bayesian Optimization by The Gap of Expected Minimum Simple Regrets2023
- 著者名/発表者名
  Ishibashi H., Karasuyama M., Takeuchi I., Hino H.
- 学会等名
  The International Conference on AI and Statistics
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Valid P-Value for Deep Learning-driven Salient Region2023
- 著者名/発表者名
  Miwa D., Duy V.N.L., Takeuchi I.
- 学会等名
  International Conference on Learning Representation
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Quantifying Statistical Significance of Neural Network-based Image Segmentation by Selective Inference.2022
- 著者名/発表者名
  Duy V.N.L., Iwazaki S., Takeuchi I.
- 学会等名
  Neural Information Processing Systems (NeurIPS)
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Bayesian Optimization for Distributionally Robust Chance-constrained Problem.2022
- 著者名/発表者名
  Inatsu Y., Takeno S., Karasuyama M., Takeuchi I.
- 学会等名
  International Conference on Machine Learning (ICML)
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Fast and More Powerful Selective Inference for Sparse High-order Interaction Model2022
- 著者名/発表者名
  Diptesh Das, Vo Nguyen Le Duy, Hiroyuki Hanada, Koji Tsuda, Ichiro Takeuchi
- 学会等名
  AAAI Conference on Artificial Intelligence (AAAI2022)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Parametric Programming Approach for More Powerful and General Lasso Selective Inference2021
- 著者名/発表者名
  Vo Nguyen Le Duy, Ichiro Takeuchi
- 学会等名
  International Conference on Artifical Intelligence and Statistics (AISTATS2021)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Mean-Variance Analysis in Bayesian Optimization under Uncertainty2021
- 著者名/発表者名
  Shogo Iwazaki, Yu Inatsu, Ichiro Takeuchi
- 学会等名
  International Conference on Artifical Intelligence and Statistics (AISTATS2021)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] More Powerful and General Selective Inference for Stepwise Feature Selection using Homotopy Method2021
- 著者名/発表者名
  Kazuya Sugiyama, Vo Nguyen Le Duy, Ichiro Takeuchi
- 学会等名
  International Conference on Machine Learning 2021 (ICML2021)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Active Learning for Distributionally Robust Level-Set Estimation2021
- 著者名/発表者名
  Yu Inatsu, Shogo Iwazaki, Ichiro Takeuchi
- 学会等名
  International Conference on Machine Learning 2021 (ICML2021)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] パラメトリック計画法による選択的推論とその応用2020
- 著者名/発表者名
  竹内一郎
- 学会等名
  電子情報通信学会IBISML研究会
- 関連する報告書
  2020 実績報告書
- 招待講演
[学会発表] Computing Valid p-value for Optimal Changepoint by Selective Inference using Dynamic Programming.2020
- 著者名/発表者名
  Vo Nguyen Le Duy, Hiroki Toda, Ryota Sugiyama, Ichiro Takeuchi
- 学会等名
  34th Conference on Neural Information Processing Systems (NeurIPS2020)
- 関連する報告書
  2020 実績報告書
- 国際学会
[学会発表] Computing Valid P-values for Image Segmentation by Selective Inference.2020
- 著者名/発表者名
  Kosuke Tanizaki, Noriaki Hashimoto, Yu Inatsu, Hidekata Hontani, Ichiro Takeuchi
- 学会等名
  IEEE/CVF Conference on Computer Vision and Pattern Recognition 2020 (CVPR2020)
- 関連する報告書
  2020 実績報告書
- 国際学会
[学会発表] Multi-scale Domain-adversarial Multiple-instance CNN for Cancer Subtype Classification with Non-annotated Histopathological Images2020
- 著者名/発表者名
  Noriaki Hashimoto, Daisuke Fukushima, Ryoichi Koga, Yusuke Takagi, Kaho Ko, Kei Kohno, Masato Nakaguro, Shigeo Nakamura, Hidekata Hontani, Ichiro Takeuchi
- 学会等名
  IEEE/CVF Conference on Computer Vision and Pattern Recognition 2020 (CVPR2020)
- 関連する報告書
  2020 実績報告書
- 国際学会

探索的分析によるデータ駆動型仮説の信頼性評価法の確立と生命科学分野における実証

研究代表者

竹内 一郎 名古屋大学, 工学研究科, 教授 (40335146)

43,290千円 (直接経費: 33,300千円、間接経費: 9,990千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] A Confidence Machine for Sparse High-Order Interaction Model2024

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Case-based Similar Image Retrieval for Weakly Annotated Large Histopathological Images of Malignant Lymphoma Using Deep Metric Learning2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Generalized Low-Rank Update: Model Parameter Bounds for Low-Rank Training Data Modifications2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Root-finding Approaches for Computing Conformal Prediction Set.2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] More Powerful Conditional Selective Inference for Generalized Lasso by Parametric Programming.2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Conditional Selective Inference for Robust Regression and Outlier Detection using Piecewise-Linear Homotopy Continuation.2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Subtype Classification of Malignant Lymphoma Using Immunohistochemical Staining Pattern2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Fast and More Powerful Selective Inference for Sparse High-order Interaction Model2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Bayesian Quadrature Optimization for Probability Threshold Robustness Measure2021

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Distance Metric Learning for Graph Structured Data2021

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Parametric Programming Approach for More Powerful and General Lasso Selective Inference2021

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Mean-Variance Analysis in Bayesian Optimization under Uncertainty2021

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Active Learning for Distributionally Robust Level-Set Estimation2021

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] More Powerful and General Selective Inference for Stepwise Feature Selection using Homotopy Method2021

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Exploration of natural red-shifted rhodopsins using a machine learning-based Bayesian experimental design2021

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Selective inference for high-order interaction features selected in a stepwise manner2021

著者名/発表者名

雑誌名

DOI

NAID

関連する報告書

[雑誌論文] Bayesian Experimental Design for Finding Reliable Level Set under Input Uncertainty2020

著者名/発表者名

雑誌名

DOI

関連する報告書

竹内一郎名古屋大学, 工学研究科, 教授 (40335146)