• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実施状況報告書

シャプレー値を用いた機械学習結果の統計学的解釈手法の確立

研究課題

研究課題/領域番号 20K11938
研究機関熊本大学

研究代表者

野原 康伸  熊本大学, 大学院先端科学研究部(工), 特任准教授 (30624829)

研究期間 (年度) 2020-04-01 – 2024-03-31
キーワード機械学習 / 解釈手法 / シャプレー値
研究実績の概要

近年、深層学習をはじめとする機械学習技術が注目され導入が進められつつあるが、なぜそのような結果が得られたかの説明・解釈性が強く求められている。本研究では、予測器の入力と出力の関係に注目してブラックボックス的な機械学習結果を解釈する手法を開発する。開発手法では、経済学の分野で用いられている「複数人が協同した場合の利益の公平分配方法であるシャプレー値」を応用することで、数千にもおよぶ各説明変数が出力に及ぼす影響を線形和の形で適切に分離し、線形モデル等を前提として構築されている仮説検定や信頼区間といった統計学的な解釈手法をブラックボックスモデルに適用できるようにすることを目的とする。
今年度は、機械学習モデルの解釈手法であるSHAPについて、交互作用項との関連について主に検討を進めた。複数の変数の組み合わせによる交互作用は、アウトカムに大きな影響を与えることがあり、機械学習モデルを理解するのに重要である。これまでのSHAP解析では、説明変数単体がアウトカムに与える影響と、説明変数同士の交互作用をまとめて評価していた。SHAP導出アルゴリズムを改良し、説明変数単体がアウトカムに与える影響と説明変数同士の交互作用を分離して機械学習モデルを解釈する手法を提案した。改良手法を九州大学病院の癌コホートデータ(N=29080)に適用し、どのような要因の組み合わせが癌発生リスクに寄与しているのかを解析した。その結果、ビリルビン高値による大腸癌発症リスクの減少は、高齢者ほど特に効果が大きいことが分かった。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

これまで機械学習モデルの解釈手法であるSHAPについて、変数重要度の計算方法の改善及び変数グループ化という新たな解析手法を開発し、交互作用項との関係について議論を行った。これらの成果は、国際会議・論文誌にて発表済みである。
本年度は類似変数の自動グループ化まで実施する予定であったが、類似変数について様々なパターンがあり、各パターンに応じた対策を実施する必要があることが判明したため、計画に遅延が生じた。

今後の研究の推進方策

類似変数のパターンについての考察を進め、類似変数の自動グループ化を行うアルゴリズムを開発する。これまでに開発した変数グループ化と合わせることで、当該分野の専門知識がなくても、理解しやすい階層的なモデルを構築することができ、試行錯誤の回数を減らした効率的な解析が可能となる。さらに、マニュアル方式のグループ化もできるようにし、当該解析分野における専門知識を用いたより精緻なモデルを構築可能とする。
また、シャプレー値を活用して構築した階層モデルに対して、線形性の前提を基に構築された各種統計的手法の適用を検討する。仮説検定や信頼区間、p値といった統計的解釈手法をどのように修正すればブラックボックスモデルに適用できるかを明らかにする。

次年度使用額が生じた理由

国際学会の出張費を計上していたが、新型コロナウィルスの影響により全てオンライン開催となったため、出張費が不要となった。
残高についてはGPUについては毎年の向上性能が著しいため、GPUの追加やアップグレード費用等として使用する予定である。また、各国の入国制限も緩和されつつあるため、国際会議への参加も検討している。

  • 研究成果

    (7件)

すべて 2022 2021

すべて 雑誌論文 (5件) (うち査読あり 5件、 オープンアクセス 2件) 学会発表 (2件) (うち国際学会 1件)

  • [雑誌論文] Explanation of Machine Learning Models Using Shapley Additive Explanation and Application for Real Data in Hospital2022

    • 著者名/発表者名
      Yasunobu Nohara, Koutarou Matsumoto, Hidehisa Soejima, Naoki Nakashima
    • 雑誌名

      Computer Methods and Programs in Biomedicine

      巻: 214 ページ: -

    • DOI

      10.1016/j.cmpb.2021.106584

    • 査読あり
  • [雑誌論文] Machine Learning for Classification of Postoperative Patient Status Using Standardized Medical Data2022

    • 著者名/発表者名
      Takanori Yamashita, Yoshifumi Wakata, Hideki Nakaguma, Yasunobu Nohara, Shinj Hato, Susumu Kawamura, Shuko Muraoka, Masatoshi Sugita, Mihoko Okada, Naoki Nakashima, Hidehisa Soejima
    • 雑誌名

      Computer Methods and Programs in Biomedicine

      巻: 214 ページ: -

    • DOI

      10.1016/j.cmpb.2021.106583

    • 査読あり / オープンアクセス
  • [雑誌論文] Portable Health Clinic for Sustainable Care of Mothers and Newborns in Rural Bangladesh2021

    • 著者名/発表者名
      Kimiyo Kikuchi, Yoko Sato, Rieko Izukura, Mariko Nishikitani, Kiyoko Kato, Seiichi Morokuma, Meherun Nessa, Yasunobu Nohara, Fumihiko Yokota, Ashir Ahmed, Rafiqul Islam Maruf, Naoki Nakashima
    • 雑誌名

      Computer Methods and Programs in Biomedicine

      巻: 207 ページ: -

    • DOI

      10.1016/j.cmpb.2021.106156

    • 査読あり
  • [雑誌論文] Association of serum bilirubin levels with risk of cancer development and total death2021

    • 著者名/発表者名
      Toyoshi Inoguchi, Yasunobu Nohara, Chinatsu Nojiri and Naoki Nakashima
    • 雑誌名

      Scientific Reports

      巻: 11 ページ: -

    • DOI

      10.1038/s41598-021-92442-2

    • 査読あり / オープンアクセス
  • [雑誌論文] 患者状態把握を目的とした機械学習と共起有向グラフによる診療プロセス解析2021

    • 著者名/発表者名
      山下 貴範, 若田 好史, 中熊 英貴, 野原 康伸, 岡田 美保子, 中島 直樹, 副島 秀久
    • 雑誌名

      医療情報学

      巻: 41 ページ: 29-37

    • 査読あり
  • [学会発表] Predictors of Intracerebral Hematoma Enlargement Using Brain CT Images in Emergency Medical Care2021

    • 著者名/発表者名
      Kazunori Oka, Takumi Hirahara, Yasunobu Nohara, Sozo Inoue, Koichi Arimura, Syoji Kobashi and Koji Iihara
    • 学会等名
      5th IEEE International Conference on Cybernetics
    • 国際学会
  • [学会発表] 交互作用を考慮したSHAPによる機械学習モデルの解釈手法の提案2021

    • 著者名/発表者名
      野原 康伸, 井口 登興志, 野尻 千夏, 中島 直樹
    • 学会等名
      第41回医療情報学連合大会

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi