• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Research-status Report

A Study on Statistical Interpretation Methods for Machine Learning Results Using Shapley Values

Research Project

Project/Area Number 20K11938
Research InstitutionKumamoto University

Principal Investigator

野原 康伸  熊本大学, 大学院先端科学研究部(工), 特任准教授 (30624829)

Project Period (FY) 2020-04-01 – 2024-03-31
Keywords機械学習 / 解釈手法 / シャプレー値
Outline of Annual Research Achievements

近年、深層学習をはじめとする機械学習技術が注目され導入が進められつつあるが、なぜそのような結果が得られたかの説明・解釈性が強く求められている。本研究では、予測器の入力と出力の関係に注目してブラックボックス的な機械学習結果を解釈する手法を開発する。開発手法では、経済学の分野で用いられている「複数人が協同した場合の利益の公平分配方法であるシャプレー値」を応用することで、数千にもおよぶ各説明変数が出力に及ぼす影響を線形和の形で適切に分離し、線形モデル等を前提として構築されている仮説検定や信頼区間といった統計学的な解釈手法をブラックボックスモデルに適用できるようにすることを目的とする。
今年度は、機械学習モデルの解釈手法であるSHAPについて、交互作用項との関連について主に検討を進めた。複数の変数の組み合わせによる交互作用は、アウトカムに大きな影響を与えることがあり、機械学習モデルを理解するのに重要である。これまでのSHAP解析では、説明変数単体がアウトカムに与える影響と、説明変数同士の交互作用をまとめて評価していた。SHAP導出アルゴリズムを改良し、説明変数単体がアウトカムに与える影響と説明変数同士の交互作用を分離して機械学習モデルを解釈する手法を提案した。改良手法を九州大学病院の癌コホートデータ(N=29080)に適用し、どのような要因の組み合わせが癌発生リスクに寄与しているのかを解析した。その結果、ビリルビン高値による大腸癌発症リスクの減少は、高齢者ほど特に効果が大きいことが分かった。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

これまで機械学習モデルの解釈手法であるSHAPについて、変数重要度の計算方法の改善及び変数グループ化という新たな解析手法を開発し、交互作用項との関係について議論を行った。これらの成果は、国際会議・論文誌にて発表済みである。
本年度は類似変数の自動グループ化まで実施する予定であったが、類似変数について様々なパターンがあり、各パターンに応じた対策を実施する必要があることが判明したため、計画に遅延が生じた。

Strategy for Future Research Activity

類似変数のパターンについての考察を進め、類似変数の自動グループ化を行うアルゴリズムを開発する。これまでに開発した変数グループ化と合わせることで、当該分野の専門知識がなくても、理解しやすい階層的なモデルを構築することができ、試行錯誤の回数を減らした効率的な解析が可能となる。さらに、マニュアル方式のグループ化もできるようにし、当該解析分野における専門知識を用いたより精緻なモデルを構築可能とする。
また、シャプレー値を活用して構築した階層モデルに対して、線形性の前提を基に構築された各種統計的手法の適用を検討する。仮説検定や信頼区間、p値といった統計的解釈手法をどのように修正すればブラックボックスモデルに適用できるかを明らかにする。

Causes of Carryover

国際学会の出張費を計上していたが、新型コロナウィルスの影響により全てオンライン開催となったため、出張費が不要となった。
残高についてはGPUについては毎年の向上性能が著しいため、GPUの追加やアップグレード費用等として使用する予定である。また、各国の入国制限も緩和されつつあるため、国際会議への参加も検討している。

  • Research Products

    (7 results)

All 2022 2021

All Journal Article (5 results) (of which Peer Reviewed: 5 results,  Open Access: 2 results) Presentation (2 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] Explanation of Machine Learning Models Using Shapley Additive Explanation and Application for Real Data in Hospital2022

    • Author(s)
      Yasunobu Nohara, Koutarou Matsumoto, Hidehisa Soejima, Naoki Nakashima
    • Journal Title

      Computer Methods and Programs in Biomedicine

      Volume: 214 Pages: -

    • DOI

      10.1016/j.cmpb.2021.106584

    • Peer Reviewed
  • [Journal Article] Machine Learning for Classification of Postoperative Patient Status Using Standardized Medical Data2022

    • Author(s)
      Takanori Yamashita, Yoshifumi Wakata, Hideki Nakaguma, Yasunobu Nohara, Shinj Hato, Susumu Kawamura, Shuko Muraoka, Masatoshi Sugita, Mihoko Okada, Naoki Nakashima, Hidehisa Soejima
    • Journal Title

      Computer Methods and Programs in Biomedicine

      Volume: 214 Pages: -

    • DOI

      10.1016/j.cmpb.2021.106583

    • Peer Reviewed / Open Access
  • [Journal Article] Portable Health Clinic for Sustainable Care of Mothers and Newborns in Rural Bangladesh2021

    • Author(s)
      Kimiyo Kikuchi, Yoko Sato, Rieko Izukura, Mariko Nishikitani, Kiyoko Kato, Seiichi Morokuma, Meherun Nessa, Yasunobu Nohara, Fumihiko Yokota, Ashir Ahmed, Rafiqul Islam Maruf, Naoki Nakashima
    • Journal Title

      Computer Methods and Programs in Biomedicine

      Volume: 207 Pages: -

    • DOI

      10.1016/j.cmpb.2021.106156

    • Peer Reviewed
  • [Journal Article] Association of serum bilirubin levels with risk of cancer development and total death2021

    • Author(s)
      Toyoshi Inoguchi, Yasunobu Nohara, Chinatsu Nojiri and Naoki Nakashima
    • Journal Title

      Scientific Reports

      Volume: 11 Pages: -

    • DOI

      10.1038/s41598-021-92442-2

    • Peer Reviewed / Open Access
  • [Journal Article] 患者状態把握を目的とした機械学習と共起有向グラフによる診療プロセス解析2021

    • Author(s)
      山下 貴範, 若田 好史, 中熊 英貴, 野原 康伸, 岡田 美保子, 中島 直樹, 副島 秀久
    • Journal Title

      医療情報学

      Volume: 41 Pages: 29-37

    • Peer Reviewed
  • [Presentation] Predictors of Intracerebral Hematoma Enlargement Using Brain CT Images in Emergency Medical Care2021

    • Author(s)
      Kazunori Oka, Takumi Hirahara, Yasunobu Nohara, Sozo Inoue, Koichi Arimura, Syoji Kobashi and Koji Iihara
    • Organizer
      5th IEEE International Conference on Cybernetics
    • Int'l Joint Research
  • [Presentation] 交互作用を考慮したSHAPによる機械学習モデルの解釈手法の提案2021

    • Author(s)
      野原 康伸, 井口 登興志, 野尻 千夏, 中島 直樹
    • Organizer
      第41回医療情報学連合大会

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi