• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実施状況報告書

シャプレー値を用いた機械学習結果の統計学的解釈手法の確立

研究課題

研究課題/領域番号 20K11938
研究機関熊本大学

研究代表者

野原 康伸  熊本大学, 大学院先端科学研究部(工), 特任准教授 (30624829)

研究期間 (年度) 2020-04-01 – 2024-03-31
キーワード機械学習 / 解釈手法 / シャプレー値
研究実績の概要

近年、深層学習をはじめとする機械学習技術が注目され導入が進められつつあるが、なぜそのような結果が得られたかの説明・解釈性が強く求められている。本研究では、予測器の入力と出力の関係に注目してブラックボックス的な機械学習結果を解釈する手法を開発する。開発手法では、経済学の分野で用いられている「複数人が協同した場合の利益の公平分配方法であるシャプレー値」を応用することで、数千にもおよぶ各説明変数が出力に及ぼす影響を線形和の形で適切に分離し、線形モデル等を前提として構築されている仮説検定や信頼区間といった統計学的な解釈手法をブラックボックスモデルに適用できるようにすることを目的とする。
今年度は、機械学習モデルの解釈手法であるSHAPについて、変数重要度の計算方法の改善、および、変数グループ化という新たな解析手法を開発した。これまで提案されていた変数重要度では、線形モデルで用いられている変数重要度と不整合が出る場合があったが、提案手法により完全に整合性が取れるようになった。また、変数グループ化を用いることで予測モデルの再構築を伴うことなく、複数の説明変数がアウトカムに与える影響を調べることが可能となった。
提案手法を医療実データを用いて構築した機械学習による予測モデルに適用して解釈を行い、従来解釈手法との比較を行った。脳梗塞軽症パスの重症度予測モデルの解析では、A/G比が重症度予測の重要度8位の説明変数として抽出されたほか、変数のグループ化や交互作用項の発見等で従来手法よりモデルの解釈が容易となった。また、複数病院間の診療データに対する予測モデルに対しても提案手法による解釈を行い、寝返り等が長期在院に関連する因子として抽出された。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

・機械学習モデルの解釈手法であるSHAPについて、変数重要度の計算方法の改善及び変数グループ化という新たな解析手法を開発した。交互作用項の抽出と、類似変数の自動グループ化を可能とし、当該分野の専門知識がなくても、理解しやすい階層的なモデルの自動構築につながる成果と考えられる。この成果は、国際会議で発表を行った他、論文誌に投稿中である。
・提案手法の医療実データへの適用は当初の計画以上に進展している。本年度は脳梗塞の予後予測モデルや複数病院間の診療データに対する予測モデルに対して提案手法を適用した解析を行った。この成果により、3本の論文が論文誌で採択された。
・当初予定ではシャプレー値の効率的な計算アルゴリズムの開発を実施する予定であったが、GPUによる高速計算が可能となったため、SHAPの改良と実データへの応用を優先した。効率的な計算アルゴリズムの重要性は当初よりも低下したが、依然として重要なため、次年度以降に繰り下げて実施する予定である。

今後の研究の推進方策

今年度開発した変数グループ化という新たな解析手法を応用し、シャプレー値に基づいて、交互作用項の抽出と、類似変数の自動グループ化を行うアルゴリズムを開発する。これにより、当該分野の専門知識がなくても、理解しやすい階層的なモデルを構築することができ、試行錯誤の回数を減らした効率的な解析が可能となる。さらに、マニュアル方式のグループ化もできるようにし、当該解析分野における専門知識を用いたより精緻なモデルを構築可能とする。
また、シャプレー値を活用して構築した階層モデルに対して、線形性の前提を基に構築された各種統計的手法の適用を検討する。仮説検定や信頼区間、p値といった統計的解釈手法をどのように修正すればブラックボックスモデルに適用できるかを明らかにする。

次年度使用額が生じた理由

深層学習をはじめとする機械学習の計算を効率的に実施するため、複数枚のGPUを搭載した解析用パソコンを購入する予定であったが、別の研究助成で購入したパソコンで代替できたため購入を取りやめた。また、国際学会の出張費を計上していたが、新型コロナウィルスの影響により全てオンライン開催となったため、出張費が不要となった。
残高については、GPUについては毎年の向上性能が著しいため、GPUの追加やアップグレード費用等として使用する予定である。

  • 研究成果

    (5件)

すべて 2021 2020

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (2件) (うち国際学会 2件)

  • [雑誌論文] 患者状態把握を目的とした機械学習と共起有向グラフによる診療プロセス解析2021

    • 著者名/発表者名
      山下 貴範, 若田 好史, 中熊 英貴, 野原 康伸, 岡田 美保子, 中島 直樹, 副島 秀久
    • 雑誌名

      医療情報学

      巻: 41 ページ: 29-37

    • 査読あり
  • [雑誌論文] A functional learning health system in Japan: Experience with processes and information infrastructure toward continuous health improvement2020

    • 著者名/発表者名
      Soejima Hidehisa、Matsumoto Koutarou、Nakashima Naoki、Nohara Yasunobu、Yamashita Takanori、Machida Jiro、Nakaguma Hideki
    • 雑誌名

      Learning Health Systems

      巻: e10252 ページ: 1-12

    • DOI

      10.1002/lrh2.10252

    • 査読あり
  • [雑誌論文] Stroke Prognostic Scores and Data-Driven Prediction of Clinical Outcomes After Acute Ischemic Stroke2020

    • 著者名/発表者名
      Matsumoto Koutarou、Nohara Yasunobu、Soejima Hidehisa、Yonehara Toshiro、Nakashima Naoki、Kamouchi Masahiro
    • 雑誌名

      Stroke

      巻: 51 ページ: 1477~1483

    • DOI

      10.1161/STROKEAHA.119.027300

    • 査読あり
  • [学会発表] Explanation of Machine Learning Models Using Shapley Additive Explanation and Application for Real Data in Hospital2020

    • 著者名/発表者名
      Yasunobu Nohara, Koutarou Matsumoto, Hidehisa Soejima, Naoki Nakashima
    • 学会等名
      11th Biennial Conference of the Asia Pacific Association for Medical Informatics
    • 国際学会
  • [学会発表] Machine Learning for Classification of Postoperative Patient Status Using Standardized Medical Data2020

    • 著者名/発表者名
      Takanori Yamashita, Yoshifumi Wakata, Hideki Nakaguma, Yasunobu Nohara, Shinji Hato, Susumu Kawamura, Shuko Muraoka, Masatoshi Sugita, Mihoko Okada, Naoki Nakashima, Hidehisa Soejima
    • 学会等名
      11th Biennial Conference of the Asia Pacific Association for Medical Informatics
    • 国際学会

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi