ベイズ推定による信頼度評価を伴った特徴量選択手法の開発

研究課題

研究課題/領域番号	20J21749
研究種目	特別研究員奨励費
配分区分	補助金
応募区分	国内
審査区分	小区分61040:ソフトコンピューティング関連
研究機関	東京大学
研究代表者	大日方孝輝東京大学, 理学系研究科, 特別研究員(DC1)
研究期間 (年度)	2020-04-24 – 2023-03-31
研究課題ステータス	完了 (2022年度)
配分額 *注記	2,500千円 (直接経費: 2,500千円) 2022年度: 800千円 (直接経費: 800千円) 2021年度: 800千円 (直接経費: 800千円) 2020年度: 900千円 (直接経費: 900千円)
キーワード	ベイズ推論 / 特徴量選択 / 信頼度評価 / ベイズモデル平均化 / 全状態探索 / モンテカルロ法
研究開始時の研究の概要	本研究は，データを説明する特徴量の中から，目的変数を説明するために重要な特徴量を，信頼度評価を伴った形で選択する手法を開発するものである．信頼度評価を行うためにベイズ推論の枠組みを利用し，全状態探索を拡張したベイズモデル平均化を用いた特徴量選択手法の開発を目指す．手法開発は解析計算が可能な状況から始め，解析計算が難しい状況へと拡張する．開発した手法を材料科学や地球科学の実データへ適用することで，実データに対する有効性を検証する．
研究実績の概要	本研究では信頼度評価を伴った特徴量選択手法の開発を目指している。本年度は昨年度より取り組んでいた実データへの適用事例を論文として発表し、また、高次元データへと手法を拡張する研究を進めた。特徴量選択とは予測モデルの特徴量の中から予測に重要な特徴量集合を探し出す手法であり、機械学習モデル構築における重要な技術の1つである。特徴量選択は計算コストの削減だけでなく、予測モデルの解釈性を向上させ、知識の抽出にも繋がる。機械学習の応用を進める上では精度だけでなく、機械学習モデルの推論の信頼度を評価することも重要となる。特徴量選択に関しては、選択の信頼度を評価することで、信頼度の低い結果を専門家が誤った方向へ解釈することを防ぐことが可能となる。先行研究においては、全てのモデル候補を評価する全状態探索の結果から定性的に特徴量選択の不確実性を評価する手法が用いられていた。本研究では、ベイズモデル平均化を用いて全状態探索の結果から定量的に特徴量選択の信頼度を評価する手法に昨年度から取り組んでおり、本年度、蓄電池探索の問題へと適用した研究が査読付き雑誌に掲載された。また数値計算研究の再現性の担保及び本手法の幅広い活用を目指して、同研究で用いたプログラムコードをオープンソースソフトウェアとして公開した。本年度は非線形高次元特徴量空間における特徴量選択の信頼度評価にも取り組んだ。全状態探索の結果から性能指標に関する頻度分布を取ることで、モデル空間の状態密度(DoS)を評価することが可能となる。高次元空間においては全モデルを評価することが困難となるため、サンプリングによりDoSを推定する手法を開発した。開発手法を結晶構造予測問題に適用することで、先行研究で選ばれたモデルと同程度の性能を持つモデルが多数存在することを示し、先行研究の結果が有意とは言えないことを明らかにした。
現在までの達成度 (段落)	令和4年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和4年度が最終年度であるため、記入しない。

報告書

(3件)

研究成果
(6件)

すべて 2023 2022 2021 その他

すべて雑誌論文 (1件) (うち査読あり 1件、オープンアクセス 1件) 学会発表 (3件) (うち国際学会 1件) 備考 (2件)

[雑誌論文] Data integration for multiple alkali metals in predicting coordination energies based on Bayesian inference2022
- 著者名/発表者名
  Koki Obinata, Tomofumi Nakayama, Atsushi Ishikawa, Keitaro Sodeyama, Kenji Nagata, Yasuhiko Igarashi and Masato Okada
- 雑誌名
  
  Science and Technology of Advanced Materials: Methods
  
  巻: 2 号: 1 ページ: 355-364
- DOI
  10.1080/27660400.2022.2108353
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[学会発表] 状態密度に基づく特徴量合成アプローチの信頼度評価2023
- 著者名/発表者名
  大日方孝輝,五十嵐康彦,永田賢二,袖山慶太郎,岡田真人
- 学会等名
  日本物理学会　2023年春季大会
- 関連する報告書
  2022 実績報告書
[学会発表] 状態密度に基づく特徴量合成アプローチの有意性評価2022
- 著者名/発表者名
  大日方孝輝,五十嵐康彦,永田賢二,袖山慶太郎,岡田真人
- 学会等名
  第25回情報論的学習理論ワークショップ (IBIS2022)
- 関連する報告書
  2022 実績報告書
[学会発表] Variable selection with confidence evaluation based on Bayesian model averaging2021
- 著者名/発表者名
  Koki Obinata
- 学会等名
  Materials Research Meeting 2021 (MRM2021)
- 関連する報告書
  2021 実績報告書
- 国際学会
[備考] 岡田真人研究室　研究室メンバーページ
- URL
  http://mns.k.u-tokyo.ac.jp/obinata/
- 関連する報告書
  2021 実績報告書
[備考] 岡田真人研究室　研究室メンバーページ
- URL
  http://mns.k.u-tokyo.ac.jp/~obinata/
- 関連する報告書
  2020 実績報告書

ベイズ推定による信頼度評価を伴った特徴量選択手法の開発

研究代表者

大日方 孝輝 東京大学, 理学系研究科, 特別研究員(DC1)

2,500千円 (直接経費: 2,500千円)

報告書

研究成果

[雑誌論文] Data integration for multiple alkali metals in predicting coordination energies based on Bayesian inference2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] 状態密度に基づく特徴量合成アプローチの信頼度評価2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 状態密度に基づく特徴量合成アプローチの有意性評価2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Variable selection with confidence evaluation based on Bayesian model averaging2021

著者名/発表者名

学会等名

関連する報告書

[備考] 岡田真人研究室 研究室メンバーページ

URL

関連する報告書

[備考] 岡田真人研究室 研究室メンバーページ

URL

関連する報告書

大日方孝輝東京大学, 理学系研究科, 特別研究員(DC1)

[備考] 岡田真人研究室　研究室メンバーページ

[備考] 岡田真人研究室　研究室メンバーページ