2021 Fiscal Year Annual Research Report
ベイズ推定による信頼度評価を伴った特徴量選択手法の開発
Project/Area Number |
20J21749
|
Research Institution | The University of Tokyo |
Principal Investigator |
大日方 孝輝 東京大学, 理学系研究科, 特別研究員(DC1)
|
Project Period (FY) |
2020-04-24 – 2023-03-31
|
Keywords | ベイズ推論 / 特徴量選択 / 信頼度評価 / ベイズモデル平均化 / 全状態探索 |
Outline of Annual Research Achievements |
本研究では全状態探索とベイズモデル平均化に基づいて、信頼度評価を伴った特徴量選択手法の開発を目指している。本年度は昨年度開発した手法を実データへ適用し、その有効性の検証を進めた。また成果を国際学会にて発表し、論文投稿の準備を進めた。 特徴量選択とは予測モデルの特徴量の中から予測に重要な特徴量集合を探し出すことであり、機械学習モデル構築における重要な処理の1つとなっている。特徴量選択は計算コストの削減だけでなく、予測モデルの解釈性向上や、知識の抽出にも繋がる。近年機械学習は分野を問わず広く応用されており、その精度の追求が進められているが、応用を更に進める上では機械学習モデルの予測の信頼度を評価することが重要となる。特徴量選択に関しては、選択の信頼度を評価することで、信頼度の低い結果を専門家が誤った方向へ解釈することを防ぐことが可能となる。 本年度は、前年度研究を進めた全状態探索とベイズモデル平均化による特徴量選択の不確かさ評価の手法を蓄電池の実データに適用した。先行研究で重要とされていた特徴量の信頼度を評価し、高い信頼度で選ばれることを確認した。また、ベイズ推論の考え方に基づき、複数データセットの統合可否を判断する枠組みを適用した。類似の少量データセットが存在するような状況においてデータセットの統合可否を定量的に評価することで、データの活用を促進し、より高度な予測モデルを構築することが可能となる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では、全状態探索とベイズモデル平均化に基づいて、信頼度評価を伴った実応用可能な特徴量選択手法の開発を目的としており、1年目はモデルの事後確率が解析的に計算可能な状況を対象とし、2年目にモデルの事後確率が解析的に計算できない場合への拡張に取り組み、3年目に実データへの応用に取り組む計画である。 本年度は化学分野の研究者との共同研究の機会を頂いたため、当初3年目に取り組む計画であった実データ応用の研究を進めた。前年度研究を進めたモデルの事後確率が解析的に計算可能な状況における特徴量選択手法を蓄電池の実データ解析に適用し、先行研究で選択されていた特徴量の信頼度を評価した。また、ベイズ推論の考え方に基づき、データセットの統合可否を判断する枠組みの研究を進め、これは当初の研究計画を超える進捗となった。これらの研究成果は国際学会(MRM 2021)にて発表し、論文投稿の準備も進めた。 次年度は当初2年目に計画していた、事後確率の解析計算が不可能な場合への手法拡張に取り組む計画である。
|
Strategy for Future Research Activity |
本研究では、1年目に取り組んだモデルの事後確率が解析的に計算可能な状況における手法開発を、2年目にはモデルの事後確率が解析的に計算できない場合へと拡張し、3年目には実データへと応用する計画である。 前年度は当初3年目に計画していた実データへの応用研究を進めたため、本年度は当初2年目に計画していたモデルの事後確率が解析的に計算できない状況への拡張を進める。この手法拡張においては、多変数の数値積分を伴い、計算量がパラメータ数に対して指数関数的に増加する。信頼度推定を伴った特徴量選択手法の開発を目指すにあたり、モデルの事後確率を統計的に不偏な形で推定したいため、モンテカルロ法を用いることで手法拡張を行う計画である。また、特徴量数が多い状況と組み合わさると、モデルの事後確率の計算と、全状態探索の計算との二重構造でモンテカルロ法を実行する必要があるため、計算量の増加が課題となる。そこで計算時間を抑えるために、計算の並列化及びアルゴリズム面の工夫も視野に入れ、計算時間の削減を試みる。 また開発した手法を実応用先の研究者が自由に利用出来るよう、オープンソースソフトウェアとしての公開を進める計画である。
|