集合データとは、1つのデータ(事例)が特徴の多重集合によって構成されるデータで、機械学習モデルの入力として頻繁に現れる。例えば、文書を単語やNグラムの多重集合で表現したものが集合データである。その他にも、生物情報学では、タンパク質を部分構造の集合で表現したり、グループに対する推薦システムでは、個人の集合をグループとして表現したりしており、集合データが入力の機械学習モデルの適用範囲は極めて広い。 機械学習が幅広く実用化されていくとともに、機械学習モデルが出力する予測結果の根拠を人間が解釈できるようにすることが社会から求められるようになってきた。本研究課題では、当初よりどのような機械学習フレームワークが必要か検討してきたが、そのような需要を踏まえて、本研究課題では解釈可能な予測結果を出力できる機械学習フレームワークの開発に焦点を絞ることとした。 研究期間最終年は、これまでに開発した高精度の予測と予測の解釈可能性を両立する機械学習モデルの研究について実験を積み重ねて、その有効性を確認した。その結果をまとめた論文を2本執筆し、国際論文誌に掲載された。
|