2019 Fiscal Year Research-status Report
Constructing Machine Learning Framework for Set Data Based on Kernel Mean Embeddings
Project/Area Number |
18K18112
|
Research Institution | Chiba Institute of Technology |
Principal Investigator |
吉川 友也 千葉工業大学, 人工知能・ソフトウェア技術研究センター, 主任研究員 (30772040)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 機械学習 / カーネル法 / 集合データ / 解釈可能性 |
Outline of Annual Research Achievements |
集合データとは、1つのデータが特徴の多重集合によって構成されるデータで、機械学習モデルの入力として頻繁に現れる。例えば、文書を単語やNグラムの多重集合で表現したものが集合データである。その他にも、生物情報学では蛋白質を部分構造の集合で表現したり、グループに対する推薦システムでは、個人の集合をグループとして表現したりしており、集合データが入力の機械学習モデルの適用範囲は極めて広い。その上で、本研究課題では、モデルの拡張や変更が容易で、ユーザがパラメータ更新則の導出をする必要がなく、モデルパラメータの効率的な学習が可能な、カーネル平均埋め込みに基づく集合データのための機械学習フレームワークを構築することを目的とする。
機械学習が幅広い分野で実用化されていくとともに、機械学習モデルがなぜそのような予測結果を出力したのか解釈可能であることが要求されることが多くなっている。 初年度より、どのような機械学習フレームワークが必要か検討をしてきたが、そのような需要を踏まえて、本研究課題では解釈可能な予測結果を出力できる機械学習フレームワークの構築に焦点を絞ることとする。 その上で、研究期間2年目は、高精度の予測と解釈可能性を両立するために、非線形関数を用いた高精度な予測モデルと解釈が容易な線形モデルを同時に学習するような機械学習モデルの構築を行い、数値実験によってその有効性を確認し、論文投稿を行った。投稿論文のプレプリント版はarXiv (arXiv:2003.06441) で公開済みである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
構築する機械学習フレームワークの方針が決定し、そのフレームワークで取り込む機械学習モデルの研究を行い、論文投稿まで至ったため。
|
Strategy for Future Research Activity |
継続して機械学習フレームワークの実装を行い、研究期間中にコードの公開を目指す。また、新たな機械学習モデルの研究も行い、その手法をフレームワークの一部として公開する予定である。
|
Causes of Carryover |
初年度に購入したワークステーションで十分に実験が行えたため、クラウドコンピューティングのための予算を使用しなかった。国際会議での発表がなく海外出張を行わなかったため、旅費予算を使用しなかった。フレームワーク開発のために人件費を計上していたが、適当な人材が見つからず、研究代表者のみで開発を行ったため、使用しなかった。 次年度は、フレームワーク開発を予定よりも円滑に進めるために、適宜外注などに次年度使用額分を使用する予定である。
|
Research Products
(1 results)