2018 Fiscal Year Research-status Report
Constructing Machine Learning Framework for Set Data Based on Kernel Mean Embeddings
Project/Area Number |
18K18112
|
Research Institution | Chiba Institute of Technology |
Principal Investigator |
吉川 友也 千葉工業大学, 人工知能・ソフトウェア技術研究センター, 主任研究員 (30772040)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 機械学習 / カーネル法 / 集合データ |
Outline of Annual Research Achievements |
集合データとは、1つのデータが特徴の多重集合によって構成されるデータで、機械学習モデルの入力として頻繁に現れる。例えば、文書を単語やNグラムの多重集合で表現したものが集合データである。その他にも、生物情報学では蛋白質を部分構造の集合で表現したり、グループに対する推薦システムでは、個人の集合をグループとして表現したりしており、集合データが入力の機械学習モデルの適用範囲は極めて広い。その上で、本研究課題では、モデルの拡張や変更が容易で、ユーザがパラメータ更新則の導出をする必要がなく、モデルパラメータの効率的な学習が可能な、カーネル平均埋め込みに基づく集合データのための機械学習フレームワークを構築することを目的とする。 研究期間初年度は、既存の機械学習フレームワークの調査を行い、集合データに対する機械学習フレームワークの設計と実装に着手した。既存の機械学習フレームワーク、特に深層学習フレームワークでは、モデルの記述や学習に関してはすでに洗練されたものが多数ある一方で、集合データを扱うモジュールは十分ではない。したがって、新たなフレームワークをゼロから作るのではなく、既存のフレームワークに対して集合データを効率的に扱うためのモジュールを追加する形で、実装を進めているところである。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
フレームワークの実装に関しては、概ね予定通りに進んでいる。 しかし、集合データを効率的に扱う新たなモデルの研究には着手できていないため、やや遅れているとした。
|
Strategy for Future Research Activity |
継続して機械学習フレームワークの実装を行い、2019年度中に構築したフレームワークの公開を目指す。また、集合データを効率的に扱う新たなモデルの研究に着手して論文発表を行い、その手法をフレームワークに組み入れる予定である。
|
Causes of Carryover |
旅費として学会発表のための予算を確保していたが、学会発表を行わなかったため。また、その他としてクラウドコンピューティング使用料を確保していたが、今年度購入した計算機で計算資源が十分に確保できたため。 次年度使用額に関しては、数値実験のクラウドコンピューティング代として使用する。
|