2019 Fiscal Year Annual Research Report
Improvements of substructure pattern mining using representation learning.
Project/Area Number |
17K00315
|
Research Institution | Nihon University |
Principal Investigator |
尾崎 知伸 日本大学, 文理学部, 教授 (40365458)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | データマイニング / グラフマイニング / 表現学習 / 分散表現 |
Outline of Annual Research Achievements |
本研究課題は、深層学習と頻出パターン発見を橋渡しする基礎技術を開発することで、両者を深化させることを目的としている。具体的には、分散表現学習技術を用いて各頻出パターンを多様なベクトル空間へと展開することで、低品質かつ理解困難なパターンの大量生成という頻出パターン発見問題が本質的に抱える問題を解決することを目指す。これらのことを目的に、これまでに分散表現に基づく頻出パターンと相関ルールに対する評価関数の開発や、深層学習・分散表現技術を用いたツイート分析技術の開発を行っている。これに加え、今年度は特に応用の面から主に(1)料理レシピを対象とした分散表現の獲得と評価と(2)グラフマイニングを用いた解釈容易モデルの獲得について研究を進めた。 料理レシピの分散表現の獲得に関しては、料理手順のグラフ表現であるレシピフローグラフを対象に、頻繁にみられる手順の塊すなわち頻出部分グラフに対する分散表現の獲得手法を構築した。またこれらを利用し、調理手順全体に対するベクトル表現の獲得を実現している。加えて、画像に対する一般的なベクトル化手法を援用し、レシピに含まれる調理画像系列からそれに対応する分散表現系列を獲得する手法を提案した。料理レシピに対し、順序や繋がりを考慮した複数の分散表現を準備することで、多様な応用に向けての基盤の一部の構築が達成されたと考えている。 グラフマイニングを用いた解釈容易モデルの獲得に関しては、部分グラフを属性とする分類・回帰モデルに対し、いくつかの既存手法を援用することに加え、代表的な解釈性研究の一つである解釈可能決定集合の拡張を行った。具体的には、グラフ構造を考慮した評価関数を複数準備することで、構造を含めたルールの簡潔性と性能を考慮したモデルの抽出を試みている。
|