2020 Fiscal Year Annual Research Report
パターンマイニングと疎性モデリングに基づく大規模系列データからの知識創出
Project/Area Number |
17H04694
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
烏山 昌幸 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (40628640)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | 機械学習 / 系列データ / グラフデータ / マイニング / 凸最適化 |
Outline of Annual Research Achievements |
2019年度までに系列やグラフデータの部分構造に基づく予測マイニングの基礎方法論を整備してきた.この枠組みにより膨大な部分構造から予測に寄与する見込みのあるものをスクリーニングすることで,最適性を保証しつつ効率的な計算が可能になる.2020年度はこれらをさらに発展させ,さらに多様な問題設定を扱うことができる枠組みを構築してきた.例えば,グラフデータは非常に汎用性の高いデータの表現方法であるが,既存の方法ではグラフの頂点や辺に属性値のついたものを扱うことが難しかった.化合物や結晶のデータならグラフの頂点となる原子に様々な実数値属性が付くことが多く,グラフの接続関係だけでなく属性値も予測に重要な役割を果たし得る.このような属性付きグラフデータから,部分グラフの頂点や辺に,属性値の「区間」を付与した表現により解釈可能な表現を抽出する方法論を構築した.この場合,属性値の空間からどのように重要な区間を見出すかが問題になるが,ここでは区間パターンマイニングと呼ばれる手法と,これまでに本研究課題で構築してきた予測マイニングの枠組みを組み合わせた新たな方法論を構築した.これにより,「ある部分グラフにおいて各頂点の属性値が特定の区間に入った場合」といったより柔軟な特徴表現が現実的な計算量で可能になる.またさらに技術的な発展として,これまでデータに対する仮定としてきた単調性の制限を外す新たな枠組みを構築した.この仮定は不要なパターンを枝刈りするために本質的であったが,現実のデータ解析では必ずしも成立するとは言えないものであった.ここでは,単調性の代わりに,探索の過程に於いてパターンサイズの最大増分が定まることから得られる枝刈り基準を定義することで,最適性の保証を保ったまま提案する枠組みの適用範囲が広げられることを示した.
|
Research Progress Status |
令和2年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和2年度が最終年度であるため、記入しない。
|
-
[Journal Article] Exploration of natural red-shifted rhodopsins using a machine learning-based Bayesian experimental design2021
Author(s)
K. Inoue, M. Karasuyama, R. Nakamura, M Konno, D. Yamada, K. Mannen, T. Nagata, Y. Inatsu, H. Yawo, K. Yura, O. Beja, H. Kandori, and I. Takeuchi
-
Journal Title
Communications Biology
Volume: 4
Pages: 362
DOI
Peer Reviewed / Open Access / Int'l Joint Research
-
-