パターンマイニングと疎性モデリングに基づく大規模系列データからの知識創出
Project/Area Number |
17H04694
|
Research Category |
Grant-in-Aid for Young Scientists (A)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
烏山 昌幸 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (40628640)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Project Status |
Granted (Fiscal Year 2020)
|
Budget Amount *help |
¥21,580,000 (Direct Cost: ¥16,600,000、Indirect Cost: ¥4,980,000)
Fiscal Year 2020: ¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000)
Fiscal Year 2019: ¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)
Fiscal Year 2018: ¥5,200,000 (Direct Cost: ¥4,000,000、Indirect Cost: ¥1,200,000)
Fiscal Year 2017: ¥9,230,000 (Direct Cost: ¥7,100,000、Indirect Cost: ¥2,130,000)
|
Keywords | 機械学習 / 疎性モデリング / パターンマイニング / 系列データ / グラフデータ / マイニング / 凸最適化 |
Outline of Annual Research Achievements |
本研究では,系列データやグラフデータなど単純な数値のみでない関係性の構造データからの統計的学習アルゴリズムの開発を行ってきた.当該年度においては,1) グラフデータ解析機械学習手法の開発・国際学会投稿, 2) 時系列データ解析機械学習の開発,に主に注力した.1) について,グラフ表現は系列を含む汎用的なデータの表現であるが,その組み合わせ的な性質から取り扱いが難しい.機械学習では,対象間の類似性を測ることで,多様な解析が可能になるが,これまでのグラフ類似性尺度は,解釈性が低いものやデータに適応的に最適化できないものが多かった.ここでは,与えられたグラフデータとそのラベルから,適応的にグラフ距離尺度を最適化する方法を提案した.特に,マイニングと最適化の技術を融合することで組み合わせ計算の困難性を緩和できることを示した.この成果はデータマイニングの国際会議KDD(2019年度採択率14.2%)に採択された.また, 2) については,時系列の連続値データから重要パターンを抽出するアルゴリズムの開発を行った.観測装置の低コスト化に伴い時系列データ解析の需要は高まる一方である.多くの場合,計測したデータから特徴的な挙動を抽出することが重要となる.この研究では,連続値の時系列情報から特定のカテゴリに属すデータ群に特徴的な挙動を学習する手法を開発した.ここでも組み合わせ的に発生する候補パターンをマイニングにより効率的に処理できることを示した.こちらも順次,学会発表/論文投稿を目指す.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
土台となるアルゴリズムが揃い始めている.一部の成果は, 機械学習/データマイニングの最高峰の国際学会に採択されている.機械学習分野では,論文誌以上に学会が重要視されるため,成果の波及という観点からもこれは望ましい.これらの手法を土台にして,さらなる発展を考えていける状況になってきているため,概ね順調に推移しているとした.計画以上の進行を目指す一つのアプローチはとしては応用事例の模索が挙げられる.
|
Strategy for Future Research Activity |
ここまでで構築した基礎手法について,さらなる拡張や展開を進めていく.具体的には,グラフデータの学習では,グラフの頂点に連続値データが付随するような状況が多くあるが,そのような状況への拡張や,時系列データの解析では,次元が高くなった場合への対処などが課題として挙げられる.これらの基礎方法論の拡充を行いつつ,応用の模索を行う.応用としては,化合物グラフや,遺伝子ネットワーク,GPSデータなどの移動情報データなど,publicなデータや,共同研究者の持つデータなど様々な観点から検討していきたい.
|
Report
(2 results)
Research Products
(8 results)
-
[Journal Article] Efficient learning algorithm for sparse subsequence pattern-based classification and applications to comparative animal trajectory data analysis2019
Author(s)
Takuto Sakuma, Kazuya Nishi, Kaoru Kishimoto, Kazuya Nakagawa, Masayuki Karasuyama, Yuta Umezu, Shinsuke Kajioka, Shuhei J. Yamazaki, Koutarou D. Kimura, Sakiko Matsumoto, Ken Yoda, Matasaburo Fukutomi, Hisashi Shidara, Hiroto Ogawa, Ichiro Takeuchi
-
Journal Title
Advanced Robotics
Volume: 33
Pages: 134-152
DOI
Related Report
Peer Reviewed / Open Access
-
-
-
-
-
-
-