2017 Fiscal Year Annual Research Report
パターンマイニングと疎性モデリングに基づく大規模系列データからの知識創出
Project/Area Number |
17H04694
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
烏山 昌幸 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (40628640)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | 機械学習 / 系列データ / グラフデータ / 疎性モデリング |
Outline of Annual Research Achievements |
データ収集の効率化により多様な形式のデータ解析の需要が高まっている.本研究課題は単純なテーブル型の数値情報ではなく構造を持った系列型のデータを扱う機械学習手法を開発する.例えば,GPSセンサーやビーコン等による継時的な測定データが大量に増えている.またDNA配列や遺伝子発現データなども複雑な関係性を持つ系列データとみなすことができるが,各々の構成要素の関係性を考慮すると,必要な計算は組み合わせ的に増大する.このような複雑なデータを効率よく扱うための機械学習基礎方法論の構築が本課題の目標となる.
本年度はまず連続値の系列情報から特徴的なパターンを抽出する方法論の基本的な枠組みを検討した.ラベル付きの連続値系列データから各ラベルに特徴的な行動パターンを抽出する推定問題を凸最適化として記述できることを導出し,さらに,類似したパターンをまとめて代表的なパターンのみを列挙できることを示した.今年度はこの内容の国際会議における発表または論文化を目指す.また,グラフ型の構造を持つデータ解析についても検討を進めた.例えば,遺伝子の発現量のような数値データの持つ相関構造をタンパク質のネットワーク上で解析するための因子分析法の開発を進めた.グラフィカルガウシアンモデルと因子分析を組み合わせることでグラフ上の接続構造と数値データの共分散構造の両方を考慮した解析が可能であることを示した.また,材料分野ではイオンの伝導経路に関する系列情報の解析がイオン伝導体の研究では行われる.このような問題に対して,ガウス過程に基づく系列解析法の開発を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究の初期段階は方法論の開発であったが,これについては国内学会,国際学会発表を行うことができた.また,当初検討していたもの以外にも可能性が出てきたため,次年度以降の検討事項としている.一方で,材料科学での応用でも系列情報が非常に重要な役割を果たす事例を考えることができた.全体としては概ね順調に進行していると考えている.
|
Strategy for Future Research Activity |
系列から重要なパターンを抽出する基礎方法論の構築を引き続き進める.新たな試みとして,カーネル法に基づき統計的に重要なパターンを列挙するアプローチの検討を始めている.カーネル法ではカーネル関数と呼ばれる関数を通して系列やグラフなど様々な構造を考慮させることができる.ただし,組み合わせ的に増加する候補を考える場合には計算量的な困難があった.ここでは,研究申請者が以前の研究で用いたセーフスクリーニングの考え方を応用し,現実的な計算量でカーネル法とパターンマイニングを組みわせる.特に系列やグラフの個々のデータ構造に関して計算効率の検討を行い,スケーラビリティの高い方法論の構築を目指す.既存のデータマイニング技術と数値最適化の技術を組み合わせることで不要な候補を効率的に削除し,組み合わせ的に増える可能性を効率的に扱うアルゴリズムができると考えている.このような技術の一般化を進めて,様々な構造を取り扱える枠組みの整理を進める.同時に材料科学や生物学,動物行動学データでの応用の可能性を検討する.
|