2018 Fiscal Year Annual Research Report
Analysis and visualization of sequential data for discovery without learning
Project/Area Number |
16K12428
|
Research Institution | The University of Tokyo |
Principal Investigator |
大澤 幸生 東京大学, 大学院工学系研究科(工学部), 教授 (20273609)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 学習なき発見 / 時系列分析 / 変化の説明 / 混在時間スケール / 変数選択 / 変数クエスト / 社会的ニーズ調査 |
Outline of Annual Research Achievements |
事象系列を支配する背景にあるダイナミクスが多様で、普遍的な因果関係の構造やパターンが学習できない様なシーケンス(系列)のデータを対象とし、人の意思決定に関わる変化点を発見する手法を開発してきた。学習は行わずデータ中の前後のトレンドを渡す橋として変化点を検出する考え方を初期点とし、学習なき発見という新パラダイムの構築を狙った。 変化点を把握することが従来手法では困難であったような、多様な原因が混在して生じた系列データを扱うことについて、過年度からユーザの要求(ニーズ)とデータ分析技術のマッチングをワークショップで行ってきた。その結果、変化の原因を定性的に説明することへのニーズが実業界で強いことが明らかとなった。しかし、実社会における市場や自然現象における時系列変化には多様なタイムスケールが混在するため、変化原因の説明が難しい。検討の結果、Tangled String(TS)における「振り返り時間幅」Wの調整により、求める時系列変化のタイムスケール(文脈の期待持続性)を制御する手法を得た。またWを用いて耐久遅延(時点tから、どれだけの時間後まで判断を待てば、tが重要な変化点であったかどうか判断できるか)の上限が求められることも証明した。 TSの他、グラフに基づくエントロピー, 域内地震情報エントロピーなどもユーザニーズに沿って開発し、計画どおりSNS、POS, 地震に対して成果を得た。これらは、変化点前後に対応するグラフ構造を可視化することにより、機械学習は行わず変化を説明する手法として役立っている。これらのツールは説明に用いるべき変数を過不足なく揃えて初めて効果を発揮するため、ユーザ要求に対して必要なデータ変数を導出する変数クエスト(VQ)を開発し適用した。変化説明技術に加えてVQのメタツールとしての社会的ニーズまで調査を行い、本研究全体の社会的意義まで把握した。
|