2013 Fiscal Year Research-status Report
乱択アルゴリズムによる並列分散軌跡パターンマイニング
Project/Area Number |
25560147
|
Research Category |
Grant-in-Aid for Challenging Exploratory Research
|
Research Institution | Kobe University |
Principal Investigator |
上原 邦昭 神戸大学, システム情報学研究科, 教授 (60160206)
|
Co-Investigator(Kenkyū-buntansha) |
関 和広 神戸大学, システム情報学研究科, 准教授 (30444566)
|
Project Period (FY) |
2013-04-01 – 2015-03-31
|
Keywords | 地理情報システム / 並列計算」 / データマイニング / 乱択アルゴリズム / GPS |
Research Abstract |
近年,GPSなどの位置情報取得技術の普及によって,大量の人の位置情報データを簡単に集めることができるようになった.位置情報データからは,ダイナミックに時々刻々と変動する人々の移動軌跡データを得ることができる.人々の移動軌跡データを獲得し行動分析を行えば,防災,防犯,交通・都市計画,マーケティングなどに活かすことができる.このような考え方に基づいて,従来,主成分分析などの統計的手法による人間の行動分析が行われてきた.具体的には,人々の移動軌跡データを年齢や職業などの属性ごとにいくつかのグループに分類し,主成分分析によりグループごとの特徴的な行動パターンを検出するという手法が提案されている.しかし主成分分析では,どの時間にどの場所に居るかといった,時間と場所の情報のみから成る行動パターンしか得ることができない.人の行動パターンを把握する上では,移動中の交通機関など,その他の情報や関係性が必要である.そこで本研究課題では,人間行動に関する一般的知識とデータマイニングによって.特徴的行動を表すオントロジーを構築する手法を提案した.オントロジー構築では,幾何的なデータである生の移動軌跡データから,階層的に概念を定義し,人間の行動知識に基づいて移動軌跡データに意味付けを行う.さらに意味付けされた移動軌跡データからパターンマイニングを行い,概念間の関係性を発見する.人のクラスごとに固有な関係性を発見し,オントロジーを構築すれば,そのクラスの人々に見られる特徴的な行動パターンを検出できる.実験では,スーパーコンピュータ富士通FX-10上の「京MapReduce」を利用した並列計算により,東京都市圏の人の流れデータを用いて,学生と会社員についてのオントロジー構築を行った.なお,「京MapReduce」とは,データをキーとバリューのセットとして扱い,キーごとにデータを集約して並列処理を行うフレームワークである.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
既に本研究の中心的課題である,MapReduceによる並列分散データマイニングの枠組みについは,海外論文誌に採択されている.このような研究の進捗状況により,申請時には検討していなかったが,新たに本研究を大きく2つのサブテーマに分けて,人間の行動分析とストリームアルゴリズムによるデータマイニング手法について研究を開始している.このため,最終年度には当初の想定以上の成果が得られると考えている.
|
Strategy for Future Research Activity |
人々の流れに関する移動軌跡データは,際限なく到来する時刻順の大量データ,すなわちストリームと考えることができる.このようなストリームデータ処理技術にとって,無限に到来する時刻順のデータ(ストリームデータ)をリアルタイムに処理するデータ処理方法の実現が重要な課題となっている.近年,DenStreamなど,ストリームデータからのデータマイニングアルゴリズムが提案されている.DenStreamは,検索半径を十分小さく設定して,移動軌跡データから人の密度が高い場所を見つけるアルゴリズムである.DenStreamはストリームデータ処理技術となっているが,得られるパターンは,ある地点の密度が高いとか低いなど,ある時点での静的な情報に過ぎない.人が単に集まって動かない場合は人々の動きに関する頻出パターンは発見できない.本研究で求めようとするパターンは,動的な情報,もしくは人の密度が増えている場所,人が集まってくる場所である.例えば,短い時間間隔で,ある場所に大量の人が流入すると,この場所で大きな交通問題が生じることになる.このような状況を発見することが本研究の目的である.本年度は,まずストリームデータから頻出パターンを検出する手法を提案する.この手法の目的は,ストリームデータに現れる各エレメントの出現頻度を計算することである.このアルゴリズムは,最近来たデータの重みを大きくすることに特徴がある.具体的には,まずストリームデータを各エレメントに関するいくつかのサブストリームに分ける.さらに,サブストリームごとにエレメントの出現頻度を求める.このような考え方をアルゴリズムに導入すると,過去のデータを保存せずに,各エレメントの頻度が計算できるようになる.人の移動軌跡から人がよく立ち止まる場所を発見できれば,さらに,発見された場所に基づいて人の動きパターンを検出するアルゴリズムを検討する予定である.
|
Expenditure Plans for the Next FY Research Funding |
学内の同一研究室に所属していた研究分担者が,新年度より他大学に転出することになった.このため,代表者と研究分担者の連携をより強めるために,当初の使用計画を変更し,研究分担者が新任地でも十分に研究できるように,購入備品を再検討するために,新年度に予算を移動させることにした. 他大学に転出した研究分担者が,データ処理のためのコンピュータを追加して購入する予定である.なお,他の予算使途についての変更はない.
|
Research Products
(2 results)