2011 Fiscal Year Annual Research Report
大規模知識基盤形成のための次世代半構造マイニング技術の研究
Project/Area Number |
20240014
|
Research Institution | Hokkaido University |
Principal Investigator |
有村 博紀 北海道大学, 大学院・情報科学研究科, 教授 (20222763)
|
Co-Investigator(Kenkyū-buntansha) |
喜田 拓也 北海道大学, 大学院・情報科学研究科, 准教授 (70343316)
湊 真一 北海道大学, 大学院・情報科学研究科, 教授 (10374612)
伊藤 公人 北海道大学, 人獣共通感染症リサーチセンター, 准教授 (60396314)
宇野 毅明 国立情報学研究所, 情報学プリンシプル研究系, 准教授 (00302977)
平田 耕一 九州工業大学, 情報工学研究院, 准教授 (20274558)
|
Keywords | 半構造マイニング / 頻出パターン発見 / エピソードマイニング / 大規模知識索引 / グラフマイニング / ストリーム処理 / 極大パターン発見 / 知識発見 |
Research Abstract |
本研究においては,ネットワーク上の大規模半構造データに内在する知識をパターンや規則としてとりだすことが可能な超高速な半構造マイニングエンジン技術を開発し,これを現実の多様な半構造データに適用するための周辺技術を開発する.さらに,開発した基盤技術と周辺技術の実装を行い,インターネット上の大規模半構造データからの知識発見実験を行うことを目的とする. 平成22年度は,これまでの成果を元に,大規模知識基盤形成システムのための基盤と応用技術の開発と,その理論解析,最適化を行う.具体的には,次の項目に関して研究・開発を行った.(1)超高速半構造マイニングエンジンの研究開発として,形状制約を除き,距離できまる近接性のみを考慮したサイズ限定木構造パターンに対する定数遅延時間列挙の超高速発見手法の開発と解析を行った.移動体軌跡データに対する閉パターンマイニングアルゴリズムの研究を行った.(2)確率的情報処理スキーマと半構造データマイニングの結合として,近接パターンマイニングアルゴリズムの統計学習への適用,および,根付き木構造上の確率モデルの学習の半構造マイニングデータの自動生成への適用の検討を行った.(3)半構造データマイニングの一般理論の構築.系列と木構造に対する近接パターン発見問題の定式化と一般化を行った.(4)知識連係技術の研究開発として,半構造ストリーム照合手法のハードウェア上の超高速実装方法や,圧縮パターン照合技術の開発を行った.(5)高速な知識索引技術の研究開発.系列二部決定グラフや圧縮符号上の線形時間索引構築法を開発した.(6)知識基盤形成支援システムのプロトタイプ構築.上記のアルゴリズムを実装し,評価実験を行った.一連の研究に関し,2012年データ工学と情報マネジメントに関するフォーラム(DEIM2012)若手奨励賞(2件:和佐他,2011.3;細川他,2011.3)を受賞した.
|
Research Products
(18 results)