2009 Fiscal Year Annual Research Report
大規模知識基盤形成のための次世代半構造マイニング技術の研究
Project/Area Number |
20240014
|
Research Institution | Hokkaido University |
Principal Investigator |
有村 博紀 Hokkaido University, 大学院・情報科学研究科, 教授 (20222763)
|
Co-Investigator(Kenkyū-buntansha) |
喜田 拓也 北海道大学, 大学院・情報科学研究科, 准教授 (70343316)
湊 真一 北海道大学, 大学院・情報科学研究科, 准教授 (10374612)
伊藤 公人 北海道大学, 人獣共通感染症リサーチセンター, 准教授 (60396314)
宇野 毅明 国立情報学研究所, 情報学プリンシプル研究系, 准教授 (00302977)
平田 耕一 九州工業大学, 情報工学研究院, 准教授 (20274558)
|
Keywords | 半構造マイニング / 頻出パターン発見 / ウェブページ / 大規模知識索引 / グラフマイニング / ストリーム処理 / 極大パターン発見 / 知識発見 |
Research Abstract |
本研究においては,ネットワーク上の大規模半構造データに内在する知識をパターンや規則としてとりだすことが可能な超高速な半構造マイニングエンジン技術を開発し,これを現実の多様な半構造データに適用するための周辺技術を開発する.さらに,開発した基盤技術と周辺技術の実装を行い,インターネット上の大規模半構造データからの知識発見実験を行うことを目的とする. 平成21年度は,前年度までの成果を元に,大規模知識基盤形成システムのための基盤と応用技術の開発と,その理論解析,最適化を行う.具体的には,次の項目に関して研究・開発を行った. (1)超高速半構造マイニングエンジンの研究開発として,2部グラフと多部グラフに対する深さ有線方式の頻出エピソードマイニング手法を開発し,理論的解析を行った.(2)確率的情報処理スキーマと半構造データマイニングの結合として,根付き木構造上の階層ベイズモデルを導入し,実証実験として,インフルエンザウイルスの巡回パターンの解析に適用した.(3)半構造データマイニングの一般理論の構築.半構造データに対する高速極大部分構造マイニングアルゴリズムの一般的構成法を与えた.(4)知識連係技術の研究開発として,半構造ストリームに照合アルゴリズムのハードウェア上の超高速実装方法や,圧縮パターン照合技術の開発を行った.(5)高速な知識索引技術の研究開発.ZBDDに基づく大規模知識索引技術に基づいて,データベース系列から,与えられた生起パターン表現をもつ頻出アイテム集合の発見手法を開発した.(6)知識基盤形成支援システムのプロトタイプ構築.上記のアルゴリズムを実装し,評価実験を行った.
|
Research Products
(14 results)