2013 Fiscal Year Annual Research Report
大規模知識基盤形成のための次世代半構造マイニング技術の展開
Project/Area Number |
24240021
|
Research Institution | Hokkaido University |
Principal Investigator |
有村 博紀 北海道大学, 情報科学研究科, 教授 (20222763)
|
Co-Investigator(Kenkyū-buntansha) |
宇野 毅明 国立情報学研究所, 情報学プリンシプル研究系, 准教授 (00302977)
湊 真一 北海道大学, 情報科学研究科, 教授 (10374612)
伊藤 公人 北海道大学, 北海道大学人獣共通感染症リサーチセンター, 准教授 (60396314)
下薗 真一 九州工業大学, 情報工学研究院, 准教授 (70243988)
喜田 拓也 北海道大学, 情報科学研究科, 准教授 (70343316)
平田 耕一 九州工業大学, 情報工学研究院, 教授 (20274558)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | 半構造マイニング / トラジェクトリ照合 / 群パターンマイニング / ZDD / 半構造マイニングエンジン / 部分超グラフ列挙 |
Research Abstract |
本研究では,実世界と情報世界が融合した巨大な情報空間から有用な知識を効率よくとりだすための大規模半構造マイニング技術の確立を目指す.平成25年度は,大規模知識基盤形成システムのための技術調査と,基盤技術の開発,環境整備について,次の項目に関して研究・開発を行う. (1)最適パターン発見を用いた超高速半構造マイニングエンジンの研究開発(有村・宇野・平田).大規模実世界データにおける知識発見の先端技術調査に基づき,従来の超高速パターン発見アルゴリズムを拡張し,非巡回超グラフの種々の部分族に対する理論的性能保障付きパターンマイニングアルゴリズムを開発した.(2)時空間情報を用いた半構造データマイニングの研究開発(有村・宇野・平田・下薗).2次元とそれ以上の次元の時空間パターンに対する多項式遅延・領域の高速なパターンマイニングアルゴリズムを開発した.(3)確率的情報スキーマと半構造データマイニングの結合の研究(喜田・伊藤・有村)無限関係モデルに文脈と背景知識を取り入れて,関係データからの統計マイニングアルゴリズムを開発した.(4)大規模知識基盤形成システムのための知識連係技術の研究開発(伊藤,平田,喜田,有村).トラジェクトリデータに対する高速パターン照合手法を開発した.(5)大規模知識基盤形成システムのための高速な知識索引技術の研究開発(湊,宇野,有村).ZDDを元に,巡回に拡張したπDD や,系列集合に拡張したSeqBDD 等の大規模知識索引の研究開発を行った.(6)知識基盤形成支援システムのプロトタイプ構築(全員).開発した知識発見技術を元に,実世界からの知識基盤形成システムのプロトタイプの構築を開始した.また,各研究項目に関して,随時,理論的な解析を元にさらなる最適化を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
(1)超高速半構造マイニングエンジンと研究開発に関しては,すでに目標を達成しつつある.具体的には,(1)では,非巡回超グラフの種々の部分族に対する多項式遅延・領域アルゴリズムの研究の大きな進展が見られ,(2)では,最近注目されるトラジェクトリデータ向けの「群れパターン」に対する世界初の多項式遅延・領域の閉パターン発見アルゴリズムの開発に成功している.また各種の高速化をおこなった.(4)知識連係技術では,トラジェクトリパターンの照合アルゴリズムについて,算術演算を最大限に活用した高速な手法の開発に成功し,学術雑誌に掲載された.(5)では,申請者と分担者らが先端を進んでいる高速な知識索引技術の研究開発で,知識索引の種々の半構造データへの拡張を進めることができた.他項目についても,(3)で統計的関係データ学習アルゴリズムを開発し,(6)で各項目で開発した理論的手法を実際に実装し,プロトタイプ構築のための計算機実験を行うなど,当初の計画以上に進展している.
|
Strategy for Future Research Activity |
今後各項目ごとの研究開発の推進を一層進める,それと共に,本課題の最終的な目標である実世界と情報世界が融合した巨大な情報空間から知識を効率よくとりだすための大規模半構造マイニング技術の確立を目指して,その理論的な枠組みや,個々の研究成果の統合,新たな研究課題と方向の策定を行っていきたい.いくつかの方向を示すと,(1)超高速半構造マイニングエンジンと研究開発に関しては,さまざまな木構造パターン発見技法を,超グラフ発見の枠で理論的に一般化し,ヘテロな巨大データからの知識発見の基盤技術を開発したい.(2)では,トラジェクトリデータ向けの高速知識発見手法をさらに追及し,時空間データを扱うための効率よい設計原理を明らかにし,同時に簡潔データ構造技術の進展もとりこみ,実用的で規模耐性の高い実装法を研究開発する.(4)知識連係技術では,これまでのハードウェアの算術演算を最大限に活用する超高速かつ低メモリアルゴリズム技法を,圧縮技術やパターン発見技術とつなげていきたい.(5)知識索引技術と統計的手法との融合では,開発した半構造データ向け技術の知識発見との連携がカギである.(6)プロトタイプ構築については,実装と解析を行っていく.
|
Research Products
(28 results)