研究概要 |
本研究では,WWW(ウェブ)などの大規模半構造データからの知識基盤形成のための超高速半構造パターン発見技術とその周辺技術の研究開発を行う.平成19年度は,次の項目に関して研究開発を行った. (1)超高速半構造マイニングエンジンの研究として,さまざまな知識発見問題に対して,性能保障をもつ効率よいパターン発見アルゴリズムを開発した.特に幾何グラフや近似アイテム集合,伸張を許す極大系列パターン等の半構造データ族に対して,効率よい多項式時間遅延・多項式領域アルゴリズムを開発した.統計的マイニングに関して,特に人獣共通感染症領域における遺伝子解析応用を想定して,新しい情報量的基準を導入し,これを最適化する効率よいパターン発見手法を開発した.また,本研究で開発した高速大規模データマイニング技術に関する基本技法の解説を執筆した(有村,伊藤,喜田) (2)大規模知識基盤形成システムのための高速な知識索引技術として,ZBDD技術を用いた圧縮知識索引機構と,その上で対称パターンの発見や,飽和集合発見を行う高速アルゴリズムを開発した.さらに,高効率知識索引構築のための基礎技術として,回路最適化技術を知識発見に応用し変数順序最適化法を開発した(湊,喜田,有村) (3)半自動知識連係技術として,ネットワークからの情報抽出や高速半構造ストリーム処理に基づく効率よい情報収集技術を開発した.このために,半構造データに対する例と質問からの機械学習技術や,ビット並列手法に基づく多次元数値ストリームデータに対する複雑な時系列パターン照合技術を開発した.(伊藤,喜田,有村) (4)開発した知識発見・知識連携・知識索引技術に関して,これまでのアルゴリズム実装と,評価実験,理論的解析に基づき,知識発見ツールの集合として知識獲得プロトタイプシステムを構築した.知識基盤形成技術について,ウェブからの情報収集や人獣共通感染症領域等で適用を行った(湊・伊藤・喜田・有村)これらに関して,インフルエンザ予測における知識獲得技術応用が新聞記事に取り上げられた(2006年11月07日付日経産業新聞,2008年3月26日付朝日新聞(北海道)
|