研究分担者 |
有川 節夫 九州大学, 大学院システム情報科学研究科, 特任教授 (40037221)
石野 明 東北大学, 大学院情報科学研究科, 助手 (10315129)
岡本 青史 (株)富士通研究所, ナレッジ研究センター, 主任研究員 (90399717)
浅井 達哉 (株)富士通研究所, ナレッジ研究センター, 研究員 (40399720)
御手洗 秀一 九州大学, 大学院システム情報科学研究科, 特任助手 (00423583)
|
研究概要 |
以下の3つの課題を研究項目として,研究を遂行した. 1.一方向逐次処理に基づく非定型データ処理技術 パストライを用いた,軽量なXMLストリーム処理高速化技法を開発した.XAXENと名づけたこの処理系は,数千〜数万のクエリを同時に処理することが可能で,ストリーム処理手法として有名なXMLTK, YFilterと比較して,実行速度で約4〜6倍,メモリ使用量で約6倍以上の圧倒的な性能を達成した. II..データ圧縮に基づく高速非定型データ処理技術 一方向逐次処理に基づく非定型データを高速化するためのもうひとつの技術として,代表者らが世界に先駆けて開発した「テキスト圧縮による高速化」技術がある.さらなる高速化を図るため,圧縮パターン照合の観点から有効な圧縮法を新たに開発した. III.非定型データからのパターン発見技術 最適パターン発見問題について,新たなパターン族を導入し,効率的なパターン発見アルゴリズムを開発した.また,そのアルゴリズムを高速化するためのデータ構造の開発を行った.さらに,パターン発見技術の応用として,'Webスパム検出の研究も行った. Iの高速化の効果は劇的であり,IIの圧縮パターン照合技術と結合することにより,さらなる高速化が期待できる.また,IIIのパターン発見技術により,非定型データを対象とした,より知的な検索が可能となる.
|