2005 Fiscal Year Annual Research Report
データ圧縮とパターン照合に基づく高速機械発見システムの開発
Project/Area Number |
15300049
|
Research Institution | KYUSHU UNIVERSITY |
Principal Investigator |
竹田 正幸 九州大学, 大学院・システム情報科学研究院, 教授 (50216909)
|
Co-Investigator(Kenkyū-buntansha) |
篠原 歩 東北大学, 大学院・情報科学研究科, 教授 (00226151)
坂本 比呂志 九州工業大学, 情報工学部, 助教授 (50315123)
杉本 典子 九州大学, 情報基盤センター, 助手 (80271120)
石野 明 九州大学, 大学評価情報室, 助手 (10315129)
南里 一郎 純真女子短期大学, 現代コミュニケーション学科, 助教授 (10312191)
|
Keywords | アルゴリズム / 機械学習 / 機械発見 / パターン照合 / データ圧縮 / 半構造データ / パターン発見 |
Research Abstract |
最終年度である本年度は,昨年度までの成果をふまえ,圧縮データに対するパターン照合アルゴリズムおよびパターン発見アルゴリズムの開発とそのパフォーマンスの解析について研究を行なった. 特に,Web上に氾濫するHTML文書およびXML文書などのいわゆる半構造テキストデータに対する高速パターン照合処理について,理論と実用の両面から研究を行ない,大量の質問を高速に処理できる新しい方式を確立した(竹田,石野). また,高速化を目的とした半構造データの圧縮方式を確立した(坂本,竹田,篠原). 一方,知識発見システムに使用される知識発見機能についてデータ圧縮とパターン照合の観点から定式化を行ない,各種のパターン族に対するパターン照合問題およびパターン発見問題に関する計算量階層の解明と,効率のよいパターン発見アルゴリズムの開発を行った(篠原). そしてこれらのアルゴリズムを実働化しそのパフォーマンスを評価した(全員).特に,本手法を言語データおよび文学作品データに適用し,言語学および文学の専門家の立場からその有効性を検証する(南里一郎,南里智子). 以上の研究で得られた成果を統合し,計算機上に高速な知識発見システムを構築した.
|
Research Products
(22 results)