2004 Fiscal Year Annual Research Report
データ圧縮とパターン照合に基づく高速機械発見システムの開発
Project/Area Number |
15300049
|
Research Institution | Kyushu University |
Principal Investigator |
竹田 正幸 九州大学, 大学院・システム情報科学研究院, 教授 (50216909)
|
Co-Investigator(Kenkyū-buntansha) |
篠原 歩 九州大学, 大学院・システム情報科学研究院, 助教授 (00226151)
坂本 比呂志 九州工業大学, 情報工学部, 助教授 (50315123)
杉本 典子 九州大学, 情報基盤センター, 助手 (80271120)
石野 明 九州大学, 情報基盤センター, 助手 (10315129)
南里 一郎 純真女子短期大学, 現代コミュニケーション学科, 助教授 (10312191)
|
Keywords | データ圧縮 / 機械発見 / 類似性指標 / パターン発見 / 計算量 / 索引構造 / 圧縮と発見 / パターン照合 |
Research Abstract |
本年度は昨年に引き続き,圧縮データに対する高速パターン照合アルゴリズムの開発とそのパフォーマンスの解析について研究を行なった. 特に,パターン文字列とテキスト文字列との照合にある程度のミスを許した柔軟な照合である近似文字列照合や正規パターンとの照合に力点をおいて理論を展開した.また,検索を前提とした新たなデータ圧縮法の開発に取り組み,実用的観点から新たな圧縮法を案出した. 一方,知識発見システムに使用される学習機能についてデータ圧縮とパターン照合の観点から定式化を行ない,学習可能性の解明と,効率のよい学習アルゴリズムの開発を行った.テキストデータの特徴を抽出するために,パターン言語を基盤とした知識の表現体系を利用し研究を行なった.また,Web上に氾濫するHTML文書およびXML文書などのいわゆる半構造テキストデータを対象とした知識発見方式を開発した.さらに,帰納推論に基づく知識発見方式を開発した. そしてこれらのアルゴリズムを実働化しそのパフォーマンスを評価した.特に,本手法を言語データに適用し,人文科学の専門家の立場からその有効性を検証した.
|
Research Products
(9 results)