2001 Fiscal Year Annual Research Report
データ圧縮と高速文字列照合アルゴリズムを用いた知的全文検索システムの開発
Project/Area Number |
13558029
|
Research Institution | Kyushu University |
Principal Investigator |
篠原 歩 九州大学, 大学院・システム情報科学研究院, 助教授 (00226151)
|
Co-Investigator(Kenkyū-buntansha) |
喜田 拓也 九州大学, 附属図書館, 講師
坂本 比呂志 九州大学, 大学院・システム情報科学研究院, 助手 (50315123)
竹田 正幸 九州大学, 大学院・システム情報科学研究院, 助教授 (50216909)
下薗 真一 九州工業大学, 情報工学部, 助教授 (70243988)
|
Keywords | 文字列照合アルゴリズム / データ圧縮 / 全文検索システム / 知識発見 / 最適パターン発見 / 接尾辞木 / インデックス構造 / 機械学習 |
Research Abstract |
本研究は,情報検索を前提とした知識情報処理技術の開発と,そのために必要な理論の展開を目的とし,さらに,その基本となる照合アルゴリズムの高速化,圧縮技法の開発を通じて,実用的なシステムの構築を目指す.この目標を達成するために,以下の項目に力点をおいて研究を展開している. 1.知的検索機能開発のための学習理論の展開 2.圧縮データに対する高速パターン照合アルゴリズムの開発とそのパフォーマンス 3.データ加工を前提とした圧縮技法の開発 4.知的検索システムの実働化 本年度は,圧縮データに対する高速パターン照合アルゴリズムの開発とそのパフォーマンスの解析について研究を行った.特に,辞書式圧縮を抽象化したコラージュシステムという一般的な枠組みに対して適用できる,複数パターン文字列に対するパターン照合アルゴリズムの開発に成功した.また,接尾辞木やDAWG, CDAWGという,文字列に対する索引構造を高速に構築するオンラインアルゴリズムの開発を行った.さらに,このアイディアを拡張し,対称CDAWGの構築にも成功した. 一方,知的検索システムに使用される学習機能と知識発見に関して,テキストデータの特徴を抽出するために,知識の表現体系についての研究を行った.この表現体系に基づいて,和歌データベースからの知識発見を行った.また,高度な枝狩りヒューリスティクスを導入することによって,エピソードパターンを文字列集合から高速に発見するアルゴリズムの開発を行い,これを既存の知識発見システムに組み込んで,パフォーマンスの向上を実証した.
|
Research Products
(6 results)
-
[Publications] H.Hori et al.: "Fragmentary Pattern Matching : Complexity, Algorithms and Applications for Analyzing Classic Literary Works"Proc. 12^<th> Annual International Symposium on Algorithms and Computation. 719-730 (2001)
-
[Publications] S.Inenaga et al.: "On-Line Construction of Symmetric Compact. Directed Acyclic Word Graphs"Proc. 8^<th> International Symposium on String Processing and Information Retrieval. 96-110 (2001)
-
[Publications] T.Kida et al.: "Multiple Pattern Matching Algorithms on Collage System"Lecture Notes in Computer Science. 2089. 193-206 (2001)
-
[Publications] K.Yamamoto et al.: "Discovering Repetitive Expressions and Affinities from Anthologies of Classical Japanese Poems"Lecture Notes in Artificial Intelligence. 2226. 413-425 (2001)
-
[Publications] H.Arimura et al.: "Efficient Learning of Semi-Structured Data from Queries"Lecture Notes in Artificial Intelligence. 2225. 315-331 (2001)
-
[Publications] K.Hirata et al.: "Prediction-Preserving Reducibility with Membership Queries on Formal Languages"Lecture Notes in Computer Science. 2138. 172-183 (2001)