研究課題/領域番号 |
17700024
|
研究種目 |
若手研究(B)
|
配分区分 | 補助金 |
研究分野 |
ソフトウエア
|
研究機関 | 北海道大学 |
研究代表者 |
喜田 拓也 北海道大学, 大学院・情報科学研究科, 准教授 (70343316)
|
研究期間 (年度) |
2005 – 2007
|
研究課題ステータス |
完了 (2007年度)
|
配分額 *注記 |
3,400千円 (直接経費: 3,400千円)
2007年度: 900千円 (直接経費: 900千円)
2006年度: 1,200千円 (直接経費: 1,200千円)
2005年度: 1,300千円 (直接経費: 1,300千円)
|
キーワード | テキストアルゴリズム / 文字列照合 / オントロジー / 半構造化データ / 情報検索 / 接尾辞木 / データストリーム / 構造付き文書データ / アーク付きテキスト |
研究概要 |
本研究では、オントロジー情報などの背景知識を考慮することで、より知的な文字列照合を行うアルゴリズムの開発を目指している。具体的には、電子的に利用可能な分類階層データベースやシソーラス情報、文章構造といったオントロジー情報を利用して動作する照合アルゴリズムを開発し、それらの統合を行う。また、それ以外のオントロジー情報についても調査を行い、知的検索のための利用を模索する。申請者はこれまでに分類階層情報を考慮した文字列照合アルゴリズムに加え、Arc情報が付加された文字列照合アルゴリズムについて取り組み、それぞれ有効なアルゴリズムを得ている。 本年度は、構造を伴ったテキストに対して、効率よい検索を行うための索引構造についても研究を行い、ある種の区間情報(プロパティ)が付随する文字列に対して効果的に索引付けできるプロパティ付き接尾辞木の効率よい構築アルゴリズムの開発に成功した。一方で、近年、大規模な数値データストリームに対する高度な検索が重要視されはじめたことから、大規模データストリーム上での時系列パターン照合問題にも取り組んだ。その結果、多次元の数値データストリームに対して、各次元間に相関がある複雑なクエリに対して効率よいアルゴリズムを提案した。
|