• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

背景知識を考慮した文字列照合に関する研究

研究課題

研究課題/領域番号 17700024
研究機関北海道大学

研究代表者

喜田 拓也  北海道大学, 大学院情報科学研究科, 助教授 (70343316)

キーワードテキストアルゴリズム / 文字列照合 / オントロジー / 半構造化データ / 情報検索 / 接尾辞木
研究概要

本研究では、オントロジー情報などの背景知識を考慮することで、より知的な文字列照合を行うアルゴリズムの開発を目指している。具体的には、電子的に利用可能な分類階層データベースやシソーラス情報、文章構造といったオントロジー情報を利用して動作する照合アルゴリズムを開発し、それらの統合を行う。また、それ以外のオントロジー情報についても調査を行い、知的検索のための利用を模索する。申請者はこれまでに分類階層情報を考慮した文字列照合アルゴリズムに加え、Arc情報が付加された文字列照合アルゴリズムについて取り組み、それぞれ有効なアルゴリズムを得ている。
本年度は、より効率よく文字列照合を行うための索引構造の構築に取り組んだ。接尾辞木は文字列の任意の部分文字列をコンパクトに索引付けするデータ構造であるが、その大きさは入力文字列の長さに比例するため、巨大なデータに対しては実際上用いることが困難である。そこで、索引付けする文字列を単語区切りに限定し、数単語分の部分文字列のみを索引構造に含めたより省スペースな接尾辞木を提案し、これを効率よく構築するアルゴリズムを得た。この成果は、検索対象とする文字列に区間情報(プロパティ)が付随する場合の効率よい検索のための索引構造構築への布石となる。

  • 研究成果

    (1件)

すべて 2006

すべて 雑誌論文 (1件)

  • [雑誌論文] 単語幅を制約した接尾辞木の効率のよい構築アルゴリズム2006

    • 著者名/発表者名
      上村卓史, 喜田拓也, 有村博紀
    • 雑誌名

      FIT惰報科学技術レターズ 5

      ページ: 5-8

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi