• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

木構造データに対する汎用性の高い類似度計算技術の開発

Research Project

Project/Area Number 21700178
Research InstitutionNational Institute of Informatics

Principal Investigator

深川 大路  National Institute of Informatics, コンテンツ科学研究系, 特任研究員 (10442518)

Keywords木構造 / 類似度計算 / 近似パターン照合 / アルゴリズム
Research Abstract

本研究は、本構造によって表現され得る様々なデータを対象とする近似パターン照合や類似度計算の効率化を目指す。目標達成へのアプローチとして主に分離散アルゴリスムと計算量理論の観点から研究を進め、木構造データの類似度検索に関する既存の諸技術に関する知見を掘り下げるとともに、申請者等のにれまでの研究成果を発展さる。平成21年度は、研究計画の初年度として、(1)「XMLに対する高速類似検索アルゴリズムの開発」と(2)「XMLに対して有効な類似度学習手法の理論構築」に取り組んだ。XMLは非常に広い範囲で利用される汎用的なフォーマットであるが、書誌情報をはじめとすめ多くのXMLデータは、木構造のパラメータの一つである高さがそれほど大きくならずデータベース内でほぼ一定であるという特徴がある。その特徴を利用して蓍者等は高さが制限された木に対して最大共通部分木を計算する高速近似アルゴリズムを開発していた。本年度は、これとは独立な研究として、高さが制限された木の編集距離に関して、よく知られた単純なアルゴリズムの近似性能を証明し、その成果を国際会議において発表した。また、それと並行して、一般の条件において高速に木マッチングを行うための厳密アルゴリズムの研究を進め、計算機実験によって性能を確認した。今後はこれらの成果を広く提供できるよう準備を進める予定である。(2)については過去の研究を発展させ、新たな確率モデルを提案し、構造だけでなくXMLの葉にあたるテキスト部分を利用することを可能にした。これにあより類似テキストを持つXMLデータのマッチング性能について向上が期待できる。この新しい確率モデルに対しては従来の学習アルゴリズムが適用できないため、テキストマイニングにおける変文ベイズ法を応用し、与えられたXMLデータから自動的にモデルを学習するためのアルゴリズムを開発した。

  • Research Products

    (5 results)

All 2010 2009

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (4 results)

  • [Journal Article] Approximating tree edit distance through string edit distance2010

    • Author(s)
      T.Akutsu, D.Fukagawa, A.Takasu
    • Journal Title

      Algorithmica 57

      Pages: 325-348

    • Peer Reviewed
  • [Presentation] 高さ制約付き無順序木の高速類似検索アルゴリズムについて2010

    • Author(s)
      深川大路, 阿久津達也, 高須淳宏, 安達淳
    • Organizer
      情報処理学会第72回全国大会
    • Place of Presentation
      東京大学
    • Year and Date
      2010-03-09
  • [Presentation] 無順序木の編集距離計算のための厳密アルゴリズム2010

    • Author(s)
      阿久津達也, 深川大路, 高須淳宏, 田村武幸
    • Organizer
      情報処理学会研究報告ALアルゴリズム研究会
    • Place of Presentation
      東芝科学館(東京)
    • Year and Date
      2010-03-05
  • [Presentation] Constant factor approximation of edit distance of bounded height unordered trees2009

    • Author(s)
      深川大路, 阿久津達也, 高須淳宏
    • Organizer
      Proc.16th International Symposium on String Processing and Information Retrieval(SPIRE 2009)
    • Place of Presentation
      Saariselka, Finland
    • Year and Date
      2009-08-25
  • [Presentation] 高さの制限された無順序木の編集距離問題に対する近似アルゴリズム2009

    • Author(s)
      深川大路, 阿久津達也, 高須淳宏
    • Organizer
      電子情報通信学会コンピュテーション研究会
    • Place of Presentation
      北海道大学
    • Year and Date
      2009-06-29

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi