2000 Fiscal Year Annual Research Report
Project/Area Number |
11780278
|
Research Institution | Kyushu University |
Principal Investigator |
篠原 歩 九州大学, 大学院・システム情報科学研究院, 助教授 (00226151)
|
Keywords | 機械学習 / 例からの学習 / 最適パターン / 部分列 / 探索 |
Research Abstract |
人工知能の問題解決において,探索は常に鍵となる役割を果たしている.実際のアプリケーションにおいては,問題固有の知識を利用しながら探索を制御し,探索経路の組み合わせ的爆発に対する工夫を行うことが必要である.今年度は,情報を表現し保持するための最も基本的なデータ構造である文字列に関する探索問題を設定し,部分文字列の持つ性質を生かして,実用上は多くの場合において全解探索を避けられる枝刈りヒューリスティックを提案し,実験によってその効果を検証した. この問題は,実用的な観点から,与えられた2つの文字列集合SとTを分類するために最良な部分列パターンを見つけ出す方法を示すことを目標としたものであるが,NP困難であることが知られている問題と深い関連があり,最悪時には潜在的に指数的に多い候補パターンを調べあげることを余儀なくされる.すなわち基本的には,それぞれのパターンωに対して,ωを部分文字列として含む文字がSとTにそれぞれいくつ存在するかを数え上げなければならない.そこでまず,文字列集合の部分列をすべて受理する部分列オートマトンを高速に構築するアルゴリズムを開発して実装することで,この数え上げ自身を高速化した.この部分列オートマトンの構築アルゴリズムは,現在知られている中で最も効率のよいものである.さらに,可能な限り候補となる部分列を減らすために,部分列に関する包含関係と,目的関数の性質をうまく組み合わせることによって,探索空間を効率的に枝刈りするヒューリスティクスを2つ提案した.これをアミノ酸配列やDNA配列に対する実験に適用し,それぞれのヒューリスティクスの効果と,部分列オートマトンによる高速化の度合いを確認した.
|
Research Products
(2 results)
-
[Publications] H.Hoshino,A.Shinohara,M.Takeda and S.Arikawa: "Online construction of subsequence automata for multiple texts"Proc.of 7th International Symposium on String Processing and Information Retrieval. 146-152 (2000)
-
[Publications] M.Hirao,H.Hoshino,A.Shinohara,M.Takeda and S.Arikawa: "A Practical Algorithm to Find Best Subsequence Patterns"Proc.of the 3rd International Conference on Discovery Science. LNAI1967. 141-154 (2000)