研究概要 |
本研究課題では,これまで開発されてきた探索技法の有効性と限界を確認し,新たな探索方式の確立と探索アルゴリズムの効率化を計算量理論と実際の両面から行なうことが主な目的であった.この目的に沿って,探索問題を定式化し,探索アルゴリズムの設計とその並列化を行ない,さらに探索方式の現実的検討を行なった.得られた成果は次のようなものである. タンパク質の構造を数学的なグラフとして抽象化し,効率のよい構造探索を行なうための基礎となすために,グラフを項とする論理プログラミングであるFGS (Formal Graph System)の理論を展開した.グラフの認識問題のいくつかは,このFGSの反駁木問題を解くことによって,効率のよい並列アルゴリズムを持つことを証明した。 ある文字列から,それを表現する最も小さいグラフを求める問題は,Walk情報からのグラフ再構成問題として知られている.この問題は,キャタピラグラフを入力としたとき,多項式時間近似アルゴリズムさえ持ちそうにないことを証明した.このことから,タンパク質のような有限長の文字列から,効率のよいグラフ表現を導き出すためには,新しい視点からの近似アルゴリズムの研究が不可欠であることがわかり,現在その研究に着手している. タンパク質の探索の中で最も重要なものはモチーフの探索である.このモチーフを表現するために,従来,知識獲得システムBONSAIで用いていた正規パターンを元にして,正規パターンの曖昧さを表すモチーフ表現を構築した.この表現を用いて,正の例と負の例からの知識獲得実験を行ない,成果を得ている. 本研究の成果は,並列知識獲得システムBONSAI Gardenとしてまとめられ,主にゲノムデータからの知識獲得システムとして多くの研究者に利用されている.
|