研究概要 |
本研究は,類推についての理論的研究の成果とシステム化の経験を基礎にして,類推という極めて自然で,問題解決の初期の段階で活用される推論方式とMDL原理という強力な知識獲得方式に基づく,ゲノムデータ処理に適した一般性のある知識処理の方式を確立することを目的としている.本年度は,以下の成果を得た. (1)ゲノムデータのための類比の研究 配列間のホモロジーに対応するものが「類比」であるが,構造等を考慮したさらに高次の類比の定式化を行った.それと同時に高次パターンマッチングアルゴリズムを研究開発した. (2)MDL原理の研究 アミノ酸のインデックス化は,KyteとDoolittleの研究に見られるように,タンパク質の機能・構造予測に極めて有用な概念である.このインデックス化と正則パターン上の決定木を組み合わせた概念は,これまでの研究でその有効性が実証されている.そこで,MDL原理を用いて,アミノ酸配列等のデータからそのインデックス化と決定木を作り出す方式を開発した. (3)類推の効率化およびMDL原理の効率的実現方式の研究これまで開発してきた類推方式で実現されている類推エンジンの高速・効率化を行った.また,(1)の成果に対応した効率の良い新たな類推方式を開発した.さらに,MDL原理を計算機上で実現し,そののアルゴリズムの効率化の理論的限界について研究した. (4)計算機実験 高次パターンマッチングアルゴリズム,類推の効率化,およびMDL原理に基づく決定木構成のアルゴリズムを本研究費で購入したワークステーション等を用いて実現し,アミノ酸列からの知識獲得問題に適用し,有用な成果を得た.
|