研究概要 |
本研究の目的は,例による学習の理論モデルである帰納推論の研究を通して,機械学習の実現可能性を探ることにある一般に,学習に用いられる例は,正のものと負のものに分類できる.言語(文法)の学習においては,正の例は,(文法的に)正しい文に相当する実験から得られるデータのうち,ある形質などに関連すると判断・分類されるものは,その形質を説明する正の例と考えられる.本研究では,正例のみに基づく帰納学習の原理的限界を解明するとともに,実際の応用の観点から効率的帰納学習アルゴリズムを探究していく. 帰納学習の対象であるパターン言語について,本研究では,パターンの定数記号を定数記号変数に拡張することにより,より豊かな表現力をもつ定数記号変数つきパターン言語を導入し,その正例からの学習可能性について考察を行った.正例からの学習可能性そのものは,パターン言語のときとほぼ同様に示すことができる.しかし,実際的に学習アルゴリズムを構成する場合には,パターン言語の和の学習可能性なととの関係をあきらかにする必要がある.パターン言語の効率的学習アルゴリズムを拡張し,定数集合変数つきパターンの学習アルゴリズムを構成し,実際にアミノ酸配列データからのモチーフ抽出に適用したところ,良好な結果が得られることがわかった.また,このアルゴリズムの正当性や計算量についての理論的考察を行った. また,効率的学習のために必要となる言語受理機構の高速化に関する研究も行い,文字列パターン照合を活用することにより,パターン言語の一般化としてのElementary Formal Sysytemsのための反駁アルゴリズムを高速化できることを示したさらに,複数パターン言語の効率的アルゴリズムについて他の類似のアルゴリズムとの比較検討を行い将来の方向性を探った.
|