研究概要 |
本研究では,帰納学習・発見の対象として,パターン言語およびパターン言語の組を取り扱う.パターンとは,定数記号と変数からなる文字列である.例えば,a,bを定数記号,x,yを変数とすると,π=abxyやτ=axbxはパターンである.パターンπが表す言語L(π)は,πの変数に定数記号列を代入して得られる文字列全体である.たとえば,L(π)={abwv|w,vは,a,bからなる文字列},L(τ)={bwbw|wは,a,bからなる文字列}のようになる.複数パターンの組II=(π1,π2,…,πn)で,パターン言語の和L(II)=L(π1)∪L(π2)∪…∪L(πn)を表す. これらの対象について,本年度は,前年度までの(i)正例からの学習可能性および(ii)効率的学習可能性の研究を引き続き行うとともに,つぎの応用の可能性を探ることを行った. (iii) 正例からのパターン学習の具体的問題への応用 ・ 遺伝子情報解析のためのパターン抽出 ・ データベースからの知識の自動獲得 遺伝子は,4種の記号列からなっており,様々な生物の機能を表現しているといわれている.個々の機能に対応する遺伝子配列情報を正例として,それをもとに機能発現の本質となるパターンの抽出を試みた.それ以外のさまざまなデータベースにおいても,ある観点で検索・収集されたデータを正例として帰納学習システムに与えることにより,自動的に知識を獲得することを検討した.
|