研究概要 |
平成13年度の研究成果を具体的な研究テーマ毎に以下にまとめる. 1.リポジトリに基づく帰納アプリケーション構築支援環境 従来,代表的な帰納アルゴリズムを分析し,帰納メソッドリポジトリを構築してきたが,コミッティ学習メソッドを追加するとともに,ポルト大学のStatLogプロジェクトから提供されている8種類のデータセットを利用して,帰納アプリケーションの自動合成実験を行った.その結果,本ツールで合成された帰納アプリケーションの平均正解率は,StatLogプロジェクトで調査された24種類の代表的な帰納アルゴリズムのどの平均正解率よりも高い値を示した.さらに,効率的な仕様探索を実現するために,相関ルールに基づいて,仕様更新ルール(メタルール)の学習を試みた.その結果,ランダム探索よりは安定した仕様更新が実現できることが確認されたが,最良の仕様を短時間に見つけ出す点については不十分であり,メタルール自身の構造について課題が残った. 2.慢性肝炎データセットのデータ前処理とルール発見 本研究領域で対象となっている慢性肝炎データセットを分析し,離散値に基づくルール発見を試みた.まず,出現頻度に基づいて,957種類の検査項目を41種類に絞り込んだ.次に,検査周期についても出現頻度に基づいて28日周期に統一し,空値になるデータ項目については,線形補完によりその値を推定した.また,Dasの手法に基づき,時系列データをある一定長で切り出し,EMアルゴリズムに基づき,切り出されたサブシーケンス群のクラスタリングを行った.以上の準備の下に,決定木学習により,検査項目値からGPTの1年間の変化を予見するルールの学習を試みた.その結果を専門医に評価してもらった所,乳びとGPTの関連性,GPTの周期性の予測など,興味深いというコメントもいくつかもらえた. その他,多粒度の間題解決メソッド,領域オントロジー構築支援ツールについても検討した.
|