研究課題/領域番号 |
04229203
|
研究種目 |
重点領域研究
|
配分区分 | 補助金 |
研究機関 | 創価大学 |
研究代表者 |
畝見 達夫 創価大学, 工学部, 講師 (50151915)
|
研究期間 (年度) |
1992
|
研究課題ステータス |
完了 (1992年度)
|
配分額 *注記 |
1,500千円 (直接経費: 1,500千円)
1992年度: 1,500千円 (直接経費: 1,500千円)
|
キーワード | 機械学習 / データ構造 / 帰納学習 / 最小一般化 / 強化学習法 / 実例に基づく学習 |
研究概要 |
アトム、n-項組、列、集合の各データ型について、その帰納学習のための基礎となる最小一般化手続きを開発した。理論的には、複数実例間の最小共通一般化は、単一データの最小一般化の定義から、その定義を与えることができるが、実際に最小共通一般化を求める手続きは、単一データの最小一般化手続きから簡単に構成できるというわけではなくほとんど独立な手続きとして記述しなければならない。 アトムやn-項組の場合には任意のデータ対の最小共通一般化は一意に決まるため、その手続きは決定的なものとなるが、構造をもった要素からなる集合、あるいは、列の場合には一意に決まらない場合があり、一般にはデータの大きさあるいは長さに応じて組み合わせ的爆発を起こす。列の場合に、この組み合わせ的爆発による計算の困難さを解決するためのヒューリスティクスを導入したアルゴリズムを開発した。しかし現実の応用に際しては、領域特有のヒューリスティクス、あるいは、データの特徴を生かした効率化の方法の検討が重要となろう。 一方、学習の目的である、環境の変動に適応した性能の向上をはかるために、必ずしも帰納学習が有用であるとはかぎらない。1つの極単な方法は、全く一般化を行なわず、丸暗記された経験のみを用いることである。特に数値ベクトルのようなデータ領域では、距離空間を定義することが容易なため、最も類似した経験を参考に出力を決定するといった「実例に基づく学習」の手法も有用である。本研究の一貫として、強化学習環境における実例に基づく学習のアルゴリズムを開発し、計算機シミュレーションにより、その性能を調査した。その結果、ニューラルネットや遺伝的アルゴリズムに基づく既存の手法に比べ、学習速度が速いことが確任された。
|