様々なデ-タ型のための帰納学習アルゴリズム

研究課題

研究課題/領域番号	03245205
研究種目	重点領域研究
配分区分	補助金
研究機関	長岡技術科学大学
研究代表者	畝見達夫長岡技術科学大学, 工学部, 講師 (50151915)
研究期間 (年度)	1991
研究課題ステータス	完了 (1991年度)
配分額 *注記	2,500千円 (直接経費: 2,500千円) 1991年度: 2,500千円 (直接経費: 2,500千円)
キーワード	帰納学習 / デ-タ型 / 最小汎化 / バ-ジョン空間 / 実例に基づく学習 / 強化学習法 / 学習制御
研究概要	より自然な知識表現を計算機上に実現するには、様々なデ-タ型を扱う枠組みが重要である。本研究は様々なデ-タ型について、帰納学習を用いた知識獲得の理論化を目差すものである。研究成果としては、帰納学習の基礎となる一般化及び持特殊化の枠組みを、ベクトル、列、集合、及びそれらの混合の上で提案したこと、及び帰納学習の元となる実例集合の記憶に基く学習アルゴリズムを提案したことの二点があげられる。前者では、デ-タ型に依存する構文上の最小汎化の手続きについて考察し、個々のデ-タ型に関するバ-ジョン空間を記述することよって、意味論以前に、デ-タ型の選択が学習の複雑性、裏がえせば柔軟性を左右することが、理論的に明らかとなった。文字列の領域に関しては、支法推論を始め過去に多くの研究が存在するが、集合あるいは木構造の領域においては、それとは違った複雑性、つまり照合や汎化のあいまい性が生じることがわかった。また、部分の汎化と要素の汎化を区別することが、個々のデ-タ構造に依存した帰納学習の性質を明らかにし、更に、「型の汎化」の理論化を実現する際の中心概念となる。後者では、実例に基づく学習のパラダイムを、強化学習法が対象領域とする制御問題に適用し、整数及び実数ベクトル領域について、適応行動シミュレ-ション、倒立振子及び大型監視般の制御への計算機シミュレ-ションによる応用を通してアルゴリズムの実証を行なった。特に倒立振子の制御では、従来のニュ-ラルネットによる方法より、はるかに良い性能が得られた。この手法は汎化を一切行なわずに最も類似した経験に基づいて未知環境での意思決定を行なおうとするものであるが、数値デ-タを含む領域では、記号の場合とは異なり、離散化による汎化よりは距離あるいはファジィ理論の考え方を導入する方が適切であると考えられる。

報告書

(1件)

1991 実績報告書

研究成果
(1件)

すべてその他

すべて文献書誌 (1件)

[文献書誌] 畝見達夫: "実例に基く強化学習法" 人工知能学会誌. 7. (1992)
- 関連する報告書
  1991 実績報告書