Project/Area Number |
03245205
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Research Institution | Nagaoka University of Technology |
Principal Investigator |
畝見 達夫 長岡技術科学大学, 工学部, 講師 (50151915)
|
Project Period (FY) |
1991
|
Project Status |
Completed (Fiscal Year 1991)
|
Budget Amount *help |
¥2,500,000 (Direct Cost: ¥2,500,000)
Fiscal Year 1991: ¥2,500,000 (Direct Cost: ¥2,500,000)
|
Keywords | 帰納学習 / デ-タ型 / 最小汎化 / バ-ジョン空間 / 実例に基づく学習 / 強化学習法 / 学習制御 |
Research Abstract |
より自然な知識表現を計算機上に実現するには、様々なデ-タ型を扱う枠組みが重要である。本研究は様々なデ-タ型について、帰納学習を用いた知識獲得の理論化を目差すものである。研究成果としては、帰納学習の基礎となる一般化及び持特殊化の枠組みを、ベクトル、列、集合、及びそれらの混合の上で提案したこと、及び帰納学習の元となる実例集合の記憶に基く学習アルゴリズムを提案したことの二点があげられる。前者では、デ-タ型に依存する構文上の最小汎化の手続きについて考察し、個々のデ-タ型に関するバ-ジョン空間を記述することよって、意味論以前に、デ-タ型の選択が学習の複雑性、裏がえせば柔軟性を左右することが、理論的に明らかとなった。文字列の領域に関しては、支法推論を始め過去に多くの研究が存在するが、集合あるいは木構造の領域においては、それとは違った複雑性、つまり照合や汎化のあいまい性が生じることがわかった。また、部分の汎化と要素の汎化を区別することが、個々のデ-タ構造に依存した帰納学習の性質を明らかにし、更に、「型の汎化」の理論化を実現する際の中心概念となる。 後者では、実例に基づく学習のパラダイムを、強化学習法が対象領域とする制御問題に適用し、整数及び実数ベクトル領域について、適応行動シミュレ-ション、倒立振子及び大型監視般の制御への計算機シミュレ-ションによる応用を通してアルゴリズムの実証を行なった。特に倒立振子の制御では、従来のニュ-ラルネットによる方法より、はるかに良い性能が得られた。この手法は汎化を一切行なわずに最も類似した経験に基づいて未知環境での意思決定を行なおうとするものであるが、数値デ-タを含む領域では、記号の場合とは異なり、離散化による汎化よりは距離あるいはファジィ理論の考え方を導入する方が適切であると考えられる。
|