Research Abstract |
本研究は,意思表現の困難な高齢者・障害者のために,本人の微小な運動と本人意思のつながりを学習することによるコミュニケーション支援や,使用機器に対する一人ひとりの「癖」にあわせたインターフェースの自律的最適化の実現を目指し,その前段階として,それらへの応用が期待できる強化学習システムについて,乳幼児期における知覚・運動の相互発達を模倣した強化学習システムを開発することにより,システム設計者の負担減少のためのより適用性の高い強化学習システムの実現を目的としている. 近年,強化学習は,多くの工学研究者によってエージェントの制御規則の適応的調節・獲得などに応用しようとする試みが盛んであるが,実用性といった観点から,状態空間や行動空間を予め適切に設計することが難しいことが問題点の一つとなっている. そこで,平成22年度において,前年度に提案し有効性の確認を行った,乳幼児期の運動発達を模倣した「Switching強化学習」をさらに発展し,乳幼児期の知覚発達を模倣した機能を加えた「状態・行動空間の適応的共構成法」を提案し,さらに可視化の容易な1次元の連続状態・連続行動空間を有する経路計画問題を取り上げた計算機実験により,他の手法と性能比較をすることで提案手法の有効性・適用性を確認した. これにより,乳幼児期の運動発達・知覚発達の模倣が,強化学習システムにとって有効であること明らかにし,同時に,強化学習のもつ実社会への適用可能性をより高いものとした.またこれにより,生物と同様に,内部構成的に一定でない不安定なシステムであるほうが,一定で安定なシステムより有効なシステムとなりうるということを示す一例となりえた.
|