研究課題/領域番号 |
17700177
|
研究種目 |
若手研究(B)
|
配分区分 | 補助金 |
研究分野 |
知覚情報処理・知能ロボティクス
|
研究機関 | 東京工業大学 |
研究代表者 |
片上 大輔 東京工業大学, 大学院総合理工学研究科, 助手 (90345372)
|
研究期間 (年度) |
2005 – 2006
|
研究課題ステータス |
完了 (2006年度)
|
配分額 *注記 |
3,500千円 (直接経費: 3,500千円)
2006年度: 1,200千円 (直接経費: 1,200千円)
2005年度: 2,300千円 (直接経費: 2,300千円)
|
キーワード | ヒューマンエージェントインタラクション / 社会的知性 / エージェント設計 / 強化学習 / 社会的インタラクション |
研究概要 |
本研究は複数の他者(人間orエージェント)との相互作用を通して利用して学習することにより、社会的知能を持つエージェントを構築するための枠組みを設計することを目的としている。社会的エージェントを実現するには、(1)ユーザの特徴を認識、(2)各ユーザとの相互作用から類似点の把握、(3)各状況を考慮したフィルタリングによる適切な類似性の計算、(4)類似性の影響に応じた仮想的学習、(5)適切な行為出力の決定、(6)学習の結果の評価、の6つのステップを必要とする。このように社会的知能をもつエージェントの実現のためには解決すべき多くの技術的課題があるが、本年度は、実環境で自律的に動くシステムを想定し(1)(2)(3)(4)の4つの機能の実現に重点をおいて研究を行った。その主な内容を以下に示す。 まず、ユーザとの相互作用の把握として、ユーザの行為における類似性を判定するためにユーザの行為の流行性について調査を行った。インターネット空間を対象にユーザの行為の規則性により、いくつかの典型的パターンを作成できることを検証した。 次に、これらの類似性をもとに、社会的学習を行うために、ユーザとのインタラクションを利用するための設計技術、具体的には複数ユーザとの相互作用からの無矛盾な学習技術の開発を行った。ここでは、複数人の教示者から与えられる時系列データからなる教示環境に注目し、DP matching手法とクラスタリング手法により、教示者群からの教示をいくつかの教示指針に統合し、ロボット自身がより良い教示指針を、自身の身体性に基づき評価することを目指すものである。40名の被験者と3種類の実機ロボットを用いた実験により、システムが異なる身体性を持ったロボットに対し、それぞれの身体性に最適な教示指針を選択したことを確認した。 さらに、ユーザとのインタラクションを使った社会的機械学習技術、具体的には、強化学習を使った社会的学習技術の開発を行った。ここでは、直接的経験とは別に、ユーザとの相互作用の類似性から代理経験的に学習影響を受けるモデルベースの学習システムM-MULAを開発し、計算機上のマルチタスクシミュレーションにおいて、提案手法野の効果を検証した。 社会的学習は、環境に応じたエージェントの柔軟な知能を構築のため、将来的に極めて有効なコントローラの設計方法になり得る。人間からの教示を最大限に活用する本手法は、現在の学習システムが抱える柔軟な学習の困難さを大きく改善することができるため、その汎用性を今後大きく高めることが期待される。
|