研究課題/領域番号 |
19K20364
|
研究機関 | 慶應義塾大学 |
研究代表者 |
村田 真悟 慶應義塾大学, 理工学部(矢上), 講師 (80778168)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | 予測符号化 / 予測誤差最小化 / 認知ロボティクス / ニューラルネットワーク / インタラクション |
研究実績の概要 |
本研究課題では,人間の他者との協調を支える認知情報処理機構の理解を目的とし,認知神経科学・機械学習・ロボティクスの観点を統合したロボット構成論的手法により取り組む.特に,(i)環境変化や他者のふるまいといった外的要因と(ii)自己の将来の行動に関する計画や意図といった内的要因によって生じる協調の形成とその崩壊に関する動的過程に着目する. 令和三年度は,これまでに構築した決定論的なrecurrent neural network(RNN)ベースのフレームワークに対して,より広範な知覚・行動パターンの学習を目指し,確率的な潜在表現を扱えるように拡張を行なった.具体的には,predictive-coding-inspired variational RNN(PV-RNN)と呼ばれる予測符号化に基づく変分推論が可能なRNNに対して,実時間処理を可能にするために償却推論(amortized inference)を導入した.従来のPV-RNNは,変分推論を順伝播計算と逆伝播計算の繰り返しが必要な勾配法ベースの手法に基づいて行うため潜在変数の計算コストが高く,ロボットの行動生成等の実時間処理が必要な部分に適用することが困難であるという問題点があった.そこで本研究では,時間的に現在から過去に向かって順伝播計算を行うbackward RNNを導入し,償却推論によって潜在変数を求めることで,勾配法における複数回の順伝播計算と逆伝播計算を一度の順伝播計算のみで置き換えることを実現した. 拡張したフレームワークをロボットに実装し,人とロボット間の協調の形成とその崩壊に関する学習実験を行った.実験の結果,学習時に損失関数のハイパーパラメータを調整することでロボットの行動選択が決定論的・確率的になりうることを確認した.さらに,backward RNNを利用した償却推論によって,実時間でロボットによる外部環境の知覚・行動生成が可能であることが確認された.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究では,二個体間におけるインタラクションにおいて,(i)環境変化や他者のふるまいといった外的要因と(ii)自己の将来の行動に関する計画や意図といった内的要因が協調の形成と崩壊をもたらすと考えている. 令和元年度はこのように異なる外的・内的要因を統一的に扱うことが可能な勾配法に基づく最適化手法(adaptation and planning by gradient decent: APGraDe)を提案し,その実装を行った.令和二年度は高次元の画像情報をそのままロボットの視覚情報として扱えるような拡張を実施した.令和三年度はこれまでに構築してきたフレームワークに対して,確率的な潜在表現を扱えるようにbackward RNNを利用した変分推論を導入した.提案手法であるAPGraDeやbackward RNNを利用した変分推論は実ロボットを用いた学習実験によって問題なく動作することを確認している.APGraDeの研究成果については査読付き国際会議で発表し,国内の学術講演会において優秀賞も受賞することができている.また,backward RNNを利用した変分推論に関しても令和四年度に査読付き国際会議に論文を投稿予定である.以上より,現在までの進捗状況はおおむね順調に進展していると評価することができると考えられる.
|
今後の研究の推進方策 |
今後の研究では,令和三年度に構築した計算フレームワークを二台の上半身型ロボットに実装し,二台ロボット間インタラクション実験を実施する.本実験を通して,本研究が想定している外的要因と内的要因によって生じる協調の形成とその崩壊に関する動的過程について,特にモデルの内部ダイナミクスを解析することで考察を行う. 令和四年度中に,令和三年度に構築した計算フレームワーク及び令和四年度に実施予定の二台ロボット間インタラクション実験の結果に関して国際会議論文・学術雑誌論文を執筆し,本研究のまとめとする.
|
次年度使用額が生じた理由 |
国際会議発表旅費・英文校正費として確保していた予算を年度内に支出することができなかったため次年度使用額が生じた. 次年度に国際会議発表旅費・英文校正費として使用予定である.
|