研究概要 |
人間と知能機械(以下,単に「機械」)との協調において,人間の操作に対する「願望」を機械に円滑に伝達できるインタフェイスの実現を目標とした.ここでいう「願望」とは,人間の機械操作に対する「陽に表現できない希望」を指す.本研究では,「操作者が主観的に望ましいと感じる力学的な操作特性」を願望の一例として扱った. 操作空間を「フィールド」に分割し,各フィールドに目標粘性係数(以下,単に「粘性係数」)を定義した上で,この粘性係数を調整するためのエージェントを用意する.そして,強化学習を通じ,操作者の願望に見合うように粘性係数をエージェントに自律的に調整させる方法を議論した.議論の焦点は二つある.第一は操作者の願望を反映した調整をエージェントに実現させるための報酬の与え方,第二は願望の時間的な変化に対する自律的な適応を可能にする調整法である. 本研究費で調達・製作した実験装置を用い,操作者と機械との協調的な繰り返し位置決め作業の中で,一回の位置決め作業ごとに装置の操作特性をより望ましいものに調整するという実験を行った.その結果,以下の二点が明らかとなった.すなわち,第一の焦点に対しては,各フィールドに呈示された粘性係数に対し操作者が感じる「主観的望ましさ」,ならびに繰り返し行われる操作のパターンの「収束の度合い」の両方に基づいた報酬を定義すれば,操作者が主観的に満足するように粘性係数を調整できることが明らかとなった.また第二の焦点に対しては,エージェントが持っている「フィールド」と「粘性係数」との対応を記憶した「マップ」を,作業回数の進展に合わせて徐々に「忘却」させていくことが,粘性係数の調整に対する人間の関与を減らし,エージェントの自律的な適応性を高める上でより有効であることが明らかとなった.
|