研究概要 |
「表情を認識する介護ロボット」,「1人暮らしの話し相手ロボット」の人間状態認識部の開発の礎を築くため,「温度画像処理と音声認識による実環境における表情認識に関する研究」を行う.これまで開発してきた種々の手法をベースとしてシステムを構築し実環境での「任意の発話時」の表情認識を行い,実用化への課題の抽出と対策の立案を行うことを研究目的としている.発声の際の3つのタイミング(「発声直前」,「発声開始直後の母音発声」,「発声終了直前の母音発声」)の温度画像を用いて表情認識を行うことを,実用化の姿として想定し,平成22年度においては,基礎的な検討として,1単語の発声時の温度画像を用いて表情認識を行った.被験者が「正面」を向いた状態で,音声認識システムを用いて,種々の1単語で音声認識を行い,発声の際の3つのタイミング(「発声直前」,「発声開始直後の母音発声」,「発声終了直前の母音発声」)の顔温度画像3つ1組の学習データを,母音のすべての組合せである5×5=25とおり作成した.そして,被験者が「正面」を向いた際の1単語の発声時の表情認識を行った.対象とする表情パターンは,「喜び」,「悲しみ」,「驚き」,「怒り」,「無表情」の5つとした.3名の被験者に対する平均表情認識率は,80%であった.また,母音の平均認識率は,84%であった.次に,被験者に対して,正面判定を行い,正面を向いた際に,母音判定,表情認識を行う手法を開発した.被験者が顔向きを自由に変えるという条件で,6名の被験者に,上記5つの表情をしてもらった際の表情認識を,本システムで行った.1単語発声の際の平均表情認識率は,84%であった.また,正面判定の正答率は99.5%,母音の平均認識率は88%,であった.そして,2名の被験者について,学習データの有効性の経時劣化の調査を行った.
|