2012 Fiscal Year Annual Research Report
温度画像処理と音声認識による実環境における表情認識に関する研究
Project/Area Number |
22300077
|
Research Institution | Kyoto Prefectural University |
Principal Investigator |
吉冨 康成 京都府立大学, 生命環境科学研究科(系), 教授 (70274769)
|
Co-Investigator(Kenkyū-buntansha) |
田伏 正佳 京都府立大学, 生命環境科学研究科(系), 准教授 (10244188)
|
Project Period (FY) |
2010-04-01 – 2014-03-31
|
Keywords | 表情認識 / 温度画像 / 音声認識 / 母音認識 / 正面判定 |
Research Abstract |
「表情を認識する介護ロボット」、「1人暮らしの話し相手ロボット」の人間状態認識部の開発の礎を築くため、「温度画像処理と音声認識による実環境における表情認識に関する研究」を行う。これまで開発してきた種々の手法をベースとしてシステムを構築し実環境での「任意の発話時」の表情認識を行い、 実用化への課題の抽出と対策の立案を行うことを研究目的としている。 被験者が「正面」を向いた状態で、音声認識システムJuliusを用いて、種々の1単語で音声認識を行い、発声の際の3つのタイミング(「発声直前」、「発声開始直後の母音発声」、「発声終了直前の母音発声」)の顔温度画像3つ1組の学習データを作成する。そして、被験者が自由に顔向きを変えている状況下での1単語の発声時の表情認識を、我々が開発したオンラインシステムを用いて行う。被験者を2~5名とし、対象とする表情パターンは、「喜び」、「悲しみ」、「驚き」、「怒り」、「無表情」の5つとする。表情認識時の正面顔判定には我々が開発した手法を用い、正面顔と判定された時に表情認識を行う。 具体的な研究実積は以下のとおり。 (1)1単語発声時の表情認識における学習データの有効性の経時劣化の対策の検討を行い、いずれの被験者に対しても、特徴ベクトル空間にリジェクト領域を設定することが、表情認識精度を確保するのに有効であることを明らかにした。また、特徴ベクトル空間にリジェクト領域を設定することで、学習データの有効性を検証できることも明らかにした。 (2)音声認識失敗が表情認識精度に大きな影響を及ぼしてはいないことを再度確認した。そして、できるだけ少ない単語を用いて学習を行うことを可能にするアルゴリズムの開発が課題であることを明らかにした。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究の目的を達成するため、(1)1単語発声時の表情認識における学習データの有効性の経時劣化の対策の検討、 (2)音声認識失敗時の表情認識への影響調査とその対策の検討、を計画した。このうち、(1)は当初の計画以上に進展し、(2)はやや遅れている。このため、総合的にみて、概ね順調に進展している。
|
Strategy for Future Research Activity |
研究の目的を達成するため、以下の2点を進める。 (1)学習データ作成時の被験者の負荷軽減策の検討 母音のすべての組合せである5×5=25とおりについて学習データを作成すると、被験者の負担が大きい。このため、代表的な単語を用いて学習データを作成し、25とおりの組合せについて表情認識を行う場合の課題を整理し、できるだけ少ない単語を用いて学習を行うことが可能となるアルゴリズムを検討する。 (2)「任意の発話時」の表情認識における課題の抽出と対策の立案 上記(1)で考案するアルゴリズムを用いて、「任意の発話時」の表情認識を行い、本法を日常生活に適用した場合の課題を抽出し、その対策を立案する。
|
Research Products
(12 results)