2015 Fiscal Year Annual Research Report
日常空間における集団への円滑な介入とサービス提供に向けた会話状態推定
Project/Area Number |
15K16071
|
Research Institution | Tokyo University of Agriculture and Technology |
Principal Investigator |
中山 雅野 東京農工大学, 工学(系)研究科(研究院), 助教 (60722204)
|
Project Period (FY) |
2015-04-01 – 2016-03-31
|
Keywords | 話者推定 / 無拘束環境 |
Outline of Annual Research Achievements |
オフィスや家庭などの日常空間における会話中の集団に対して,会話や集団活動を阻害することなく,適切なタイミングで情報や各種サービスを提供するロボットの実現に向けたシステム構築の第一段階として平成27年度は無拘束話者推定システムの構築を行った. 本システムでは一定間隔で天井に配置した超指向性マイクモジュールで得られた音圧分布から求めた音源位置ポテンシャルと,天井に設置した広角カメラから画像処理によって得られた人位置を組み合わせることによって話者を推定する.また,超指向性マイクモジュールの総音圧が高い時を発話区間として検出するだけでは在室者の動作音などを発話と誤検出してしまうため,人の声の周波数特徴を利用したVoiceActivityDetectionを併用することにより発話の誤検出を抑制した. 長期計測に向け,1日12時間の日常を対象に自動計測を行った結果,発話を正しく検出した区間に絞ると話者推定精度は93%を達成した.一方で日常生活には歩行時など人の行動音が多く発生する時などを中心に約3割の誤検出があった. また会話の非言語特徴量にもとづく会話状態の推定にむけ,まず基本的な特徴量である発話回数および発話時間について1日分のデータを算出した.その結果,話者ごとの発話量の傾向が実際のものと一致し,集団における各話者の発話傾向が自動分析可能であることを示唆する結果となった.
|