2015 Fiscal Year Annual Research Report
社会的制約を考慮したロボット用音声対話システムの実現
Project/Area Number |
14J02714
|
Research Institution | Osaka University |
Principal Investigator |
杉山 貴昭 大阪大学, 工学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2014-04-25 – 2017-03-31
|
Keywords | 音声対話システム / ヒューマン・ロボットインタラクション / 非言語情報の利用 |
Outline of Annual Research Achievements |
1.公共の場で利用可能な音声対話ロボットの実現のために,対話システムの音声認識モジュールと入力音判別モジュールの高精度化に関する分析と実装を行った。採用第1年度目の成果により、本研究課題の遂行に必要なロボット用音声対話システムの基本的なモジュールが完成した。今年度は実環境で発生する様々な音に対してロボットが頑健に動作するために、音声認識と入力音判別時に利用している音響的なモデルに関する分析を行った。まず、音声認識モジュールに関して、(1)ロボットのマイク特性と周辺雑音を考慮した音響モデルと、音源定位のための伝達関数を作成した。また、(2)音源の発生方向に応じてロボットに搭載されている4chマイクの利用方法を変更した。これにより、これまでの方法に比べて、音声認識精度が約35%向上した。次に、入力音判別モジュールに関して、(1)Gaussian Mixture Modelの学習データのための、ロボットのマイク特性を重畳および周辺雑音を加えたデータの利用と、(2)最適な混合数の分析を行うことで、入力音判別精度が約50%向上した。さらに、これらをロボット用音声対話システムに適用させた。 2.ロボットへの入力音に対する応答義務の推定に関する研究を実施した。本研究は、研究課題である社会的制約に関する研究の1つであり、昨年度から実施している。昨年度は、これまでの対話研究では利用されてこなかった対話中のユーザの身体の状態を用いて,応答すべきか否かを推定する手法を提案した.今年度はさらに分析を進め、入力音の種類毎(例えば、雑音やユーザ発話など)による性能評価などを実施した。この評価実験により、従来手法に比べて、全ての種類の入力音に対して提案手法がより高精度に応答義務を推定できることを示した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
まず、今年度の目標の一つであった、対話システムの音声認識モジュールと入力音判別モジュールの高精度化を実施することができた。さらに、前年度に構築したロボット用音声対話システムに適用した。 また、社会的制約に関する研究として、ロボットの応答義務を推定する研究も実施できた。当初の予定通り、この成果を国内・国際学会で発表し、論文を投稿することができた。 一方で、一般ユーザを対象として被験者実験は実施することができなかった。 以上より、おおむね順調に進展していると判断した。
|
Strategy for Future Research Activity |
今後は、対話中にロボットが話題の転換を検出し、ユーザに対して適切に応答することを目的とし、話題転換の有無の推定に関する研究を実施する予定である。社会的制約を考慮したロボット用音声対話システムを実現するには、言語レベルでの柔軟な処理(例えば、言語理解・応答生成)が不可欠である。これができれば、ロボットは発話生成時に現在の話題に関する履歴のみを考慮することができる。この研究の展望として、ロボットによる円滑な対話展開を実現することを考えている。具体的には、ユーザとの対話が滞ったり、話題の推定がうまくいかない場合に、話題が変わりうる箇所をロボットが検出できれば、その時点で別の話題にロボットが能動的に切り替えることを検討している。これは、社会的制約を能動的に利用する視点での研究に相当する。また、順調に研究が進めば、この知見をロボット用音声対話システムに組み込み、実際に適切な応答生成が実現できることを確認する。今年度は、この研究を遂行し、論文執筆や学会発表を行う予定である。その後、本研究の成果を博士論文にまとめる。
|
Research Products
(4 results)