研究概要 |
自然対話には,同意の「ええ」,聞き返しの「え?」や驚きの「え!?」のように同じ音素列でも,言い方(発話スタイル)によって表現される意図が変わるものが多くみられる.しかし,発話スタイルの適切な音響的表現は確立されておらず,発話意図との関連も一途ではないため,従来の対話システムは,音素列に相当する発話内容のみを認識するに留まっており,自然対話が円滑に成立しない場合が生じる.本提案では,発話スタイルとして従来の韻律特徴に加え,提案者独自の声質特徴の動的特徴を導入し,形態素や品詞の言語情報も考慮することにより,音素列のみでは正しい意図が伝達出来ない発話の意図認識システムを実現することを目的としている. 平成23年度(初年度)には、音声および声帯振動のデータと言語情報,発話スタイル,発話意図の情報を含む自然対話音声データベースの構築を開始した.まず、本研究所で先行研究より収集したデータベースを用い、それぞれの発話に付与されている「発話意図」および「談話機能」のラベルの見直しと整理を行った.また,3名の被験者間の一致度を分析し,ラベルの統一を進めた.言語学の専門家も含め、議論を重ねた結果、これまでのラベルを「発話行為」、「心的態度」、「形態素的表現」、「談話機能」の種類に分けることとした。 声質に関する音響特徴分析においては、パラ言語情報を多く伝達する「りきみ」と「気息音」に焦点を当て、後者に関しては国際会議Interspeechでも研究成果の発表を行った。
|