2011 Fiscal Year Annual Research Report
韻律・声質の動的特徴および形態素・品詞を考慮した発話意図認識システムの構築
Project/Area Number |
23680019
|
Research Institution | Advanced Telecommunications Research Institute International |
Principal Investigator |
石井 カルロス寿憲 株式会社国際電気通信基礎技術研究所, 知能ロボティクス研究所, 研究員 (30418529)
|
Keywords | 知覚情報処理 / 音声情報処理 / パラ言語情報処理 / 韻律情報処理 / 言語情報処理 / 声質特徴 / 感情音声 / 自然対話音声 |
Research Abstract |
自然対話には,同意の「ええ」,聞き返しの「え?」や驚きの「え!?」のように同じ音素列でも,言い方(発話スタイル)によって表現される意図が変わるものが多くみられる.しかし,発話スタイルの適切な音響的表現は確立されておらず,発話意図との関連も一途ではないため,従来の対話システムは,音素列に相当する発話内容のみを認識するに留まっており,自然対話が円滑に成立しない場合が生じる.本提案では,発話スタイルとして従来の韻律特徴に加え,提案者独自の声質特徴の動的特徴を導入し,形態素や品詞の言語情報も考慮することにより,音素列のみでは正しい意図が伝達出来ない発話の意図認識システムを実現することを目的としている. 平成23年度(初年度)には、音声および声帯振動のデータと言語情報,発話スタイル,発話意図の情報を含む自然対話音声データベースの構築を開始した.まず、本研究所で先行研究より収集したデータベースを用い、それぞれの発話に付与されている「発話意図」および「談話機能」のラベルの見直しと整理を行った.また,3名の被験者間の一致度を分析し,ラベルの統一を進めた.言語学の専門家も含め、議論を重ねた結果、これまでのラベルを「発話行為」、「心的態度」、「形態素的表現」、「談話機能」の種類に分けることとした。 声質に関する音響特徴分析においては、パラ言語情報を多く伝達する「りきみ」と「気息音」に焦点を当て、後者に関しては国際会議Interspeechでも研究成果の発表を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成23年度の目標として、「対話音声データベースの構築」、「韻律と声質に関わる音響特徴抽出」および「言語情報の解析」の項目が掲げられているが、データベースに重要なパラ言語情報のラベルが付与され、韻律・声質に関連する音響特徴の改善を試み、パラ言語情報の伝達における言語情報の影響を分析することにより、すべての項目が順調に進展している。
|
Strategy for Future Research Activity |
今後の研究も計画書に沿って、進める予定である。平成24年度には、平成23年度の項目を引き続け、「発話スタイルと発話意図との関連構造の解明」という新たな項目を進める。ここでは、データベースに付与されたラベル情報を基に、言い方と伝達される意図の関連性を導き出し、この関連性は1対1の関係ではないことも理解しつつ、言語情報がいかに影響しているのかを分析する。
|
Research Products
(3 results)