研究課題/領域番号 |
09480059
|
研究種目 |
基盤研究(B)
|
研究機関 | 千葉大学 |
研究代表者 |
市川 熹 千葉大学, 工学部, 教授 (80241933)
|
研究分担者 |
畑岡 信夫 (株)日立製作所, 中央研究所, 主任研究員
堀内 靖雄 千葉大学, 工学部, 助手 (30272347)
|
キーワード | 音声対話 / 自然対話 / 抑揚 / 話者交替 / 心理要因 / 抑揚木 / 結合係数 / マルチエージェント |
研究概要 |
当研究室で収集して来た自然対話音声コーパス(千葉コーパス)を利用し、文や談話構造、意味構造、強調や感情、対話の発話交替のタイミング等と抑揚情報の関係を解析している。また、新たに音声理解向きの強化学習方式の開発を進め、状況変化に強いシステム実現の基礎技術の構築を狙っている。さらに、これらの結果をもとに規則性の解析を行い、将来実現されるべき音声対話インタフェース技術の基礎とすべく抑揚情報を活用した対話音声言語理解モデルを構築することが狙いである。また、そのエンジンとして、マルチエージェント方式を活用した協調的実時間処理手法の検討を進めている。 具体的には、ベクトル量子化手法を用いて抑揚(基本周波数及びパワー)パターンを符号化し、それを用いた対話音声に表れる基本周波数符号系列と音声間の休止区間情報を用いて話者交替を80%程度の精度で予測山来る見通しを得た。また、100ミリ秒の休止区間で挟まれた音声を発話単位として、発話単位間の結合係数を主成分分析法を用いて客観的に定義する方法を試み、その第1主成分で決まる結合係数が発話の維持等の心理的要因を、第2主成分によるものが文の句構造を反映した情報を主に表す可能性があることを見いだした。 対話音声を実時間で状況に応じて柔軟に処理するためには、音韻認識、抑揚情報処理、発語予測、対話制御、理解処理、応答出力等を実時間で協応的に並行処理することが必要と考えられる。このための基本アーキテクチャとして、各処理を担当するエージェントの協調によるマルチエージェント方式を想定し、その音声処理向きの基本方式の予備検討を開始、更に各工一ジェントの学習方式として経験型強化学習などの検討も開始した。
|