研究課題/領域番号 |
15K00390
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
石本 祐一 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, 特任助教 (50409786)
|
研究分担者 |
榎本 美香 東京工科大学, メディア学部, 講師 (10454141)
寺岡 丈博 東京工科大学, メディア学部, 助教 (30617329)
|
研究期間 (年度) |
2015-10-21 – 2018-03-31
|
キーワード | 発話末予測 / 韻律 / 発話末要素 / 文節係り受け構造 |
研究実績の概要 |
音声アシスタントとの会話で円滑な話者交替を実現するためには、話し手の発話末を音声アシスタントが予測し遅れなく話し始めること、さらに音声アシスタントの発話においては聞き手に発話末を予測させるような発話形態で提示することが重要となる。本研究ではヒトが発話末予測に利用している音響的・言語的な特徴を明らかにすることを目的として、自発発話の分析を行っている。 従来、発話の終わりを示すとされていた特徴として、発話末に現れる基本周波数の急激な下降(Final lowering)があるが、日本語話し言葉コーパスや千葉大学3人会話コーパスに収録されている自発性の高い発話の分析の結果、Final loweringは日本語の発話末に置かれることが多い統語要素(発話末要素)に起因する可能性が高く、発話末予測に利用する特徴に適さないことがわかった。 そこで、発話末予測が統語・韻律情報が組み合わさり発話中から発話末位置が投射されることによりなされると考え、平成28年度は新たに統語情報として文節係り受け構造に起因する係り先未定文節数に着目した。係り先未定文節数とはある文節の直後において『いくつの文節の係り先がまだ生起していないか』を示すものであり、文の進行に伴い漸進的に決定される。文末において係り先が全て出現することで係り先未定文節数は0となる。しかし、自発発話では係り先が現れずに発話が終了することもあり、係り先未定文節数のみで発話末を決定することはできない。 係り先未定文節数と音響特徴との関連を調べ、係り先未定文節数および音響特徴を用いた一般化線形混合モデルによる発話末予測モデルを構築したところ、クローズドテストにおいて適合率0.89、再現率0.67となった。これは音響情報のみを用いた場合よりも適合率・再現率が大きく上昇しており、発話末予測に統語情報と韻律情報の組み合わせが効果的であることが示された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
非対面環境における複数話者会話音声の収録に計画よりも遅れが生じているため。
|
今後の研究の推進方策 |
今後の分析に使用する非対面環境における自然会話の収録を引き続き行う。また並行して収録したデータに対し既存の自然会話コーパスと同種のアノテーションを付与する。その後、既存の対面環境音声の分析結果との比較を通して音声のみのコミュニケーションとなる非対面環境で顕著となる音響・統語情報を明らかにする。 最終的に本研究課題で収録したデータは非対面自然会話コーパスとして整備し、他の研究の発展に寄与するよう公開する
|
次年度使用額が生じた理由 |
平成28年度中に終了する予定であった非対面環境における複数話者会話音声の収録に遅れが生じたため。
|
次年度使用額の使用計画 |
平成28年度に予定していた非対面環境における複数話者会話の収録およびアノテーションに関わる費用を、実施時期の変更に伴い次年度使用額より支出する。
|