研究課題/領域番号 |
15K00390
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
石本 祐一 大学共同利用機関法人人間文化研究機構国立国語研究所, 研究情報資料センター, 特任助教 (50409786)
|
研究分担者 |
榎本 美香 東京工科大学, メディア学部, 講師 (10454141)
寺岡 丈博 東京工科大学, メディア学部, 助教 (30617329)
|
研究期間 (年度) |
2015-10-21 – 2018-03-31
|
キーワード | 基本周波数 / 発話末予測 / 発話末要素 / 話者交替 / Final lowering |
研究実績の概要 |
従来の読み上げ音声の分析において発話末での急激なF0下降はFinal loweringと呼ばれ、発話末を特徴付ける音響情報であるとされている。自発発話においても、発話の終了に関わる統語情報として日本語では助動詞「です・ます」や終助詞「ね・よ」などの発話末要素が存在することが知られており、発話末要素部分で急激な基本周波数(F0)の下降が現れること、知覚実験により発話末要素の出現前に発話末要素が後続するかどうかが判別できること等が明らかになっている。 これまでの知見より、発話末に顕著な韻律変化が生じており、その変化が発話末予測の手がかりとなっている可能性が考えられる。しかし、これらの特徴が実際にヒトの発話末予測に利用されているのかは明らかになっていない。 そこで、発話末要素の有無を考慮した上で、発話末付近のF0を操作した音声を作成し、発話末のF0下降が発話末予測に与える影響を調べた。千葉大学3人会話コーパスに収録されている自発発話を用いた知覚実験の結果、発話末付近でのF0下降は発話末要素の有無の予測や発話末予測に影響を与えないことがわかった。すなわち、発話の終了に関わるF0特徴は局所的なF0変化(Final lowering)ではなく大局的なF0変化である可能性が高い。 さらに、長い自発発話が収録されている日本語話し言葉コーパスを用いて、自発発話全体にわたるF0変化を調査したところ、自発性の高い対話音声では発話末のFinal loweringは現れにくく、発話全体にわたるF0発話冒頭から発話末にかけてF0が低下していることが統計的解析により示された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
非対面環境における複数話者会話音声の収録およびアノテーションを平成27年度中に開始する予定であったが、機材の選定および収録設定の決定に遅れが生じたため、平成27年度中は既存のコーパスを用いた分析にとどめ、新規コーパスの収録は十分な計画を立てた上で平成28年度に行うこととした。
|
今後の研究の推進方策 |
今後の分析に使用する非対面環境における自然会話の収録を行う。既存の自然会話コーパスである日本語話し言葉コーパスや千葉大学3人会話コーパス等は対面で収録されており、話者交替に置いて音声・言語だけではなく視線やジェスチャ等も利用されていると考えられ、音声のみに現れるインタラクションの特徴を捉えることが困難である。一方、既存の非対面音声コーパスはほとんどが課題遂行対話で構成されており、質問・応答の対をなす隣接ペアの形になりやすいことから、日常会話のような自然なインタラクションを探る本研究課題の用途には不十分である。そこで、新たに非対面環境において音声・言語情報のみで話者交替が起こる状況での複数人会話を収録する。その際、既存の対面コーパスとの比較に用いるため、2名10組および3名10組の自由会話でそれぞれ2時間程度のデータ収録を行う。また、将来的な人間対音声対話エージェント(音声アシスタント)への応用を考慮し、音声アシスタントとの会話をWizard of OZ方式で収録する。 収録と並行して、収録データおよび既存コーパスに対するアノテーション付与を行う。既存コーパスは異なる機関・目的で整備されているため、付与されているアノテーションは様々である。そこで、既存コーパスに統一したアノテーションを付与する。また、収録データにも同様のアノテーション付与を行い、非対面自然会話コーパスとして整備する。 構築したコーパスを基に、対面環境と非対面環境における発話の音声言語特徴を比較し、非対面で顕著となる音響・統語情報を明らかにする。対面環境では話者交替において音声・言語以外に視線やジェスチャも利用されている。一方、非対面環境では音声・言語だけが利用でき、それらで視線やジェスチャ等のモダリティ情報を補うために、対面とは異なる音声言語特徴の表出が見られると考えられる。
|
次年度使用額が生じた理由 |
平成27年度中に開始する予定であった非対面環境における複数話者会話音声の収録およびアノテーションを機材の選定および収録設定の決定に遅れが生じたことにより平成28年度に行うこととしたため、機材に関わる物品費と収録に関わる協力者への謝金の支出を次年度に繰り越したため。
|
次年度使用額の使用計画 |
平成27年度に予定していた非対面環境における複数話者会話の収録およびアノテーションに関わる費用を、実施時期の変更にtともない次年度使用額より支出する。
|