研究課題/領域番号 |
18K11514
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
石本 祐一 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, 特任助教 (50409786)
|
研究分担者 |
榎本 美香 東京工科大学, メディア学部, 講師 (10454141)
寺岡 丈博 拓殖大学, 工学部, 助教 (30617329)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 自発発話 / 話者交替 / 発話末予測 / 発話単位 / 非対面環境 |
研究実績の概要 |
コンピュータとの音声対話により日常生活支援を行う音声アシスタントが用いられるようになってきているが、自然な話者交替をともなう会話は実現できていない。これは、発話の終わりを無音区間の存在により検出しているためであり、音声認識や自然言語処理による発話理解が今後どれほど高速化しても話者交替時に不自然な間が空くことは避けられない。本研究は会話における話者交替の適切なタイミングを「会話の間合い」と定義し、異なる形態の複数の自発会話コーパスを用いて、発話末予測に関わる音声・言語特徴、および会話の形態ごとに適した会話の間合いを明らかにすることを目的とする。2018年度は、分析に用いる自発音声データの規模拡張のため、すでに一部が整備・公開されている「千葉大学3人会話コーパス」のデータのうち未整備分の240時間についてターン構成単位を基とした発話単位の認定および形態論情報の付与、および韻律情報として基本周波数値の付与を行なった。これにより分析データがおよそ3倍に増加し、より詳細な検討ができるようになった。また、視覚情報を伴わない音声のみによる会話において発話末予測がどのように行われるのかを調べるために、非対面環境における3人会話データを今後収録していく。そのため、機材・環境などの収録計画を進め、2019年度の本収録に先立って試験収録を実施した。このデータにより対面・非対面環境による会話の間合いの自然さの違いや用いられる特徴についての検討が可能となる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
分析対象データの増加のために、未整備の自発会話音声データに対しラベリングを行なった。既存の公開コーパスと同等規模のアノテーション付与はできなかったものの、本研究に必要なラベルは概ね付与できているため、進捗に遅れは生じていない。
|
今後の研究の推進方策 |
「千葉大学3人会話コーパス」の増加データおよび国立国語研究所で構築している「日本語日常会話コーパス」により自発音声の多様性がある程度確保できたことから、それらに対して発話末予測に関わる音声・言語特徴を調べる。 また、2019年度中に非対面環境における自発会話データの収録を行い、既存データと同様に分析を行う。最終的に、本研究で収録した非対面環境自発会話データはコーパスとして整備し、様々な研究の発展に寄与するよう公開する。
|
次年度使用額が生じた理由 |
2018年度中に実施する予定であったデータ収録およびアノテーション作業の一部を2019年度に実施することにしたため。
|