研究課題/領域番号 |
15K00390
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
石本 祐一 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, 特任助教 (50409786)
|
研究分担者 |
榎本 美香 東京工科大学, メディア学部, 講師 (10454141)
寺岡 丈博 東京工科大学, メディア学部, 助教 (30617329)
|
研究期間 (年度) |
2015-10-21 – 2019-03-31
|
キーワード | 発話末予測 / 自発発話 / 韻律 / 発話末要素 / 文節係り受け |
研究実績の概要 |
自発会話において聞き手は何らかの情報を用いて話し手の発話末を予測し、発話末の到来前に次話者として話し出す準備を行うことで発話間に空隙のない話者交替を実現している。本研究においては発話に含まれる統語情報と韻律情報が発話末予測の手がかりになりうると考え、言語情報として発話末要素や係り先未定文節数、韻律情報として発話中の基本周波数(F0)やパワー、モーラ長を用いた発話末予測を試みた。 昨年度に構築したモデルはある文節が発話末か否かの検出問題に対し高い適合率を示したが、モデルに用いた韻律情報は各文節末のアクセント句から抽出していたため、発話末では発話末直前のアクセント句の情報を用いることになり、聞き手が予測に利用するとは言い難い問題があった。聞き手の発話計画にかかる時間を考えると、発話末よりも前に出現する情報から発話末の予測が行われなければならない。 そこで今年度は、文節末よりも前に出現する言語情報と韻律情報から発話末の到来を予測するモデルを基に分析を行った。各文節が発話末付近か否かを言語情報および韻律情報から予測するロジスティック回帰の階層ベイズモデルを構築しMCMC法によるパラメータ推定を行った結果、言語情報としては発話末要素の有無の影響が大きいことと、F0やパワーの有用性が個人によって異なり、共通に使われる韻律情報が存在しないことがわかった。すなわち、発話者によって発話末予測に利用される韻律情報が異なる可能性が示唆された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
分析に用いるデータ数の増加を計画していたが、アノテーション作業に遅れが生じたことにより当初の予定よりも分析対象データが揃わなかったため。
|
今後の研究の推進方策 |
これまでの分析において千葉大学3人会話コーパスを自発会話データとして使用してきたが、千葉大学3人会話コーパスには統語情報のアノテーションが付与されておらず未公開となっている音声データが存在する。そのデータに対してアノテーションを付与し、データ数を増加させることで本研究課題における分析の精緻化および結果の汎用性の獲得をはかる。 最終的に本研究課題で付与したアノテーション情報は、他の研究の発展に寄与するよう公開する。
|
次年度使用額が生じた理由 |
2017年度の研究成果について、2018年度に開催される国際会議において研究発表を行う。
|