| 研究課題/領域番号 |
22K18477
|
| 研究種目 |
挑戦的研究(萌芽)
|
| 配分区分 | 基金 |
| 審査区分 |
中区分2:文学、言語学およびその関連分野
|
| 研究機関 | 千葉工業大学 |
研究代表者 |
有本 泰子 千葉工業大学, 情報変革科学部, 教授 (60586957)
|
| 研究分担者 |
森 大毅 宇都宮大学, 工学部, 准教授 (10302184)
|
| 研究期間 (年度) |
2022-06-30 – 2026-03-31
|
| 研究課題ステータス |
交付 (2024年度)
|
| 配分額 *注記 |
6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
2024年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2023年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
2022年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
|
| キーワード | speech-laugh / 音響分析 / speech-laugh合成 / フォルマント周波数 / ケプストラム分析 / アノテーション / コーパス / 分節音 / Speech-laugh |
| 研究開始時の研究の概要 |
Speech-laughとは,発話中に肺からの突発的な呼気流により生じるしゃべりながらの笑い声のことで,声の震えや気息性のある声質を伴って発声される現象である。本研究は,どのような声道形状であるときにspeech-laughが生じやすくなるかを明らかにするため,音声対話コーパスを使用してspeech-laughの冒頭の音素がどのような調音であるのかを音響音声学的に検証する。また,speech-laughの発生機序に準じてその発生タイミングを操作した合成音声を作成し,その発生タイミングがどの程度speech-laughらしさに寄与するのか検証する。
|
| 研究実績の概要 |
Speech-laughの発生機序を解明するために、Speech-laughの開始時点の音声と非笑い時の音声の音響的な違いを、声道の特性を表すフォルマント周波数と、声源の特性を表すメルケプストラム係数を用いて分析した。フォルマント周波数(F1とF2)の分析では、Speech-laugh開始時の母音/a/と/o/のF1値が非笑い時よりも大きいことが明らかになった。メルケプストラム係数の分析では、低次の係数がSpeech-laughと非笑い時の音声を識別する上で重要な役割を果たしていることを示した。これらの結果は、Speech-laughの開始時に声道形状と声源特性が非笑い時とは異なることを示唆しており、特に口の開き方と呼気の乱れが関連している可能性を指摘する。 また、深層学習技術を用いたspeech-laugh合成モデルを構築し、その合成品質および笑い開始位置の制御性に関する評価を行った。自然性評価の結果、女性話者モデルで合成したspeech-laughは人間のspeech-laughと同等の自然性を持つと評価された。笑い声らしさ評価の結果、合成したspeech-laughは非笑い発話よりも笑い声らしいと評価された。書き取り実験および笑い開始同定実験では、事前学習を用いたspeech-laugh合成のほうが、より正確に言語情報を書き取ることができることを示し、事前学習が音声学的明瞭度の維持に貢献することを明らかにした一方で,事前学習ありのモデルの方がspeech-laughの正確な笑い声開始位置を同定することが難しいことを示した。 本研究に関連する成果として,査読付き学術雑誌で6件の論文を発表した。それ以外にも,査読付き国際会議で1件,国内学会で10件の発表がある。また,国内で発表した1件の研究に対して,その研究内容および独創性が評価され学会より賞を授与された。
|
| 現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
言語普遍性の検証を可能とするため,日本語とそれ以外の対話コーパスを対象とする予定であったが,外国語の自発対話音声を入手することが困難であり,実現できていない。2022年度は,その分を年代を拡張して,20代から70代までのspeech-laughラベリングを実施した。2023年度は,現象のドメイン・依存性を確認するため,419名の大規模な音声資料を利用した分析を実施した。2024年度はspeech-laugh合成を用いた笑い出し知覚実験に着手し,成果を出し始めている。そのため,概ね順調に進展している。
|
| 今後の研究の推進方策 |
これまでの研究成果をまとめ,査読付き学術誌や査読付き国際会議に投稿する予定である。
|