研究課題/領域番号 |
18K11381
|
研究機関 | 湘南工科大学 |
研究代表者 |
斉藤 隆 湘南工科大学, 工学部, 教授 (90633636)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 音声合成 / 読み聞かせ / 韻律データベース |
研究実績の概要 |
現在の音声合成システムの多くは、1文単位の情報に基づき個々の文毎に独立した音声合成処理を行っている。そのため、文の集合体としてのストーリーの内容を聞き手に効果的に伝え、理解を促すような用途にはやや不十分である。本研究の目的は、情感豊かに物語の読み聞かせに適用できるような音声合成の枠組みの実現に向けて、プロのナレータの読み聞かせの技法に着目して彼らの読み聞かせ戦略の詳細な分析を行い、それに基づいた合成モデルの検討を行うことである。 初年度である当該年度では、本研究の土台となる読み聞かせデータベースの構築を中心に実施した。読み聞かせの物語素材としては日本の昔話9話を用い、同一の内容について、読み聞かせのスタイルとニュートラルのスタイル(ニュースを読むような通常の読み上げ方として指示)の2つのスタイルで、話者6名について録音した。収録音声について、音声の基本的な区分情報(音素、アクセント句、呼気段落等)のラベリングを半自動で行える環境を構築した。読み聞かせ音声についてニュートラルな発声との対比を行い、F0、速度、ポーズ長において特徴的な差異を確認した。また、物語展開に関する特徴的なイベント(シーンイベント:場面の切り替わり、感情イベント:話者の感情の変化、キャライベント:登場人物の交代)についての基礎的な分析を行った。さらに、読み聞かせスタイル発話に関する話者の技量と音声パラメータとの関係性についても考察を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
読み聞かせ音声のデータベース化についてはほぼ計画通り進んできている。ただ、音声収録環境の準備や音声分析プログラムの整備に予想以上に時間がかかったことや、物語イベントについては基礎的な考察に留まりデータベース上でのラベリングがやや遅れ気味であること等から、進捗状況はやや遅れていると判断した。
|
今後の研究の推進方策 |
これまでに収録した読み聞かせ音声についてのデータベース化作業を継続して進めるとともに、少し遅れ気味であった物語イベントの体系化に関する検討を実施していく。また、初年度のデータ分析において垣間見えた話者の読み聞かせの技量と音声パラメータの関連性について、さらに考察を深めていく。
|
次年度使用額が生じた理由 |
音声収録の費用が予想より下回ったことや、初年度はデータベース構築に時間を多く割いたため、国外での発表を見合わせたことによって残額が生じた。この残額については、本年度以降において当初計画の実施を補充する形で組み入れていく予定である。
|