研究課題/領域番号 |
18K11381
|
研究機関 | 湘南工科大学 |
研究代表者 |
斉藤 隆 湘南工科大学, 工学部, 教授 (90633636)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 音声合成 / 読み聞かせ / 韻律データベース |
研究実績の概要 |
現在の音声合成システムの多くは、1文単位の情報に基づき個々の文毎に独立した音声合成処理を行っている。そのため、文の集合体としてのストーリーの内容を聞き手に効果的に伝え、理解を促すような用途にはやや不十分である。本研究の目的は、情感豊かに物語の読み聞かせに適用できるような音声合成の枠組みの実現に向けて、プロのナレータの読み聞かせの技法に着目して彼らの読み聞かせ戦略の詳細な分析を行い、それに基づいた合成モデルの検討を行うことである。 初年度は、本研究の土台となる読み聞かせデータベースの構築を中心に実施した。読み聞かせの物語素材としては日本の昔話9話を用い、同一の内容について、読み聞かせのスタイルとニュートラルのスタイル(ニュースを読むような通常の読み上げ方として指示)の2つのスタイルで、話者6名について録音した。収録音声について、音声の基本的な区分情報(音素、アクセント句、呼気段落等)のラベリングを半自動で行える環境を構築した。読み聞かせ音声をニュートラルな発声との対比を行い、F0、速度、ポーズ長において特徴的な差異を確認した。また、物語展開に関する特徴的なイベント(シーンイベント:場面の切り替わり、感情イベント:話者の感情の変化、キャライベント:登場人物の交代)についての基礎的な観察を行った。 次年度においては、これまでに収録した音声についてのラベル付け作業を継続して行ってきている。また並行して、読み聞かせスタイルの発話分析において、話者の技量と音声パラメータの関係性を分析した結果に基づいて話者2名を選定した。これらの話者を対象に読み聞かせ技法についての詳細な検討を行うための音声データの収録を行い、それを元にした技法に関するデータベースの構築作業を進めている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
読み聞かせ音声のデータベース化の基本設計と初期構築を終えた段階で、音声収録環境の機材老朽化に伴う不具合を解決するために、関連機材、ソフトウェア等を一新した。そのため、第2段階での音声収録作業スケジュールに遅れがでている。また、研究補助の学生に対するラベリング作業の指導が種々の要因から予想以上に時間がかかっており、本来のラベリング作業の進捗に影響している。以上のようなことが、全般的な進捗に影響を与えており、やや遅れていると判断した。
|
今後の研究の推進方策 |
読み聞かせ音声についてのデータベース化作業を完了に近づけるとともに、読み聞かせ技量と音声パラメータの関係性、読み聞かせ表現および物語イベントの体系化に関する検討を実施していく。
|
次年度使用額が生じた理由 |
次年度使用額(B-A)の金額自体は大きくない。最終年度としての研究計画をしっかりと進めてきたい。
|