研究課題/領域番号 |
20K11869
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 公立諏訪東京理科大学 |
研究代表者 |
水野 秀之 公立諏訪東京理科大学, 工学部, 教授 (30833892)
|
研究分担者 |
中嶋 秀治 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 研究主任 (90832684)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2021年度: 260千円 (直接経費: 200千円、間接経費: 60千円)
2020年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
|
キーワード | 高齢者向け発話データの整備 / 韻律分析 / 韻律モデル構築 / 言語モデル構築 / 言語的モデルの構築 / 発話テキスト収集 / 音声収録 / 高齢者向け発話 / 基本周波数 / 統計分析 / 音声合成 / 高齢者 / 韻律制御 |
研究開始時の研究の概要 |
高齢者の音声による情報把握の支援については,これまで多くの補聴器などの音響系の研究が行われてきた一方で,高齢者にとって内容を理解しやすいような音声の特徴に関する研究はあまり行われていない.そこで,本研究では高齢者にとって聞き取りやすい音声の韻律(抑揚や話す速さなどの音声の特徴)制御方法の確立を目的とし,以下の順に研究を進める. まず、高齢者にとって聞きとりやすい音声を収集しその言語的音声的な特徴を分析し,次に得られた特徴に基づいて文章全体または文章の一部の内容に応じて韻律の制御を行なう高齢者向けの韻律制御方式を確立する.この研究の成果は,高齢者の情報格差を補償することが期待できる.
|
研究成果の概要 |
2020年度は高齢者から最も発話が聞き取りやすいと評価された女性話者1名により重要箇所にラベルを付与した136文書の高齢者を意識した発話と読み上げ発話の収集を行った. 2021年度は2種類の音声間の韻律の比較分析を行い,F0の平均値及びレンジの拡大及び重要箇所でのF0最大値の上昇を確認した. 2022年度は韻律制御モデルの構築を行い客観評価ではF0最大値については決定係数0.75と高い精度で制御可能であることがわかったが,分析合成音を用いた主観評価実験からは聞き取りやすさに関する効果は確認できなかった.また,重要箇所を予測する言語モデルを構築し約81%と高い精度で予測可能であることが確認した.
|
研究成果の学術的意義や社会的意義 |
1)高齢者にとって聞き取りやすいと評価されている話者が同一内容の文章を高齢者を意識して発話した音声と読み上げた音声をパラレルで収集し,両者の韻律的な差異を統計的に分析することで,高齢者にとって聞き取り易い音声の韻律的な特徴を明らかにした. 2)読み上げ音声から高齢者向け発話の韻律を予測する韻律予測モデルを構築し,高い精度で予測可能であることを示し,通常の読み上げ音声から高齢者にとって聞き取りやすい音声への変換が可能であることを示した. 3)高齢者の情報取得の観点から重要と考えられる文書内での重要な箇所を言語モデルによって高精度に予測することが可能であることを示した.
|