高齢者への音声による効果的な情報伝達のための韻律制御モデルの構築と評価

研究課題

研究課題/領域番号	20K11869
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61010:知覚情報処理関連
研究機関	公立諏訪東京理科大学
研究代表者	水野秀之公立諏訪東京理科大学, 工学部, 教授 (30833892)
研究分担者	中嶋秀治日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 研究主任 (90832684)
研究期間 (年度)	2020-04-01 – 2023-03-31
研究課題ステータス	完了 (2022年度)
配分額 *注記	4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円) 2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円) 2021年度: 260千円 (直接経費: 200千円、間接経費: 60千円) 2020年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
キーワード	高齢者向け発話データの整備 / 韻律分析 / 韻律モデル構築 / 言語モデル構築 / 言語的モデルの構築 / 発話テキスト収集 / 音声収録 / 高齢者向け発話 / 基本周波数 / 統計分析 / 音声合成 / 高齢者 / 韻律制御
研究開始時の研究の概要	高齢者の音声による情報把握の支援については，これまで多くの補聴器などの音響系の研究が行われてきた一方で，高齢者にとって内容を理解しやすいような音声の特徴に関する研究はあまり行われていない．そこで，本研究では高齢者にとって聞き取りやすい音声の韻律（抑揚や話す速さなどの音声の特徴）制御方法の確立を目的とし，以下の順に研究を進める．まず、高齢者にとって聞きとりやすい音声を収集しその言語的音声的な特徴を分析し，次に得られた特徴に基づいて文章全体または文章の一部の内容に応じて韻律の制御を行なう高齢者向けの韻律制御方式を確立する．この研究の成果は，高齢者の情報格差を補償することが期待できる．
研究成果の概要	2020年度は高齢者から最も発話が聞き取りやすいと評価された女性話者1名により重要箇所にラベルを付与した136文書の高齢者を意識した発話と読み上げ発話の収集を行った． 2021年度は2種類の音声間の韻律の比較分析を行い，F0の平均値及びレンジの拡大及び重要箇所でのF0最大値の上昇を確認した． 2022年度は韻律制御モデルの構築を行い客観評価ではF0最大値については決定係数0.75と高い精度で制御可能であることがわかったが，分析合成音を用いた主観評価実験からは聞き取りやすさに関する効果は確認できなかった．また，重要箇所を予測する言語モデルを構築し約81%と高い精度で予測可能であることが確認した．
研究成果の学術的意義や社会的意義	1）高齢者にとって聞き取りやすいと評価されている話者が同一内容の文章を高齢者を意識して発話した音声と読み上げた音声をパラレルで収集し，両者の韻律的な差異を統計的に分析することで，高齢者にとって聞き取り易い音声の韻律的な特徴を明らかにした． 2）読み上げ音声から高齢者向け発話の韻律を予測する韻律予測モデルを構築し，高い精度で予測可能であることを示し，通常の読み上げ音声から高齢者にとって聞き取りやすい音声への変換が可能であることを示した． 3）高齢者の情報取得の観点から重要と考えられる文書内での重要な箇所を言語モデルによって高精度に予測することが可能であることを示した．

報告書

(4件)

研究成果
(4件)

すべて学会発表 (4件)

[学会発表] 高齢者向け発話と読み上げ発話の韻律的特徴の対比分析2022
- 著者名/発表者名
  水野秀之，中嶋秀治
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 高齢者向け発話の韻律予測2022
- 著者名/発表者名
  水野秀之，中嶋秀治
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 高齢者に対して強調すべきと判断された単語のテキストからの予測と分析2022
- 著者名/発表者名
  中嶋秀治，水野秀之
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 高齢者向け発話と読み上げ発話の韻律的特徴の対比分析2022
- 著者名/発表者名
  水野秀之、中嶋秀治
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2021 実施状況報告書