2022 年度研究成果報告書

高齢者への音声による効果的な情報伝達のための韻律制御モデルの構築と評価

研究課題

PDF

研究課題/領域番号	20K11869
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61010:知覚情報処理関連
研究機関	公立諏訪東京理科大学
研究代表者	水野秀之公立諏訪東京理科大学, 工学部, 教授 (30833892)
研究分担者	中嶋秀治日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 研究主任 (90832684)
研究期間 (年度)	2020-04-01 – 2023-03-31
キーワード	高齢者向け発話データの整備 / 韻律分析 / 韻律モデル構築 / 言語モデル構築
研究成果の概要	2020年度は高齢者から最も発話が聞き取りやすいと評価された女性話者1名により重要箇所にラベルを付与した136文書の高齢者を意識した発話と読み上げ発話の収集を行った． 2021年度は2種類の音声間の韻律の比較分析を行い，F0の平均値及びレンジの拡大及び重要箇所でのF0最大値の上昇を確認した． 2022年度は韻律制御モデルの構築を行い客観評価ではF0最大値については決定係数0.75と高い精度で制御可能であることがわかったが，分析合成音を用いた主観評価実験からは聞き取りやすさに関する効果は確認できなかった．また，重要箇所を予測する言語モデルを構築し約81%と高い精度で予測可能であることが確認した．
自由記述の分野	音声情報処理
研究成果の学術的意義や社会的意義	1）高齢者にとって聞き取りやすいと評価されている話者が同一内容の文章を高齢者を意識して発話した音声と読み上げた音声をパラレルで収集し，両者の韻律的な差異を統計的に分析することで，高齢者にとって聞き取り易い音声の韻律的な特徴を明らかにした． 2）読み上げ音声から高齢者向け発話の韻律を予測する韻律予測モデルを構築し，高い精度で予測可能であることを示し，通常の読み上げ音声から高齢者にとって聞き取りやすい音声への変換が可能であることを示した． 3）高齢者の情報取得の観点から重要と考えられる文書内での重要な箇所を言語モデルによって高精度に予測することが可能であることを示した．