2020 年度実施状況報告書

咽喉部機能維持のための発話訓練法－音声認識・深層学習を用いた評価訓練プログラム－

研究課題

研究課題/領域番号	20K11894
研究機関	静岡県立大学
研究代表者	松浦博静岡県立大学, 経営情報学部, 客員教授 (60451085)
研究分担者	和田淳一郎東京医科歯科大学, 大学院医歯学総合研究科, 助教 (20611536) 井本智明静岡県立大学, 経営情報学部, 助教 (20749296) 秀島雅之東京医科歯科大学, 歯学部附属病院, 講師 (50218723) 六井淳静岡県立大学, 経営情報学部, 准教授 (70362910)
研究期間 (年度)	2020-04-01 – 2025-03-31
キーワード	発話評価 / 咽喉 / 高齢化 / 音声認識 / 音声セグメント / 基本周波数 / 深層学習 / 発話訓練
研究実績の概要	加齢等による咽喉の衰えを発話評価によって早期に検知し，自身の状態を自覚させ適切な対応がなされれば健康維持につながると考えられる．基本周波数F0や独自開発の音声セグメントラベルから求めたF0変化幅，妥当ラベル比率，ラベル安定性，有声音部F0分散，音声区間長，無音区間長，かすれラベル，濁音ラベルを発話評価パラメータとして用いた．発話評価パラメータを深層学習によってgood，normalあるいはbadと聴取評価したデータに対して，badか否かで深層学習を用いて2値分類した．この時，badの訓練データが少ないため，good，normalに判定されやすくなることからbadの訓練データをデータ拡張によって増加させることを試みた．また，全体の正解率もさることながら，badの人をなるべく早期に見出すことがより重要と考えて比較実験を行った．その結果，データ拡張値が0.07でエポック数が5回のときに，badの人の90.41%がbadと正しく判定された．また，全体の正解率でも90%を超える性能を確認した．深層学習の効果を確認するため機械学習のアルゴリズムの一つであるランダムフォレストとの比較実験を行った．データ拡張は上記の深層学習の実験で最適であった拡張値0.07とした．ランダムフォレストでは正解率は96.6%と最も高くなるが，badの人をbadと判定する率が64%と，深層学習でデータ拡張なしの場合の55.5%よりは高いものの，データ拡張を行った場合に比較して20%から25%程度低い．したがって，ランダムフォレストに対して深層学習の大きな効果が認められた．上記の実験は各機関から提供されているデータベースを活用して行ったが，高齢者の実データによる検証を行うため，データ収集の研究倫理審査を申請し承認された．また，一名の被験者による長期データ収集については2年以上にわたって継続実施している．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由データベースを用いた実験と個人の長期データ収集は順調に実施できている.一方、高齢者の実データ収集については実施予定の場所が閉鎖となってしまったため，別の施設を検討中である．
今後の研究の推進方策	高齢者の実データ収集について新規の実施場所を検討する．
次年度使用額が生じた理由	実データ収集が中断されたことやコロナ禍での出張調査などの活動が停滞したため

研究成果
(1件)

すべて学会発表 (1件)

[学会発表] 加齢等による発話への影響の深層学習とデータ拡張を用いた評価2021
- 著者名/発表者名
  松浦博　山下拓巳　井本智明　和田淳一郎　秀島雅之
- 学会等名
  情報処理学会ASD研究会第20回研究発表会