• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実施状況報告書

咽喉部機能維持のための発話訓練法-音声認識・深層学習を用いた評価訓練プログラム-

研究課題

研究課題/領域番号 20K11894
研究機関静岡県立大学

研究代表者

松浦 博  静岡県立大学, 経営情報学部, 客員教授 (60451085)

研究分担者 和田 淳一郎  東京医科歯科大学, 大学院医歯学総合研究科, 助教 (20611536)
井本 智明  静岡県立大学, 経営情報学部, 助教 (20749296)
秀島 雅之  東京医科歯科大学, 歯学部附属病院, 講師 (50218723)
六井 淳  静岡県立大学, 経営情報学部, 准教授 (70362910)
研究期間 (年度) 2020-04-01 – 2025-03-31
キーワード発話評価 / 咽喉 / 高齢化 / 音声認識 / 音声セグメント / 基本周波数 / 深層学習 / 発話訓練
研究実績の概要

加齢等による咽喉の衰えを発話評価によって早期に検知し,自身の状態を自覚させ適切な対応がなされれば健康維持につながると考えられる.基本周波数F0や独自開発の音声セグメントラベルから求めたF0変化幅,妥当ラベル比率,ラベル安定性,有声音部F0分散,音声区間長,無音区間長,かすれラベル,濁音ラベルを発話評価パラメータとして用いた.発話評価パラメータを深層学習によってgood,normalあるいはbadと聴取評価したデータに対して,badか否かで深層学習を用いて2値分類した.この時,badの訓練データが少ないため,good,normalに判定されやすくなることからbadの訓練データをデータ拡張によって増加させることを試みた.また,全体の正解率もさることながら,badの人をなるべく早期に見出すことがより重要と考えて比較実験を行った.その結果,データ拡張値が0.07でエポック数が5回のときに,badの人の90.41%がbadと正しく判定された.また,全体の正解率でも90%を超える性能を確認した.
深層学習の効果を確認するため機械学習のアルゴリズムの一つであるランダムフォレストとの比較実験を行った.データ拡張は上記の深層学習の実験で最適であった拡張値0.07とした.ランダムフォレストでは正解率は96.6%と最も高くなるが,badの人をbadと判定する率が64%と,深層学習でデータ拡張なしの場合の55.5%よりは高いものの,データ拡張を行った場合に比較して20%から25%程度低い.したがって,ランダムフォレストに対して深層学習の大きな効果が認められた.
上記の実験は各機関から提供されているデータベースを活用して行ったが,高齢者の実データによる検証を行うため,データ収集の研究倫理審査を申請し承認された.また,一名の被験者による長期データ収集については2年以上にわたって継続実施している.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

データベースを用いた実験と個人の長期データ収集は順調に実施できている.一方、高齢者の実データ収集については実施予定の場所が閉鎖となってしまったため,別の施設を検討中である.

今後の研究の推進方策

高齢者の実データ収集について新規の実施場所を検討する.

次年度使用額が生じた理由

実データ収集が中断されたことやコロナ禍での出張調査などの活動が停滞したため

  • 研究成果

    (1件)

すべて 2021

すべて 学会発表 (1件)

  • [学会発表] 加齢等による発話への影響の深層学習とデータ拡張を用いた評価2021

    • 著者名/発表者名
      松浦 博 山下拓巳 井本智明 和田淳一郎 秀島雅之
    • 学会等名
      情報処理学会ASD研究会第20回研究発表会

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi