研究課題/領域番号 |
20K11894
|
研究機関 | 静岡県立大学 |
研究代表者 |
松浦 博 静岡県立大学, 経営情報学部, 客員教授 (60451085)
|
研究分担者 |
和田 淳一郎 東京医科歯科大学, 大学院医歯学総合研究科, 助教 (20611536)
井本 智明 静岡県立大学, 経営情報学部, 助教 (20749296)
秀島 雅之 東京医科歯科大学, 歯学部附属病院, 講師 (50218723)
六井 淳 静岡県立大学, 経営情報学部, 准教授 (70362910)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
キーワード | 発話評価 / 咽喉 / 高齢化 / 音声認識 / 音声セグメント / 基本周波数 / 深層学習 / 発話訓練 |
研究実績の概要 |
加齢等による咽喉の衰えを発話評価によって早期に検知し,自身の状態を自覚させ適切な対応がなされれば健康維持につながると考えられる.基本周波数F0や独自開発の音声セグメントラベルから求めたF0変化幅,妥当ラベル比率,ラベル安定性,有声音部F0分散,音声区間長,無音区間長,かすれラベル,濁音ラベルを発話評価パラメータとして用いた.発話評価パラメータを深層学習によってgood,normalあるいはbadと聴取評価したデータに対して,badか否かで深層学習を用いて2値分類した.この時,badの訓練データが少ないため,good,normalに判定されやすくなることからbadの訓練データをデータ拡張によって増加させることを試みた.また,全体の正解率もさることながら,badの人をなるべく早期に見出すことがより重要と考えて比較実験を行った.その結果,データ拡張値が0.07でエポック数が5回のときに,badの人の90.41%がbadと正しく判定された.また,全体の正解率でも90%を超える性能を確認した. 深層学習の効果を確認するため機械学習のアルゴリズムの一つであるランダムフォレストとの比較実験を行った.データ拡張は上記の深層学習の実験で最適であった拡張値0.07とした.ランダムフォレストでは正解率は96.6%と最も高くなるが,badの人をbadと判定する率が64%と,深層学習でデータ拡張なしの場合の55.5%よりは高いものの,データ拡張を行った場合に比較して20%から25%程度低い.したがって,ランダムフォレストに対して深層学習の大きな効果が認められた. 上記の実験は各機関から提供されているデータベースを活用して行ったが,高齢者の実データによる検証を行うため,データ収集の研究倫理審査を申請し承認された.また,一名の被験者による長期データ収集については2年以上にわたって継続実施している.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
データベースを用いた実験と個人の長期データ収集は順調に実施できている.一方、高齢者の実データ収集については実施予定の場所が閉鎖となってしまったため,別の施設を検討中である.
|
今後の研究の推進方策 |
高齢者の実データ収集について新規の実施場所を検討する.
|
次年度使用額が生じた理由 |
実データ収集が中断されたことやコロナ禍での出張調査などの活動が停滞したため
|