Utterance training method for maintaining throat function -Evaluation and training program using speech recognition and deep learning -
Project/Area Number |
20K11894
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61010:Perceptual information processing-related
|
Research Institution | University of Shizuoka |
Principal Investigator |
松浦 博 静岡県立大学, 経営情報学部, 客員教授 (60451085)
|
Co-Investigator(Kenkyū-buntansha) |
和田 淳一郎 東京医科歯科大学, 大学院医歯学総合研究科, 助教 (20611536)
井本 智明 静岡県立大学, 経営情報学部, 講師 (20749296)
秀島 雅之 東京医科歯科大学, 東京医科歯科大学病院, 講師 (50218723)
六井 淳 静岡県立大学, 経営情報学部, 教授 (70362910)
湯瀬 裕昭 静岡県立大学, 経営情報学部, 教授 (30240162)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2024: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
Fiscal Year 2023: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
Fiscal Year 2022: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2021: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2020: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
|
Keywords | 発話評価 / 咽喉 / 高齢化 / 音声認識 / 音声セグメントラベル / 基本周波数 / オーラル・ディアドコキネシス / 発話訓練 / 音声セグメント / 深層学習 / 発話 / 超高齢化社会 |
Outline of Research at the Start |
咽喉機能は嚥下・呼吸・発話に関わり、生命維持やQOL向上に極めて重要である。咽喉機能の低下によって、誤嚥性肺炎など重篤な状況に陥れかねない。咽喉機能としての発話能力を、一般的な基本周波数F0、音声パワーに加えて、独自開発した音声セグメントラベルを用いて評価する。これらパラメータによって、壮年期から高年期に至る咽喉機能のわずかな加齢変化や改善効果を可視化し、咽喉機能を維持・回復する訓練を効果的に行えるプログラムを開発する。
|
Outline of Annual Research Achievements |
加齢等による咽喉の衰えを発話評価によって早期に検知し,自身の状態を自覚させ適切な対応がなされれば健康維持につながると考えられる.本研究では基本周波数F0や独自開発の音声セグメントラベルから導出したF0変化幅,妥当ラベル,ラベル安定性,F0分散,音声区間長,無音区間長,かすれラベル,濁音ラベルを発話評価パラメータとして用いた. 本年度は73歳以上の高齢者について9か月の期間をおいてATR音素バランス503文のうちの2文とオーラルディアドコキネシス用の「パ」「タ」「カ」の発話を昨年度の45名分収集に続き、55名分を収集した.発話評価パラメータとオーラルディアドコキネシス(以下OD)の関係では,taの回数と音声区間長との相関係数は0.4,taの回数と妥当ラベルとの相関係数は0.32となった.年齢との関係を調べたところ,妥当ラベルとの相関係数が-0.44と,最も負の相関があった.このことから,F0や発話速度よりもラベルの情報を調べることが重要であることが分かった.一方,ODでは年齢とtaの回数との相関係数が-0.37と,最も負の相関があった.このことから,taの発話が加齢に伴って悪化しやすいことが推察された. また,9か月間経過した時の発話評価パラメータが0.5以上向上したのは,評価「あらゆる・・」「冬が・・」のそれぞれで38名中7名と6名,0.5以上低下したのは3名と0名であった.9か月間経過した時のODの変化量について,1以上向上したのが,paで8名,taで8名,kaで6名であった.一方,1以上低下したのはpaで5名で,taとkaではいずれも1名であった. さらに,1名が4年間にわたり,ほとんど毎日8種類の発話トレーニングを行った後,「あらゆる・・」の発話データを収集した.半年毎の平均値を比較したところ,徐々に発話評価パラメータが向上,あるいは維持できていることが示唆された.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度(2020年度)はコロナ禍のためデータ収集ができなかったが,やや落ち着いた昨年度(2021年度),本年度(2022年度)は9か月を置いてデータ収集をすることができ、遅れをある程度回復することができた. また,本研究と関連して,佐藤慶子氏の声ぢからトレーニングを実施して、喉を鍛える一つ手法を提示することができた.声ぢからトレーニングは、一般のボイストレーニングとは異なり,声の持つ原始的生命エネルギーに着目した心と身体と声のためのレッスンである. 呼吸,心,声帯を含む身体を,互いに正三角形の関係になるよう等しく磨くことでその人本来の声を獲得する.
|
Strategy for Future Research Activity |
2023年度は9月ごろにデータ収集を行い,遅れをさらに回復して,加齢による経時的な影響を見極めていく予定である. 来年度以降についてもデータ収集を継続的に行い,加齢による変化を明らかにしていきたい.
|
Report
(3 results)
Research Products
(6 results)