2016 Fiscal Year Annual Research Report
Voice-pathology analysis based on automatic topology generation of glottal source HMM
Project/Area Number |
26330216
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
佐宗 晃 国立研究開発法人産業技術総合研究所, 知能システム研究部門, 主任研究員 (50318169)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 病的音声 / 声帯疾患 / 嗄声 / 聴覚印象評価 / AR-HMM / 喉頭がん / GRBAS尺度 / 音声分析 |
Outline of Annual Research Achievements |
H26年度からH27年度までは、トポロジ自動生成ARHMM分析法の構築と、その妥当性についての評価実験を行った。最終年度はトポロジ自動生成ARHMM分析法により得られる音声の特徴量に基づいて、喉頭がんの初期症状でもある、嗄声を起こす声帯疾患の検知手法を構築した。更に、ARHMM分析に基づいて嗄声を表す4つの性質(粗ぞう性、気息性、無力性、努力性)を識別する手法の構築にも取組んだ。 前者の声帯疾患検知に関しては、健常者音声では声帯の閉鎖期において呼気の漏れは殆どないが、声帯疾患のある病的音声では声帯閉鎖期において呼気漏れが発生し、健常者音声より多く雑音成分が駆動源信号に含まれていると仮定する。そして、ARHMM分析で得られる駆動源HMMの各出力分布の分散が、呼気漏れの有無により大きく変化すると考える。実験結果より、健常者音声では声帯閉鎖期に該当する状態では出力分布の分散が小さくなる傾向があるのに対し、病的音声では最大分散の半値を中心として広範囲に分散が分布することを確認した。この分布の違いを手掛かりとして呼気漏れ(声帯疾患)を検知する手法を構築し、予備実験を行った結果、90%強の精度で声帯疾患が検知可能であることを確認した。 次に、嗄声の聴覚印象評価の自動化手法について検討を行った。具体的には嗄声の4性質(粗ぞう性、気息性、無力性、努力性)のそれぞれについて、聴覚的印象の有無を評価することを目標とした。音声のARHMM分析で得られる駆動源信号から求めた高次局所自己相関係数を入力として、各4性質の有無を出力とするニューラルネットワークを学習することで、聴覚印象評価の自動化を試みた。予備実験を行った結果、90%弱の識別精度が得られることを確認した。 本研究成果は、従来、言語聴覚士のような専門家のみが判断していた病的音声の検知や嗄声の聴覚印象評価の自動化についての実現可能性を示した。
|