本研究は日常の雑談対話から効果的に認知症傾向を検出することを目的としている.令和2年度~令和4年度は,認知症に関わる音響的特徴量の抽出,認知症検出への影響が考えられる方言の違いについての分析,対話音声に含まれる言語特徴量にも着目し,対話音声に含まれる認知症傾向を分析してきた.特に,認知症有無間で有意な差が認められた,助詞割合,一般名詞割合などの語彙に関する特徴量以外にも,係り受け(深度,距離)が認知症傾向を捉えるために有効であることが明らかとなった. それら言語特徴量を中心に,認知症傾向有無の2クラス分類を実施した.その結果,感度92.0%,特異度89.5%という結果を得ることができ,先行研究で用いられてきた,語彙に関する言語的特徴量に,係り受けの特徴量を加えることで,感度が12.0%向上することが分かった. 最終年度は,少ない学習データに対しても高い汎化性能をもつ,事前学習済み言語モデル BERTを用いることで,雑談対話音声から認知症疑いを検出することを試みた.令和4年度までは人手による書き起こし文から言語特徴量を抽出していたが,今回は音声認識器より得たテキスト文を用いる.現在の音声認識器は高齢者音声に対して精度が低下することが分かっている.そのため,音声認識器を介した場合,認識誤りが一部含まれるテキスト文を用いることになる.本研究では事前学習済み言語モデルがその誤りを補完することで精度よく認知症傾向を検出することを目標とした. 検出結果は適合率77%,再現率68%であった.人手による書き起こし文を用いた結果よりも精度は大幅に低下してしまったが,BERTから認知症傾向を直接検出するよりも,BERTの中間層の出力を特徴量とし,音響的特徴量と組み合わせた特徴量をSVMなどの機械学習で認知症モデルを構築することで,検出精度が向上することが明らかになった.
|