2020 Fiscal Year Annual Research Report
高齢者を対象とした音声認識・対話システム基盤技術の構築
Project/Area Number |
19H01125
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
北岡 教英 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (10333501)
|
Co-Investigator(Kenkyū-buntansha) |
東中 竜一郎 名古屋大学, 情報学研究科, 教授 (90396151)
宇津呂 武仁 筑波大学, システム情報系, 教授 (90263433)
小林 彰夫 筑波技術大学, 産業技術学部, 准教授 (10741168)
山本 一公 中部大学, 工学部, 教授 (40324230)
西崎 博光 山梨大学, 大学院総合研究部, 准教授 (40362082)
西村 良太 徳島大学, 大学院社会産業理工学研究部(理工学域), 講師 (50635878)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 高齢者音声 / 対話 / 雑談 / 認知症傾向スクリーニング |
Outline of Annual Research Achievements |
高齢者を対象とした音声対話システムのための音声対話基盤技術の構築を行っている。高齢者の音声認識の高度化のために、高齢者の音声を収録してデータベース化した。それを用いて、DNN-HMMベースの音声認識システム、およびTransformerベースのEnd-to-end音声認識システムの高精度化を図った。高齢者音声は機械学習に耐えるだけの量を収集することは困難である。そこで、一般成人の大量のデータに高齢者音声を複数回繰り返し混ぜたデータを使って学習する方法を試みた結果、いずれのシステムにおいても数回の繰り返しによって大幅に性能が向上することが確認された。対話戦略においては、有限オートマトンによるシナリオ制御とEnd-to-end雑談チャットボットを相互に行き来できる制御方法を開発した。雑談チャットボットは、単純に雑談を行うだけではなく、雑談をしながらある特定の質問に話題を近づけていき、いずれその質問をすると言う、雑談に質問を織り交ぜるための質問誘導モデルを構築し、実際に対話システムに実装した。これにより、例えば長谷川式認知症スケールに用いられるような対話を雑談に織り交ぜて認知テストを暗黙のうちに実施するようなことも可能となった。また、認知テストとは別に、高齢者音声から認知症の傾向をスクリーニングする方法も開発した。高齢者との雑談音声の音響的特徴を用いることで80~90%程度の精度で認知症傾向を検出できることを確認した。その際、地域差(方言)の影響を受けやすいことも見出し、地域差の影響を受けにくい特徴量を選択することで方言に頑健な検出手法も提案した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
データベースの収集こそコロナ禍において進捗がないが、これまでに収集した限られたリソースを用いて効率的に音声認識精度を向上する手法を編み出したことで、音声認識性能に関する目標を達成しつつある。また、対話制御ではいかに高齢者が飽きずに対話を続けながら、様々な質問によって高齢者の様子をうかがうことができるかという課題に対して、質問誘導モデルを開発して実現することができた。シナリオ対話と雑談対話を融合すること自体が対話システムの研究として新しく、大きな成果を得たと考える。また、認知症のスクリーニングについては、当初考えていた読み上げ音声によるスクリーニングに対して、対話音声によるスクリーニングでも十分に性能が出せることが大きな成果となった。
|
Strategy for Future Research Activity |
対話システムの実装は、リアルタイムで対話できる形で完了している。このシステムを高齢者施設に設置することで実証実験を行い、対話データを収集して評価する。評価の基準としては対話の継続時間や繰り返し使用頻度など、対話システムにいかに親しみを感じているかを評価できる手法を用いる。さらに収録した音声で改めて音声認識実験を行うことで音声認識性能を評価するとともに、改善方法を検討する。また、同じく収録した音声を用いて認知症傾向スクリーニング実感を行い、実環境での収録音声に対する頑健性および性能低下があった場合にはその性能向上策を検討する。
|
Research Products
(11 results)