2005 Fiscal Year Annual Research Report
ユビキタス時代の音声インタフェース実現のための高齢者音声認識に関する研究
Project/Area Number |
17560345
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
二矢田 勝行 九州工業大学, 工学部, 教授 (50363396)
|
Co-Investigator(Kenkyū-buntansha) |
水町 光徳 九州工業大学, 工学部, 助手 (90380740)
|
Keywords | 音声インタフェース / 音声認識 / 高齢者 / ユビキタス |
Research Abstract |
本研究では、高齢者が、いつでも、どこでも使うことができる音声認識システムを構築することを最終目標としている。本年度は、まず高齢者音声と成人音声の差異を明確にするために、聴感上の印象に基づき、それらの主観的な違いを見出した。その結果、高齢者音声を特徴付ける主な特徴として、高齢者音声に特有の「しゃがれ」と「メリハリのなさ」とに着目した。次に、「しゃがれ」と「メリハリのなさ」とのそれぞれの主観的特徴を、音声認識で用いられている特徴量を用いて定量的に説明することを試みた。その結果、「しゃがれ」は音声の静的特徴として対数振幅スペクトル包絡の傾き、「メリハリのなさ」は音声の動的特徴としてパワー及びスペクトルの時間差分値と密接な関係があることがわかった。高齢者音声は、成人音声と比較し、対数振幅スペクトル包絡の傾きが小さく、パワー及びスペクトルの時間差分値も小さい。これは、加齢による発声器官の衰えが原因であろうと推測できる。高齢者音声の「しゃがれ」に関しては、入力音声である高齢者音声の対数振幅スペクトル包絡の傾きを適切に補正することによって、成人音声による標準パターンを用いた場合においても、高齢者音声認識率が向上することがわかった。つまり、対数振幅スペクトル包絡の傾きが高齢者音声(高齢者音声に特有のしゃがれ声)を特徴付ける大きな要因であると言える。来年度は、本年度の研究成果をより発展させるために、更に厳密な高齢者音声の分析を行い、高齢者音声認識システムの構築を目指す予定である。 本年度は、当研究補助金により既存の音声データベース(電子協日本語共通音声データベース、S-JNAS高齢者の音声認識用大規模データベース)を購入した。また、音声収録も可能な簡易防音室を設けるために吸音パネルを購入し、マイクロホンならびにPC用USBオーディオインタフェース等も購入し、研究環境の整備も行った。
|