2014 Fiscal Year Research-status Report
音声対話システムを対象とした雑音に頑健な話者までの距離推定の研究
Project/Area Number |
26330211
|
Research Institution | Aichi University of Technology |
Principal Investigator |
實廣 貴敏 愛知工科大学, 工学部, 准教授 (60394996)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 音声認識 / 音声対話システム / 音源距離推定 / 音響モデル |
Outline of Annual Research Achievements |
本研究では,音情報を元に周囲状況を正確に把握する技術の確立を目標としている.現状の音声対話システムでは,入力音声が音声認識対象としている.しかし,実環境では,周囲で他の人が騒いでいる場合など,音声であっても認識対象でない場合もある.そこで,発話者までの距離を一つの情報として認識対象であるか判断する.近ければ,認識対象である可能性が高いと言える.特に,対話システムでは,単一マイクロホンが利用されるため,当面,1チャンネル入力による音声を研究対象としている.2014年度では,まず評価データの作成を行った.実環境下での評価のため,大学内の講義室で,比較的静かな時間を選んで評価音声データをスピーカー再生しながら,再録音を行った.実際的な評価を行う予定だが,対象音声以外の環境雑音を後で付加して比較するために,静かな環境を用いた.マイクロホンとスピーカーを,音声対話システムと発話者と見立てて,その距離を20 cm,50 cm,1 m,2 m,,3 m,4 m,5 mと変化させた.各距離において,男女各10名,合計200発話を再録音した.同時に,TSP信号も収録し,後で各距離での音響空間周波数特性を得た.これら収録音声を整理し,評価用データベースを構築した.距離推定の際に,雑音のないクリーンな音声モデルを用いるが,そのモデルとして,VQ (Vector Quantization) コードブックを用いた.これは音声データから,特徴量に応じて,決められたサイズに分割するものである.代表的な特徴量を抽出しておき,距離推定の際に,入力音声の特徴量とよく似たものを推定する.今回は時間の関係上,数百のパターンに分けたコードブックのみを得ることができた.また,特徴量は短時間フーリエスペクトルのみであった.今後は,他の特徴量や別のモデルを構築し,最終的に距離推定できるところまで検討する.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究の内容は,主に,研究室での4年生の卒業研究として進めている.そのため,本人の勉強や就職活動などの影響を受けやすく,この研究だけに集中しにくく,実際的には数ヶ月間での検討になっている.今回は,まだ研究室自体にも十分な下地がないため,データの収録やその後のデータ整理に時間がかかった.また,今回の検討では音声特徴量として短時間フーリエスペクトルを用い,最初の検討である,音声モデルとして用いるベクトル量子化(VQ)コードブックの作成を行った.MATLABでのプログラミングで,組み込み済みの関数を用い,音声特徴量のクラスタリングを行ったが,次元数や用いる音声データ量が多いため,大きなコードブックを作成するのに数日,場合によっては1週間以上を費やした.おかげで距離推定を行う部分の検討まで到達できていない.音声特徴量の種類や次元数の検討も進めていく必要があることがわかった.
|
Strategy for Future Research Activity |
2015年度は,担当学生は代わるが,検討内容を継続できそうなので,引き続き,基本アルゴリズムの検証を行いたい.2014年度で作成した評価データを実際に用い,距離推定の精度を評価する.検討する項目としては,問題になっている(1) 音声特徴量の種類,(2) 各音声特徴量の次元数が挙げられる.代表的な音声特徴量や,それぞれの適切な次元数を見出すための実験を行うだけでも何ヶ月か必要と思われる.余裕があれば,実環境下での検討を目標としているので,評価に必要な音声対話システムを用いる時に観測されるような周囲雑音の収録も行っていきたいと考えている. また,これら基本アルゴリズムの検証と並行して,その後に利用する予定の雑音抑圧手法の検討も行っていく予定である.スペクトルサブトラクションのような基礎的なものは昨年度までに行っているが,さらに,近年注目されているDeep Neural Network (DNN)などの利用も考えている.
|
Causes of Carryover |
まだ検討が十分進んでいないため,学会発表などもない.そのため,必要と思われる機材の購入に充てているのが中心で,他には今後利用する技術の勉強のための学生や私の出張などに用いた.次年度以降に検討の進展次第で少しでも資金的な余裕ができるように残した.
|
Expenditure Plan for Carryover Budget |
研究発表会参加のための旅費などに用いる.
|