2013 Fiscal Year Research-status Report
ウェブインタフェースに向けた聴覚機構に基づく大人・子ども話者識別技術の研究
Project/Area Number |
25870438
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | Wakayama University |
Principal Investigator |
西村 竜一 和歌山大学, システム工学部, 助教 (00379611)
|
Project Period (FY) |
2013-04-01 – 2015-03-31
|
Keywords | 音声情報処理 / ウェブシステム / こども / ディープニューラルネットワーク / 声道長推定 |
Research Abstract |
本研究は、発話を入力としたコンピュータによる大人・子ども識別法を開発する。下記、2項目を中心に提案法の精度向上を目指した研究開発を行った。 (1) 聴覚特徴の抽出と識別アルゴリズムへの組み込み:識別アルゴリズムに深層学習のニューラルネットワーク(DNN)の導入を試みた。DNNは、従来型である隠れマルコフモデル(HMM)と異なり、そのままでは入力信号の時間伸縮を適切に扱うことが難しい。しかし、識別単位をフレームとした場合でも高い能力を示すことを実験から確認した。また、話者の身体情報を示す特徴の一つとして声道長に着目し、日本語母音データベースを用いた任意発声の相対的声道長の推定手法について検討を加えた。 (2) 特徴的な言語情報を引き出すための対話戦略決定法の検討:過去に我々が収集した発話データの語彙情報を統計的に分析して、対話システムに組み込むことができる形態で、その特徴を抽出した。具体的には、Bag-of-Words及び新聞記事データベースに含まれる語彙の共起情報を検討した。 上記の精度向上のための研究項目と並行して、デモシステムを実装し、本手法を応用システムに展開できることを示した。本システムは、サーバ・クライアントアーキテクチャを採用したウェブシステムである。画像処理用高速プロセッサによるGPGPUを利用することで、現実的な時間で提案法を処理できることを確認した。また、クラウドソーシングを用いた音データの収集法を開発し、次年度以降に予定している公開試験の実験環境を整備した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究の進展によって、大人と子ども発話識別における正解率の向上を着実に得ることができたこと、また、次年度に計画している評価実験で利用する予定のデモシステムを実装できたことから、本研究は順調に進展していると判断した。特に、デモシステムの実装は、当初計画では次年度に予定していた内容を一部含んでおり、若干ではあるが計画を前倒しして実施できた。ただし、その副産物として、想定を超えた計算コストの増大が新しい問題として表面化している。その原因は、アルゴリズムの高度化やデータ処理量の増大にある。これら問題に対して、次年度の研究計画に解決策案を組み込むことができた。これは、早期のリスク回避の観点から、むしろ好ましい結果であったと考えている。
|
Strategy for Future Research Activity |
これまでの研究成果を統合し、実際に動作するウェブサービスのプロトタイプを作成する。また、提案システムの公開試験を実施する。昨年度実装したデモシステムの完成度を高め、実験環境とすることにより、一般利用者を対象とした公開試験の実施は可能である。しかしながら、利用者に適切なフィードバックを提供するためには処理速度の改善が必要であることがわかっている。これまでの調査から、処理速度の問題の主たる理由が、音響特徴量の抽出処理部分に存在することが判明している。この問題に対し、音響特徴量の構成を見直すとともに、処理を適切に省略することで改善を得ることを目標とする。加えて、これまでのデモシステムは、主にPC端末向けに開発してきたが、クラウドソーシングを活用し、より多くの利用者を獲得するために、Android端末向けに提案システムを移植する。この際、利用者の利便性を確保するためのインタフェースデザインを検討する。
|
Expenditure Plans for the Next FY Research Funding |
配分予算の減額を考慮して予算執行計画を再検討した結果、導入を予定していた高速計算用Linuxサーバの購入を今年度は見送ることにした。ただし、既存設備を利用することができ、研究計画の大幅な変更は回避できたと考える。 公開試験を実施するためには高速計算用Linuxサーバを新規導入が必要であるため、購入する予定である。
|