2009 Fiscal Year Annual Research Report
新しい音声メディアによるユニバーサルコミュニケーションの研究
Project/Area Number |
19200009
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
鹿野 清宏 Nara Institute of Science and Technology, 情報科学研究科, 教授 (00263426)
|
Co-Investigator(Kenkyū-buntansha) |
猿渡 洋 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (30324974)
戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (90403328)
川波 弘道 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80335489)
|
Keywords | 音声ユニバーサルインタフェース / 非可聴つぶやき(NAM) / ブラインド音源分離(BSS) / ハンズフリー音声認識 |
Research Abstract |
新しい静かな音声メディアである非可聴つぶやき(NAM)による無音声認識と無音声電話の研究、歪みなしの音の分離技術SIMO-ICAを用いたハンズフリー音声認識システムの研究、実環境での音声対話システムの研究を推進した。 (1) 非可聴つぶやき(NAM)による音声コミュニケーション手段の研究 (a) NAM発声はなじみのない発声方法であるので、計算機から適切な発声方法の適切な指示を行なう方法について検討して、NAM音声認識(無音声認識)によって評価を行った。 (b) 無音声電話に向けて、話者間で同じ発声を必要としない教師なし適応アルゴリズムを検討した。 (2) 歪なし音源分離SIMO-ICAによる音声コミュニケーション手段の研究 (a) SIMO-ICAを利用した背景雑音の除去に強いBSSA方式の実時間処理を改良して、人にも聞きやすくするために、ミュージカルノイズの低減手法について検討した。 (b) ハンズフリーロボット対話では、ロボットの内部雑音の処理が必要である。この内部雑音分離アルゴリズムを半教師あり独立成分分析によるブラインド音源分離の観点から適応処理手法の研究を行った。 (3) 実環境音声対話システムの研究 (a) 音声対話システムに音声検索の機能を追加の研究をさらに進める。とくに、音声検索のための言語モデルの構築方法について、最新の検索語情報、ローカル情報、グーグルNグラムを活用して検討した。 (b) 機械学習による音声と非音声の識別、タスク内発話とタスク外発話の識別に、BOW (Bag of Words)も利用した手法を考案して、性能を改善した。
|
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] SOURCE ADAPTIVE BLIND SIGNAL EXTRACTION USING CLOSED-FORM ICA FOR HANDS-FREE ROBOT SPOKEN DIALOGUE SYSTEM2009
Author(s)
Yu Takahashi, Hiroshi Saruwatari, Yuki Fujihara, Kentaro Tachibana, Yoshimitsu Mori, Shigeki Miyabe, Kiyohiro Shikano, Akira Tanaka
Organizer
IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
Place of Presentation
Taipei, Taiwan
Year and Date
2009-04-23
-
-
-