2002 Fiscal Year Annual Research Report
遍在ウェアラブル計算環境における会議CSCWのための音声認識システムの研究
Project/Area Number |
12480083
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
古井 貞煕 東京工業大学, 大学院・情報理工学研究科, 教授 (90293076)
|
Co-Investigator(Kenkyū-buntansha) |
岩野 公司 東京工業大学, 大学院・情報理工学研究科, 助手 (90323823)
|
Keywords | 遍在・ウェアラブル計算環境 / 会議CSCW / 並列型計算機 / 音声対話 / 音声認識システム / 発話内容 |
Research Abstract |
偏在・ウェアラブル計算環境における会議CSCWの実現のため、音声を並列型計算機によりオンラインで認識するシステムを構築してきた。今年度は、話題が次々に変わるような状況への適用可能性を調べるため、東京圏の飲食店に関する情報を音声対話によって得るシステムを構築して実験を行った。利用者は希望の場所と料理を発声し、さらに希望条件を発声して、店舗情報データベースから好みにあった店の情報を得ることができる。従来の対話システムは、対話の状態ごとに、利用者の発話内容カテゴリー(リクエスト、応答など)を限定するシステムが多い。しかしこれは利用者にとって必ずしも使いやすい自由度のあるシステムでないため、利用者からの自然な発話を理解するとともに、利用者も音声によって対話の制御を行うことができるシステムの構築が求められている。そのためには、任意のシステム状態において、利用者の自由な発話を受理し、内容を理解する必要がある。そこで、想定される様々な発話内容カテゴリーに対応する複数のシステム状態と、対応する言語モデルを用意し、複数の音声認識器にその言語モデルを割り当て、並列処理型計算機で同時並行的に駆動した。認識器が出力するスコア(尤度)を基に、利用者の要求を理解し、それに応じて対話を進めることにより、利用者による自由な対話制御を実現した。発話内容カテゴリーの遷移確率をあらかじめ学習しておき、音響モデル、言語モデルによる尤度との重みつき組み合わせによって、発話内容カテゴリーと、発話内容を求めた。評価実験の結果、構築したシステムの有効性が確認された。また、並列処理型の音声認識システムは、柔軟なシステム設計が可能で、システムの変更が容易であることが示された。
|
-
[Publications] Chiori Hori, Sadaoki Furui, Rob Malkin, Hua Yu, Alex Waibel: "A Statistical Approach to Automatic Speech Summarization"EURASIP Journal on Applied Signal Processing. 29. 361-367 (2003)
-
[Publications] 篠崎 隆宏, 古井 貞煕: "日本語話し言葉コーパスを用いた講演音声認識"情報処理学会論文誌. Vol.43, No.7. 2098-2107 (2002)
-
[Publications] Katsutoshi Ohtsuki, Tatsuo Matsuoka, Shoichi Matsunaga, Sadaoki Furui: "Topic Extraction Based on Continuous Speech Recognition in Broadcast News Speech"IEICE Trans. Inf. & Syst.. Vol.E85-D, No.7. 1138-1144 (2002)
-
[Publications] Zhipeng Zhang, Sadaoki Furui, Katsutoshi Ohtsuki: "On-line Incremental Speaker Adaptation for Broadcast News Transcription"Speech Communication. 37. 271-281 (2002)