2000 Fiscal Year Annual Research Report
遍在・ウェアラブル計算環境における会議CSCWのための音声認識システムの研究
Project/Area Number |
12480083
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
古井 貞熙 東京工業大学, 大学院・情報理工学研究科, 教授 (90293076)
|
Co-Investigator(Kenkyū-buntansha) |
岩野 公司 東京工業大学, 大学院・情報理工学研究科, 助手 (90323823)
|
Keywords | 会議CSCWシステム / 音声認識 / Ubiquitous / Wearable Computing / 話し言葉 / 話者適応 / 音響バックオフ / 対話型システム / モデル学習 |
Research Abstract |
Ubiquitous/Wearable Computingの時代を想定した会議CSCWシステム実現のための技術を構築することを目指して研究を進めた。NHK研究所の協力を得て、放送の討論や対談の音声を収録し、これを用いた音声認識の研究を行った。 話し言葉に適応した言語モデルや、話者の声質に自動的に適応した音響モデルの構築法について検討し、これらの有効性が確認された。会議や討論の各参加者が個々にマイクロホンを装着していても、相槌や発言のクロストーク(複数話者の音声の重畳)を避けることができないため、クロストークへの対処法についても検討した。クロストーク区間について、そこでの音響スコアは信頼性が低いので、それ以前の音声区間の平均音響スコアで置き換える音響バックオフ法を検討した。その結果、認識性能の向上が確認されたが、現時点では、クロストーク区間は何らかの方法で検出できるものと仮定してマニュアルで与えているため、この問題への対処が残されている。 当面の音声認識技術では、完璧な議事録を自動的に作成することは極めて難しいので、自動的に作られた結果をもとに、人とコンピュータとの対話によって議事録を作成する実験システムを構築した。このシステムを用いた評価実験を行い、話者適応、新しい語彙の追加、人が指摘した認識誤りに基づく自動的なモデル学習などを、有効に組み込む方法や、使いやすいヒューマンインタフェースの検討を進めた。
|
Research Products
(7 results)
-
[Publications] 篠崎,斎藤,堀,古井: "話し言葉音声の認識を目指して"電子情報通信学会技術報告. SP2000-96. 7-12 (2000)
-
[Publications] 篠崎,細川,古井: "話し言葉コーパスを用いた音声認識の検討"日本音響学会春季研究発表会講演論文集. (予定). (2001)
-
[Publications] 斎藤,古井: "対談音声を対象とした音声認識の検討"日本音響学会春季研究発表会講演論文集. (予定). (2001)
-
[Publications] Sadaoki Furui: "Speech recognition technology in the ubiquitous/wearable computing environment"Proc.IEEE Int.Conf.Acoust.,Speech,Signal Process. 3735-3738 (2000)
-
[Publications] Furui,Maekawa,Isahara,Shinozaki,Ohdaira: "Toward the realization of spontaneous speech recognition"Proc.Int.Conf.Spoken Lang.Process.. III518-521 (2000)
-
[Publications] Sadaoki Furui: "Steps toward flexible speech recognition-Recent progress at Tokyo Institute of Technology"Proc.8th Australian Int.Conf.Speech Sci & Tech. 19-29 (2000)
-
[Publications] Sadaoki Furui: "Digital Speech Processing,Synthesis and Recognition (2nd Edition)"Marcel Dekker. 452 (2000)