1998 Fiscal Year Annual Research Report
マルチメディアコンピュータによるモバイル視聴覚融合音声認識システム
Project/Area Number |
09780354
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
荻原 昭夫 大阪府立大学, 工学部, 講師 (60244654)
|
Keywords | 音声認識 / 視聴覚融合 / センサフュージョン / HMM / マルチメディア / モバイル / 視聴覚情報 / Dempster-Shafer確率理論 |
Research Abstract |
本課題では、様々な環境下における音声による対話(マン-マシンインターフェイス)の実現を目的とし、視聴覚融合音声認識システムに関する研究を行なった。具体的には,「人間の目の役割を演ずるテレビカメラ」と「耳の役割を演ずるマイクロホン」から得られた情報を対象としてモバイルコンピュータ上で統合認識処理を行なうことにより、柔軟性のあるマン-マシンインターフェイスの実現を試みている。 本研究の目的である「モバイル視聴覚融合音声認識システム」は,3つの処理(「1.視聴覚情報のデータ収集」,「2.融合および認識手法の開発」,「3.モバイルコンピュータへの実装」)から構築される。平成10年度は,「3.モバイルコンピュータへの実装」に関する研究を行なった。また同時に、昨年度までの成果に改良を加えることにより認識精度の改善を行なった。 ・モバイルコンピュータへの実装 昨年度までの研究成果である視聴覚融合音声認識システムをモバイル型マルチメディアコンピュータ上に実装し、室外などの様々な騒音環境下を想定して音声認識実験を行なった。その結果、各種実験により高騒音環境における認識率改善の点で、提案手法が有効であることを確認できた。 ・融合手法の改善 昨年度までの研究成果である視聴覚融合音声認識システムにおける視聴覚融合手法に改善を加えた。 具体的には、HMMの出力確率の計算を行なう際にDempster-Shafer確率理論を導入することで、背景騒音などの認識環境により適合した融合を行なうことが可能となり、結果として認識精度の向上を実現した。 なお,上述の実験に用いたモバイル型マルチメディアコンピュータは、本科学研究費補助金研究により購入した設備備品である。
|
-
[Publications] 森川 政伸: "共起ヒストグラムを用いた視聴覚融合音声認識" 1998年 電子情報通信学会情報・システムソサイエティ大会講演論文集. 331 (1998)
-
[Publications] 浅野 英輔: "唇形状抽出における雑音除去処理" 平成10年 電気関係学会関西支部連合大会 講演論文集. G386 (1998)
-
[Publications] 森川 政伸: "共起ヒストグラムと一次結合を併用した視聴覚融合音声認識" 平成10年 電気関係学会関西支部連合大会 講演論文集. G392 (1998)
-
[Publications] 浅野 英輔: "視聴覚融合音声認識に適した唇形状抽出" 電子情報通信学会技術研究報告. 98・451. 79-85 (1998)
-
[Publications] 石原 直樹: "Dempster-Shafer確率理論を用いた視聴覚融合音声認識" 1999年 電子情報通信学会 総合大会 講演論文集. (発表予定). (1999)