• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

マルチメディアコンピュータによるモバイル視聴覚融合音声認識システム

Research Project

Project/Area Number 09780354
Research Category

Grant-in-Aid for Encouragement of Young Scientists (A)

Allocation TypeSingle-year Grants
Research Field Intelligent informatics
Research InstitutionOsaka Prefecture University

Principal Investigator

荻原 昭夫  大阪府立大学, 工学部, 講師 (60244654)

Project Period (FY) 1997 – 1998
Project Status Completed (Fiscal Year 1998)
Budget Amount *help
¥2,100,000 (Direct Cost: ¥2,100,000)
Fiscal Year 1998: ¥500,000 (Direct Cost: ¥500,000)
Fiscal Year 1997: ¥1,600,000 (Direct Cost: ¥1,600,000)
Keywords音声認識 / 視聴覚融合 / センサフュージョン / HMM / マルチメディア / モバイル / 視聴覚情報 / Dempster-Shafer確率理論 / 動画像
Research Abstract

本課題では、様々な環境下における音声による対話(マン-マシンインターフェイス)の実現を目的とし、視聴覚融合音声認識システムに関する研究を行なった。具体的には,「人間の目の役割を演ずるテレビカメラ」と「耳の役割を演ずるマイクロホン」から得られた情報を対象としてモバイルコンピュータ上で統合認識処理を行なうことにより、柔軟性のあるマン-マシンインターフェイスの実現を試みている。
本研究の目的である「モバイル視聴覚融合音声認識システム」は,3つの処理(「1.視聴覚情報のデータ収集」,「2.融合および認識手法の開発」,「3.モバイルコンピュータへの実装」)から構築される。平成10年度は,「3.モバイルコンピュータへの実装」に関する研究を行なった。また同時に、昨年度までの成果に改良を加えることにより認識精度の改善を行なった。
・モバイルコンピュータへの実装
昨年度までの研究成果である視聴覚融合音声認識システムをモバイル型マルチメディアコンピュータ上に実装し、室外などの様々な騒音環境下を想定して音声認識実験を行なった。その結果、各種実験により高騒音環境における認識率改善の点で、提案手法が有効であることを確認できた。
・融合手法の改善
昨年度までの研究成果である視聴覚融合音声認識システムにおける視聴覚融合手法に改善を加えた。
具体的には、HMMの出力確率の計算を行なう際にDempster-Shafer確率理論を導入することで、背景騒音などの認識環境により適合した融合を行なうことが可能となり、結果として認識精度の向上を実現した。
なお,上述の実験に用いたモバイル型マルチメディアコンピュータは、本科学研究費補助金研究により購入した設備備品である。

Report

(2 results)
  • 1998 Annual Research Report
  • 1997 Annual Research Report
  • Research Products

    (7 results)

All Other

All Publications (7 results)

  • [Publications] 森川 政伸: "共起ヒストグラムを用いた視聴覚融合音声認識" 1998年 電子情報通信学会情報・システムソサイエティ大会講演論文集. 331 (1998)

    • Related Report
      1998 Annual Research Report
  • [Publications] 浅野 英輔: "唇形状抽出における雑音除去処理" 平成10年 電気関係学会関西支部連合大会 講演論文集. G386 (1998)

    • Related Report
      1998 Annual Research Report
  • [Publications] 森川 政伸: "共起ヒストグラムと一次結合を併用した視聴覚融合音声認識" 平成10年 電気関係学会関西支部連合大会 講演論文集. G392 (1998)

    • Related Report
      1998 Annual Research Report
  • [Publications] 浅野 英輔: "視聴覚融合音声認識に適した唇形状抽出" 電子情報通信学会技術研究報告. 98・451. 79-85 (1998)

    • Related Report
      1998 Annual Research Report
  • [Publications] 石原 直樹: "Dempster-Shafer確率理論を用いた視聴覚融合音声認識" 1999年 電子情報通信学会 総合大会 講演論文集. (発表予定). (1999)

    • Related Report
      1998 Annual Research Report
  • [Publications] 森川 政伸: "TDNNによる視聴覚融合音声認識手法の検討" 第12回ディジタル信号処理シンポジウム講演論文集. 297-302 (1997)

    • Related Report
      1997 Annual Research Report
  • [Publications] 浅野 英輔: "カラー情報を用いた唇形状の抽出" 1998年 電子情報通信学会 総合大会講演論文集. (発表予定). (1998)

    • Related Report
      1997 Annual Research Report

URL: 

Published: 1997-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi