• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実施状況報告書

ロボットのための音声・環境音・背景音同時認識システムの開発

研究課題

研究課題/領域番号 24700169
研究機関大阪産業大学

研究代表者

高橋 徹  大阪産業大学, デザイン工学部, 講師 (30419494)

キーワードロボット聴覚 / 音声 / 環境音 / 背景音 / 音源分離 / 音声識別 / 音声認識 / 音環境理解
研究概要

本研究課題は、ロボットによる聴覚機能を実現しようとする試みである。平成25年度の研究目標は、同時発話音声認識・環境音認識・背景音認識を統合したシステムの機能アップと認識性能改善であった。平成24年度に開発したシステムには、提示音に対し、音源分離後、分離音をどのサブシステムで認識させるかの判別が、自動化されていない課題があった。平成25年度は、提示音を3つのサブシステム内の、どのサブシステムが認識処理すべきかを自動判別する課題に取り組んだ。2段階判定により、音声・環境音・背景音のいずれであるかを自動判別する手法を開発した。まず、音声か非音声かを判別し、音声であれば、音声認識サブシステムにより音を文字化する。非音声であれば、当該音源が方向性を有する場合に、特定音源の音響イベントであると判断し、環境音として音を文字化する。方向性を有しない場合、つまり無指向性音源であると推定される音は、背景音と考え、背景音認識を行うシステムを構築した。これにより、音声・環境音・背景音が混在する環境での、音声認識・環境音認識・背景音認識を同時に行うことが可能になった。
音声と非音声の判定に、基本周波数とスペクトル傾斜を用い、約85%の識別が可能であることを確認した。環境音または背景音に分類される音についての識別率は、未確認であるものの、背景音について、オフィス、廊下、エレベータホール、階段の踊り場の4ヶ所の背景音を識別する実験を行った。長時間スペクトルの変動量を測ることで背景音を約90%の精度で識別できることを確認した。
その他、音だけでは解決できない状況に対処するために、ロボットにGPSを追加した。ロボットの位置情報を利用するシステムを開発した。この位置情報収集技術は、低床式路面電車の位置情報通知システムとして路面電車上で実証試験も行われた。本研究課題による成果の社会還元の一例となっている。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本課題は、ロボット聴覚の研究として、音環境を理解するために行われている。特に同時発話音声認識・環境音認識・背景音認識を同時にかつ自動的に行うシステムを開発してきた。これら3つの認識サブシステムの統合が行われ、システムプロトタイプが稼働しており、認識実験のデータも順調に積み上げられている。
当初は、ロボット搭載のカメラを、認識の補助情報に使用する計画であった。しかし、GPS とレーザ距離計による情報を用いて、ロボット周囲の情報を補助情報として利用可能な所まで開発が進んでいる。カメラによる画像処理情報を利用していない点では、当初計画と相違があるものの、認識機能アップという目的は、達成されている。
更に、本研究課題のために開発した GPS による位置情報収集システムが、公共交通の運行車両位置情報通知システムとして実証試験に使用され、当初計画を超えた成果が生まれている。
以上の結果から、本研究課題は、おおむね順調に進展していると考えている。

今後の研究の推進方策

認識精度の改善を目的として、システム全体の最適化を行う。システムのチューニングパラメータを学習用データから統計的に最適化する。例えば、広い部屋、狭い部屋、騒音レベルの高い場所、低い場所の学習データを準備する。これらの環境の違いによりシステムのチューニングパラメータを最適化し、同一環境での認識精度の向上を図る。一方で、補助情報の利用方法を検討する。GPSやレーザ距離計により、ロボット周辺の壁、床、天井などの構造物との位置関係を推定することが可能である。これらの情報から広い部屋か、狭い部屋かを推定する。周囲の音環境を推定する方法について検討し、環境に特化したパラメータで信号処理を行うことで認識精度向上を図る。

次年度の研究費の使用計画

平成25年度にカメラを購入し、音声認識のための補助情報として画像処理を組み込む予定であった。しかしながら、GPSとレーザ距離計を用いた実験により十分な補助情報が得られたため、カメラの購入を控えた。そのため平成26年度使用額が発生した。
平成26年度に、計画当初より購入予定であるデモ用ロボットの購入費用と合算し、カメラ搭載型ロボットを購入することで、使途変更せず執行し、平成26年度中に画像処理部分の研究を行う計画である。

  • 研究成果

    (5件)

すべて 2014 2013

すべて 学会発表 (5件)

  • [学会発表] GPS を使った堺市低床式車両位置情報通知サービスの開発2014

    • 著者名/発表者名
      谷口 哲也, 高橋 徹
    • 学会等名
      情報処理学会第76回全国大会
    • 発表場所
      東京電機大学
    • 年月日
      20140311-20140313
  • [学会発表] テレビ番組のジャンル別音声の混合・非混合シーンの調査2014

    • 著者名/発表者名
      赤塚 俊洋, 高橋 徹
    • 学会等名
      日本音響学会2014年春季研究発表会
    • 発表場所
      日本大学
    • 年月日
      20140310-20140312
  • [学会発表] マイクロホンアレイを用いた音声・環境音・背景音の識別2014

    • 著者名/発表者名
      高橋 徹
    • 学会等名
      日本音響学会2014年春季研究発表会
    • 発表場所
      日本大学
    • 年月日
      20140310-20140312
  • [学会発表] ロボットのための音声と環境音の識別手法2013

    • 著者名/発表者名
      高橋 徹
    • 学会等名
      日本音響学会2013年秋季研究発表会
    • 発表場所
      豊橋技術科学大学
    • 年月日
      20130925-20130927
  • [学会発表] 音楽と音声の混合音からの楽曲同定に関する一考察2013

    • 著者名/発表者名
      樋口 颯, 高橋 徹
    • 学会等名
      日本音響学会2013年秋季研究発表会
    • 発表場所
      豊橋技術科学大学
    • 年月日
      20130925-20130927

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi