2013 Fiscal Year Research-status Report
ロボットのための音声・環境音・背景音同時認識システムの開発
Project/Area Number |
24700169
|
Research Institution | Osaka Sangyo University |
Principal Investigator |
高橋 徹 大阪産業大学, デザイン工学部, 講師 (30419494)
|
Keywords | ロボット聴覚 / 音声 / 環境音 / 背景音 / 音源分離 / 音声識別 / 音声認識 / 音環境理解 |
Research Abstract |
本研究課題は、ロボットによる聴覚機能を実現しようとする試みである。平成25年度の研究目標は、同時発話音声認識・環境音認識・背景音認識を統合したシステムの機能アップと認識性能改善であった。平成24年度に開発したシステムには、提示音に対し、音源分離後、分離音をどのサブシステムで認識させるかの判別が、自動化されていない課題があった。平成25年度は、提示音を3つのサブシステム内の、どのサブシステムが認識処理すべきかを自動判別する課題に取り組んだ。2段階判定により、音声・環境音・背景音のいずれであるかを自動判別する手法を開発した。まず、音声か非音声かを判別し、音声であれば、音声認識サブシステムにより音を文字化する。非音声であれば、当該音源が方向性を有する場合に、特定音源の音響イベントであると判断し、環境音として音を文字化する。方向性を有しない場合、つまり無指向性音源であると推定される音は、背景音と考え、背景音認識を行うシステムを構築した。これにより、音声・環境音・背景音が混在する環境での、音声認識・環境音認識・背景音認識を同時に行うことが可能になった。 音声と非音声の判定に、基本周波数とスペクトル傾斜を用い、約85%の識別が可能であることを確認した。環境音または背景音に分類される音についての識別率は、未確認であるものの、背景音について、オフィス、廊下、エレベータホール、階段の踊り場の4ヶ所の背景音を識別する実験を行った。長時間スペクトルの変動量を測ることで背景音を約90%の精度で識別できることを確認した。 その他、音だけでは解決できない状況に対処するために、ロボットにGPSを追加した。ロボットの位置情報を利用するシステムを開発した。この位置情報収集技術は、低床式路面電車の位置情報通知システムとして路面電車上で実証試験も行われた。本研究課題による成果の社会還元の一例となっている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本課題は、ロボット聴覚の研究として、音環境を理解するために行われている。特に同時発話音声認識・環境音認識・背景音認識を同時にかつ自動的に行うシステムを開発してきた。これら3つの認識サブシステムの統合が行われ、システムプロトタイプが稼働しており、認識実験のデータも順調に積み上げられている。 当初は、ロボット搭載のカメラを、認識の補助情報に使用する計画であった。しかし、GPS とレーザ距離計による情報を用いて、ロボット周囲の情報を補助情報として利用可能な所まで開発が進んでいる。カメラによる画像処理情報を利用していない点では、当初計画と相違があるものの、認識機能アップという目的は、達成されている。 更に、本研究課題のために開発した GPS による位置情報収集システムが、公共交通の運行車両位置情報通知システムとして実証試験に使用され、当初計画を超えた成果が生まれている。 以上の結果から、本研究課題は、おおむね順調に進展していると考えている。
|
Strategy for Future Research Activity |
認識精度の改善を目的として、システム全体の最適化を行う。システムのチューニングパラメータを学習用データから統計的に最適化する。例えば、広い部屋、狭い部屋、騒音レベルの高い場所、低い場所の学習データを準備する。これらの環境の違いによりシステムのチューニングパラメータを最適化し、同一環境での認識精度の向上を図る。一方で、補助情報の利用方法を検討する。GPSやレーザ距離計により、ロボット周辺の壁、床、天井などの構造物との位置関係を推定することが可能である。これらの情報から広い部屋か、狭い部屋かを推定する。周囲の音環境を推定する方法について検討し、環境に特化したパラメータで信号処理を行うことで認識精度向上を図る。
|
Expenditure Plans for the Next FY Research Funding |
平成25年度にカメラを購入し、音声認識のための補助情報として画像処理を組み込む予定であった。しかしながら、GPSとレーザ距離計を用いた実験により十分な補助情報が得られたため、カメラの購入を控えた。そのため平成26年度使用額が発生した。 平成26年度に、計画当初より購入予定であるデモ用ロボットの購入費用と合算し、カメラ搭載型ロボットを購入することで、使途変更せず執行し、平成26年度中に画像処理部分の研究を行う計画である。
|