2016 年度実施状況報告書

音環境推定に基づく危機検知システムの開発

研究課題

研究課題/領域番号	16K16094
研究機関	立命館大学
研究代表者	福森隆寛立命館大学, 情報理工学部, 助教 (60755817)
研究期間 (年度)	2016-04-01 – 2019-03-31
キーワード	音環境理解 / 危機検知
研究実績の概要	本研究では、家庭内の危機的状況を検知することを目指して、学術研究助成基金助成金交付期間内に音環境をリアルタイムで自動推定できるシステムを開発する。具体的には、本研究を以下に示す４つのサブテーマに分けて研究を実施する計画である（＜研究１－３＞で音環境推定から危機的状況の検知までの一連のアルゴリズムを開発し、＜研究４＞でこれらの研究成果を統合した危機検知システムを開発する）。＜研究１＞家庭内に存在する不要な雑音成分の除去＜研究２＞音環境推定に適切な音声・音響特徴量の特定＜研究３＞音情報の構造化と危機的状況の検知＜研究４＞音環境推定に基づく危機検知システムの開発平成２８年度は、上記項目の「＜研究１＞家庭内に存在する不要な雑音成分の除去」と「＜研究２＞音環境推定に適切な音声・音響特徴量の特定」に取り組んだ。＜研究１＞では不要な雑音（室内の騒音や壁・床からの反射など）を除去するためのアルゴリズムを開発した。具体的には「①騒音環境で発話された音声の特徴量（特に位相成分）を雑音が含まれない音声の特徴量に変換することで、観測音声に含まれる騒音を除去する手法」と「②人間の声の高さに相当する基本周波数を用いて室内で発話された音声から床や壁の反響成分を取り除く手法」のアルゴリズムを開発し、評価実験を通してこれらの有効性を確認した。＜研究２＞では音環境推定の中でも音声の発話様式に着目し、平静音声と危機的音声を表す叫び声を切り分けるアルゴリズムを開発した。具体的には、喉元の声帯と声道の運動が平静音声と叫び声で異なることを明らかにし、この知見に基づいて叫び声と平静音声を切り分けるための音声特徴量を提案した。評価実験の結果、提案した音声特徴量の有効性を確認できただけでなく、この特徴量が騒音にも頑健であることも示すことができた。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由音環境を理解するためには、不要な雑音（騒音成分や壁・床からの反射成分）への対策と音環境理解に適切な音声・音響特徴量の特定が必要不可欠である。平成２８年度では特に観測音声から騒音・反射成分を除去するアルゴリズムと人間の発話様式を識別するための音声特徴量を提案した。そして、評価実験を通して、実際の利用環境を想定した条件において、正確な雑音除去や発話様式識別を実証することができたことから、本研究課題はおおむね順調に進展していると考えている。
今後の研究の推進方策	今後の研究の推進方策として、平成２８年度で確立した「＜研究１＞家庭内に存在する不要な雑音成分の除去」と「＜研究２＞音環境推定に適切な音声・音響特徴量の特定」に基づいて「＜研究３＞音情報の構造化と危機的状況の検知」に取り組む予定である。具体的には、世の中にある環境音を正常音（歩行音、洗濯機の音、平静音声など）と異常音（ガラスが破砕する音、爆発音、叫び声など）に予め分類する。そして、実際の利用環境において観測された音情報から環境音の構造化（正常音と異常音に分類）を行い、その結果をもとに危機的状況の検知に挑戦する計画である。特に本研究の有効性を示すために大規模な音声・音響試料を使用した検証実験や、アウトリーチ活動を通した実証実験に取り組む予定である。
次年度使用額が生じた理由	平成２８年度は学術研究助成基金助成金を使って、雑音除去・音環境推定アルゴリズム開発環境を構築する計画であったが、研究を遂行する中で本学が保有する大型計算機サーバを一時的に代用することができたため、当初より安価で当アルゴリズム開発環境を構築することができた。
次年度使用額の使用計画	平成２８年度における研究活動（特に学会発表）を通して、音声・音響分野の第一線で活躍されている大学教員ならびに企業研究者から、上記理由で述べた雑音除去・音環境推定アルゴリズムに関するデモシステムを対外発表等にて公開して欲しい旨の意見・要望を多数頂戴した。そこで、平成２９年度では平成２８年度において生じた次年度使用額を雑音除去・音環境推定アルゴリズムを搭載したデモシステムの開発（高性能ノートパソコンや音響機器など）に充当する計画である。

研究成果
(6件)

すべて 2017 2016 その他

すべて学会発表 (5件) (うち国際学会 2件) 備考 (1件)

[学会発表] Rahmonicとメルケプストラムを用いた深層ニューラルネットワークによる叫び声検出の検討2017
- 著者名/発表者名
  福森隆寛, 中山雅人, 西浦敬信, 南條浩輝
- 学会等名
  日本音響学会2017年春季研究発表会
- 発表場所
  明治大学生田キャンパス（神奈川県・川崎市）
- 年月日
  2017-03-15
[学会発表] Phase Reconstruction Method Based on Time-frequency Domain Harmonic Structure for Speech Enhancement2017
- 著者名/発表者名
  Yukoh Wakabayashi, Takahiro Fukumori, Masato Nakayama, Takanobu NIshiura, and Yoichi Yamashita
- 学会等名
  International Conference on Acoustics, Speech and Signal Processing (ICASSP 2017)
- 発表場所
  Hilton Conference Centre (New Orleans, USA)
- 年月日
  2017-03-09
- 国際学会
[学会発表] Rahmonicとメルケプストラムを用いた音響モデルに基づく騒音環境下叫び声検出の性能評価2017
- 著者名/発表者名
  福森隆寛, 中山雅人, 西浦敬信, 南條浩輝
- 学会等名
  電子情報通信学会音声/応用音響/信号処理研究会
- 発表場所
  沖縄産業支援センター（沖縄県・那覇市）
- 年月日
  2017-03-02
[学会発表] 調波構造に基づくDeep Auto Encoderを用いた残響下音声強調2017
- 著者名/発表者名
  太田陸斗, 若林佑幸, 福森隆寛, 中山雅人, 西浦敬信
- 学会等名
  電子情報通信学会音声/応用音響/信号処理研究会
- 発表場所
  沖縄産業支援センター（沖縄県・那覇市）
- 年月日
  2017-03-01
[学会発表] Shouted Speech Detection Using Hidden Markov Model with Rahmonic and Mel-frequency Cepstrum Coefficients2016
- 著者名/発表者名
  Takahiro Fukumori, Masato Nakayama, Takanobu Nishiura, and Hiroaki Nanjo
- 学会等名
  5th Joint Meeting of the Acoustical Society of America and the Acoustical Society of Japan
- 発表場所
  Hilton Hawaiian Village Waikiki Beach Resort Honolulu (Hawaii, USA)
- 年月日
  2016-11-29
- 国際学会
[備考] 立命館大学音情報処理研究室
- URL
  http://www.aspl.is.ritsumei.ac.jp/

2016 年度 実施状況報告書

音環境推定に基づく危機検知システムの開発

研究代表者

福森 隆寛 立命館大学, 情報理工学部, 助教 (60755817)

現在までの達成度 (区分)

理由

研究成果

[学会発表] Rahmonicとメルケプストラムを用いた深層ニューラルネットワークによる叫び声検出の検討2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Phase Reconstruction Method Based on Time-frequency Domain Harmonic Structure for Speech Enhancement2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Rahmonicとメルケプストラムを用いた音響モデルに基づく騒音環境下叫び声検出の性能評価2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 調波構造に基づくDeep Auto Encoderを用いた残響下音声強調2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Shouted Speech Detection Using Hidden Markov Model with Rahmonic and Mel-frequency Cepstrum Coefficients2016

著者名/発表者名

学会等名

発表場所

年月日

[備考] 立命館大学 音情報処理研究室

URL

2016 年度実施状況報告書

福森隆寛立命館大学, 情報理工学部, 助教 (60755817)

[備考] 立命館大学音情報処理研究室