研究課題/領域番号 |
16K21584
|
研究機関 | 室蘭工業大学 |
研究代表者 |
小林 洋介 室蘭工業大学, 工学研究科, 助教 (10735103)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 音声了解度 / 機械学習 / 屋外拡声 / 音声認識 / 時系列モデル / 了解度予測 / 統計モデル |
研究実績の概要 |
屋外拡声器などを想定した文章音声了解度を予測する時系列モデルの研究開発を行ってる。本研究では,文章了解度を直接評価するのではなく,単語了解度の予測モデルから文章了解度を予測することを提案している。このため,文章了解度を評価する手法とともに単語了解度を文章了解度に合わせて評価する手法が必要である。 今年度は,従来よりも簡易な了解度評価法の開発と音声認識を用いた予測モデルの基礎検討を中心に行った。特に,屋外拡声器を想定した環境とスピーチマスキングシステムの環境の両方の基礎実験を行なった。拡声器モデルでは,スピーチノイズによる妨害と屋内での放送を想定した実験を行い,マスキングシステムの例では,提案するアルゴリズムでの実験を行なった。加えて,一般化線形モデルによる了解度予測を行い,モデル化が可能なことを示した。また,音声認識による了解度推定も検討し,屋外拡声器の音声を模擬した音声で学習した場合の音声認識性能は,学習しない場合に比べ3割程度改善することが明らかとなった。マスキングモデルで提案舌ブートストラップ型マスカーは,効率的な生成アルゴリズムであることが特徴であり,物理的な特徴が同等な他のマスカーよりも音声の了解度を4dB相当以上低下させることが実験的に明らかとなった。この現象を予測する統計モデルの作成について基礎的な検討を行い,機械学習に必要な要素技術を検討した。その結果大まかにはLPCケプストラムの距離の差が有効である可能性を示した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
研究代表の小林が年度当初に室蘭工業大学に異動したため,研究室の立ち上げ作業などに時間がかかり,本プロジェクトの進行が遅れ気味である。特に,初年度は被験者実験を伴う活動が中心となるため,実験環境の構築のための装置の機関移動や研究倫理審査等の重要な作業が発生していた。しかし,学内のプロジェクト助成などによる支援もあり,立ち上げ作業が1年でほぼ終わったため,残り2年の研究進捗に与える影響は少ないと考えている。 これまでに関連研究で3件の研究会発表,2件の国際会議発表を行い,1件の論文を投稿した。今年度は基礎的な実験をより増やすことで,研究成果をより確実なものとしていきたい。
|
今後の研究の推進方策 |
今年度は研究室の大学院生も研究に関わることとなり,データの整形等の速度が向上する。合わせて音声認識・機械学習用の計算環境を整備していく。また,音声データのコーパスを整備することで,よりロバストな音声認識・機械学習の環境を構築していく。加えて,主観評価データのさらなる追加のための聴取実験を丁寧に行い,実験数を増やしていきたい。さらに,関連研究者との情報交換のため,学会等での情報収集を丁寧に行なっていく。
|