• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実施状況報告書

ハンズフリー音声認識・視線検出による上肢不自由者への文書作成支援の確立

研究課題

研究課題/領域番号 16K21579
研究機関徳山工業高等専門学校

研究代表者

宮崎 亮一  徳山工業高等専門学校, 情報電子工学科, 助教 (40734728)

研究期間 (年度) 2016-04-01 – 2019-03-31
キーワード雑音抑圧 / 音声強調 / 倍音復元 / 音声認識
研究実績の概要

本研究は,ハンズフリー音声認識・視線検出システムによる上肢不自由者のための文書作成支援の確立を目指す.本年度の目標は,雑音・残響下で頑健に動作する音声認識システムの構築であり,主に以下の研究を行った.
(1)音声認識性能が最大となる内部パラメータの導出:雑音抑圧や残響抑圧に関しては世界中で研究が行われているが,各環境に応じて最高の音声認識性能を引き出すために,内部パラメータを手作業で調整することが多い.本研究では様々な実験条件,パラメータを用いた音声認識実験を行うことにより,環境ごとで最適な内部パラメータの傾向を得た.また,実験で得られた結果よりパラメータの推定には重回帰分析が有効であることを明らかにした.重回帰分析で推定したパラメータを用いることで,様々な環境下で安定して高い音声認識性能を得ることを確認した.
(2)倍音復元による音声の品質改善:雑音環境下での音声認識には雑音抑圧が有効であるが,過剰な雑音抑圧は雑音成分だけではなく真の音声成分まで歪むという問題がある.そこで,倍音復元に基づく雑音抑圧に着目し,雑音抑圧によって失われた倍音成分が復元されることを確認した.また,倍音復元に基づく雑音抑圧はあらゆる古典的な雑音抑圧で有効であることを実験より明らかにした.さらに,雑音環境下で頑健に動作するリアルタイム音声認識システムを目指して,倍音復元に基づく雑音抑圧がリアルタイムで動作するように実装した.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

前年度から計画と準備を行っていたため,研究をスムーズに遂行することができた.

今後の研究の推進方策

今年度は,音声認識性能を最大とするパラメータの推定,倍音復元に基づく雑音抑圧のリアルタイム処理に着手した.今後は,上記の二つを組み合わせることで雑音環境下で頑健に動作する音声認識システムの構築を目指す.また,当初の予定通り,視線検出システムの構築および文書修正システムの開発を行う.

次年度使用額が生じた理由

次年度使用額は549円少額であり,ほとんど当初の予定通り経費を執行することができた.

次年度使用額の使用計画

平成29年度は視線検出に関する研究に取り組むため,研究を遂行するための図書やデバイスの購入を予定している.

  • 研究成果

    (9件)

すべて 2017 2016

すべて 学会発表 (9件) (うち国際学会 2件、 招待講演 1件)

  • [学会発表] Evaluation of Sound Quality and Speech Recognition Performance using Harmonic Regeneration for Various Noise Reduction Techniques2017

    • 著者名/発表者名
      Masakazu Une, Ryoichi Miyazaki
    • 学会等名
      2017 RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing (NCSP17)
    • 発表場所
      タモン(グアム)
    • 年月日
      2017-02-28 – 2017-03-03
    • 国際学会
  • [学会発表] 音声認識性能を最大と雑音抑圧の内部パラメータ推定に関する研究2017

    • 著者名/発表者名
      宮﨑亮一,久保真太郎
    • 学会等名
      IEEE CEソサイエティ西日本合同チャプタ主催1月研究会
    • 発表場所
      海峡メッセ下関(山口県・下関市)
    • 年月日
      2017-01-20 – 2017-01-20
    • 招待講演
  • [学会発表] 一般化ガウス分布仮定における音声統計量の推定精度に関する評価2016

    • 著者名/発表者名
      垣元宏太,宮﨑亮一
    • 学会等名
      第19回日本音響学会関西支部若手研究者交流研究発表会
    • 発表場所
      関西大学100周年記念会館(大阪府・吹田市)
    • 年月日
      2016-12-18 – 2016-12-18
  • [学会発表] 音声認識性能を最大とする beta-order MMSE-STSA 法のパラメータ推定2016

    • 著者名/発表者名
      久保真太郎,宮﨑亮一
    • 学会等名
      第19回日本音響学会関西支部若手研究者交流研究発表会
    • 発表場所
      関西大学100周年記念会館(大阪府・吹田市)
    • 年月日
      2016-12-18 – 2016-12-18
  • [学会発表] 倍音復元技術を用いたリアルタイム雑音抑圧に関する研究2016

    • 著者名/発表者名
      長尾恭太,宮﨑亮一
    • 学会等名
      第19回日本音響学会関西支部若手研究者交流研究発表会
    • 発表場所
      関西大学100周年記念会館(大阪府・吹田市)
    • 年月日
      2016-12-18 – 2016-12-18
  • [学会発表] 様々な雑音抑圧手法における倍音復元による音声認識性能に関する研究2016

    • 著者名/発表者名
      宇根昌和,宮﨑亮一
    • 学会等名
      第19回日本音響学会関西支部若手研究者交流研究発表会
    • 発表場所
      関西大学100周年記念会館(大阪府・吹田市)
    • 年月日
      2016-12-18 – 2016-12-18
  • [学会発表] 様々な雑音抑圧手法における倍音復元による音声の品質評価に関する研究2016

    • 著者名/発表者名
      宇根昌和,宮﨑亮一
    • 学会等名
      第18回 IEEE Hiroshima Student Symposium
    • 発表場所
      山口大学常盤キャンパス(山口県・宇部市)
    • 年月日
      2016-11-19 – 2016-11-20
  • [学会発表] Estimation of Spectral Subtraction Parameter-Set for Maximizing Speech Recognition Performance2016

    • 著者名/発表者名
      Shintaro Kubo, Ryoichi Miyazaki
    • 学会等名
      5th IEEE Global Conference on Consumer Electronics (GCCE2016)
    • 発表場所
      メルパルク京都(京都府・京都市)
    • 年月日
      2016-10-11 – 2016-10-14
    • 国際学会
  • [学会発表] 音声認識性能を最大とするスペクトル減算法のパラメータ推定2016

    • 著者名/発表者名
      久保真太郎,宮﨑亮一
    • 学会等名
      電子情報通信学会ソサイエティ大会
    • 発表場所
      北海道大学(北海道・札幌市)
    • 年月日
      2016-09-20 – 2016-09-23

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi