• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

ハンズフリー音声認識・視線検出による上肢不自由者への文書作成支援の確立

Research Project

Project/Area Number 16K21579
Research InstitutionTokuyama College of Technology

Principal Investigator

宮崎 亮一  徳山工業高等専門学校, 情報電子工学科, 助教 (40734728)

Project Period (FY) 2016-04-01 – 2019-03-31
Keywords雑音抑圧 / 音声強調 / 倍音復元 / 音声認識
Outline of Annual Research Achievements

本研究は,ハンズフリー音声認識・視線検出システムによる上肢不自由者のための文書作成支援の確立を目指す.本年度の目標は,雑音・残響下で頑健に動作する音声認識システムの構築であり,主に以下の研究を行った.
(1)音声認識性能が最大となる内部パラメータの導出:雑音抑圧や残響抑圧に関しては世界中で研究が行われているが,各環境に応じて最高の音声認識性能を引き出すために,内部パラメータを手作業で調整することが多い.本研究では様々な実験条件,パラメータを用いた音声認識実験を行うことにより,環境ごとで最適な内部パラメータの傾向を得た.また,実験で得られた結果よりパラメータの推定には重回帰分析が有効であることを明らかにした.重回帰分析で推定したパラメータを用いることで,様々な環境下で安定して高い音声認識性能を得ることを確認した.
(2)倍音復元による音声の品質改善:雑音環境下での音声認識には雑音抑圧が有効であるが,過剰な雑音抑圧は雑音成分だけではなく真の音声成分まで歪むという問題がある.そこで,倍音復元に基づく雑音抑圧に着目し,雑音抑圧によって失われた倍音成分が復元されることを確認した.また,倍音復元に基づく雑音抑圧はあらゆる古典的な雑音抑圧で有効であることを実験より明らかにした.さらに,雑音環境下で頑健に動作するリアルタイム音声認識システムを目指して,倍音復元に基づく雑音抑圧がリアルタイムで動作するように実装した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

前年度から計画と準備を行っていたため,研究をスムーズに遂行することができた.

Strategy for Future Research Activity

今年度は,音声認識性能を最大とするパラメータの推定,倍音復元に基づく雑音抑圧のリアルタイム処理に着手した.今後は,上記の二つを組み合わせることで雑音環境下で頑健に動作する音声認識システムの構築を目指す.また,当初の予定通り,視線検出システムの構築および文書修正システムの開発を行う.

Causes of Carryover

次年度使用額は549円少額であり,ほとんど当初の予定通り経費を執行することができた.

Expenditure Plan for Carryover Budget

平成29年度は視線検出に関する研究に取り組むため,研究を遂行するための図書やデバイスの購入を予定している.

  • Research Products

    (9 results)

All 2017 2016

All Presentation (9 results) (of which Int'l Joint Research: 2 results,  Invited: 1 results)

  • [Presentation] Evaluation of Sound Quality and Speech Recognition Performance using Harmonic Regeneration for Various Noise Reduction Techniques2017

    • Author(s)
      Masakazu Une, Ryoichi Miyazaki
    • Organizer
      2017 RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing (NCSP17)
    • Place of Presentation
      タモン(グアム)
    • Year and Date
      2017-02-28 – 2017-03-03
    • Int'l Joint Research
  • [Presentation] 音声認識性能を最大と雑音抑圧の内部パラメータ推定に関する研究2017

    • Author(s)
      宮﨑亮一,久保真太郎
    • Organizer
      IEEE CEソサイエティ西日本合同チャプタ主催1月研究会
    • Place of Presentation
      海峡メッセ下関(山口県・下関市)
    • Year and Date
      2017-01-20 – 2017-01-20
    • Invited
  • [Presentation] 一般化ガウス分布仮定における音声統計量の推定精度に関する評価2016

    • Author(s)
      垣元宏太,宮﨑亮一
    • Organizer
      第19回日本音響学会関西支部若手研究者交流研究発表会
    • Place of Presentation
      関西大学100周年記念会館(大阪府・吹田市)
    • Year and Date
      2016-12-18 – 2016-12-18
  • [Presentation] 音声認識性能を最大とする beta-order MMSE-STSA 法のパラメータ推定2016

    • Author(s)
      久保真太郎,宮﨑亮一
    • Organizer
      第19回日本音響学会関西支部若手研究者交流研究発表会
    • Place of Presentation
      関西大学100周年記念会館(大阪府・吹田市)
    • Year and Date
      2016-12-18 – 2016-12-18
  • [Presentation] 倍音復元技術を用いたリアルタイム雑音抑圧に関する研究2016

    • Author(s)
      長尾恭太,宮﨑亮一
    • Organizer
      第19回日本音響学会関西支部若手研究者交流研究発表会
    • Place of Presentation
      関西大学100周年記念会館(大阪府・吹田市)
    • Year and Date
      2016-12-18 – 2016-12-18
  • [Presentation] 様々な雑音抑圧手法における倍音復元による音声認識性能に関する研究2016

    • Author(s)
      宇根昌和,宮﨑亮一
    • Organizer
      第19回日本音響学会関西支部若手研究者交流研究発表会
    • Place of Presentation
      関西大学100周年記念会館(大阪府・吹田市)
    • Year and Date
      2016-12-18 – 2016-12-18
  • [Presentation] 様々な雑音抑圧手法における倍音復元による音声の品質評価に関する研究2016

    • Author(s)
      宇根昌和,宮﨑亮一
    • Organizer
      第18回 IEEE Hiroshima Student Symposium
    • Place of Presentation
      山口大学常盤キャンパス(山口県・宇部市)
    • Year and Date
      2016-11-19 – 2016-11-20
  • [Presentation] Estimation of Spectral Subtraction Parameter-Set for Maximizing Speech Recognition Performance2016

    • Author(s)
      Shintaro Kubo, Ryoichi Miyazaki
    • Organizer
      5th IEEE Global Conference on Consumer Electronics (GCCE2016)
    • Place of Presentation
      メルパルク京都(京都府・京都市)
    • Year and Date
      2016-10-11 – 2016-10-14
    • Int'l Joint Research
  • [Presentation] 音声認識性能を最大とするスペクトル減算法のパラメータ推定2016

    • Author(s)
      久保真太郎,宮﨑亮一
    • Organizer
      電子情報通信学会ソサイエティ大会
    • Place of Presentation
      北海道大学(北海道・札幌市)
    • Year and Date
      2016-09-20 – 2016-09-23

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi