• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Research-status Report

音声からの発話動作可視化技術に基づく発話訓練支援の研究

Research Project

Project/Area Number 15K00487
Research InstitutionAichi Prefectural University

Principal Investigator

入部 百合絵  愛知県立大学, 情報科学部, 講師 (40397500)

Co-Investigator(Kenkyū-buntansha) 新田 恒雄  早稲田大学, グリーンコンピューティングシステム機構, 客員上級研究員(研究院客員教授) (70314101)
Project Period (FY) 2015-04-01 – 2018-03-31
Keywords発音訓練 / 調音運動 / IPAチャート
Outline of Annual Research Achievements

学習者の音声から調音動作(調音方法(破裂,摩擦,破擦,鼻音など)および調音位置(口唇,歯茎,口蓋,声門など))を抽出して,語学の発音訓練を支援するシステムを開発する.本研究では,学習者の音声から高精度に調音動作を抽出し,その結果をもとにIPA表のチャート図上にリアルタイムに調音動作をプロットすることで,発音の矯正方法を具体的に指導できるソフトウェアを目指す.
初年度である平成27年度は,調音特徴-矩形図プロットを開発するための基本性能である音声-調音特徴変換アルゴリズムの改良を行った.調音特徴は単音分類に用いられる調音様式と調音位置の諸属性から構成される.音声から調音特徴を抽出することで,学習者の音声から調音動作(調音位置や調音様式)を推定でき,国際音声記号(IPA)の母音チャート(舌の盛り上がる位置や口唇の高さの2軸から構成)や子音チャートへ音声の調音動作を直接プロットすることができる.今年度は,我々が開発してきた多層ニューラルネットワークと直交化処理から構成される調音特徴抽出エンジン(IPAから英語と日本語に関する調音特徴セット28種類)を改良し,日本語の5つの母音に対して約93%の精度で調音特徴を抽出することが可能となった.
また,調音特徴抽出エンジンより得た調音特徴をリアルタイムに母音チャート図上にプロット表示するための基本機能を開発した.具体的には,抽出した調音特徴系列から,母音に関連する特徴量(舌の盛り上がる位置(前-中-後)と口唇の高さ(広-半広-半狭-狭))と取り出し,母音チャート上の横軸(盛り上がる位置),縦軸(唇の高さ)に適した座標値に変換するための計算アルゴリズムを開発した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

調音特徴抽出エンジンの改良を行うことで,目標としていた調音特徴抽出精度90%以上を達成することができた.現在のところ,5つの日本語母音に関しては目標値を達成しているが,学習者が日本語以外の言語の発音を学習しようとする場合,その対象言語の母音に対しても,音声から高精度に調音特徴を抽出する必要がある.日本語母音以外に関して言えば,例えば英語母音11個に対する調音特徴抽出精度は約88%である.特に,英語に関しては,口唇の高さの一つである「狭」の抽出精度が他と比較して低いため,個別の調音特徴抽出改善を行う.日本語に関しては,特に抽出精度が低い調音特徴は見当たらないが,全体的に精度を底上げしていく必要がある.

Strategy for Future Research Activity

更に調音特徴抽出エンジンを改良することで,英語母音に関連する調音特徴抽出向上を目指す.特に,他と比較して精度の低かった調音特徴の抽出精度を高めていきたい.
また,英語に関して言えば,日本語にはない英語独特の母音を習得するためにtense,round,およびrhoticityの3種の調音特徴についても,精度良く音声から抽出し,学習者に効果的に表示を返す方法を検討していく.

Causes of Carryover

発話訓練や関連する音声処理研究の情報収集を目的とした学会出張が予定よりも少なかったため.

Expenditure Plan for Carryover Budget

次年度は研究成果を広く発表していく予定であるため,関連研究の情報収集や研究成果発表を目的とした出張費に利用していく.

  • Research Products

    (11 results)

All 2016 2015 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Acknowledgement Compliant: 1 results) Presentation (9 results) (of which Int'l Joint Research: 6 results) Remarks (1 results)

  • [Journal Article] Using Reversed Sequences and Grapheme Generation Rules to Extend the Feasibility of a Phoneme Transition Network-based Grapheme-to-Phoneme Conversion2016

    • Author(s)
      Seng Kheang,Kouichi Katsurada,Yurie Iribe, Tsuneo Nitta
    • Journal Title

      IEICE Transactions

      Volume: E99-D Pages: 1182-1192

    • DOI

      http://doi.org/10.1587/transinf.2015EDP7349

    • Peer Reviewed / Acknowledgement Compliant
  • [Presentation] Suffix Array を用いた高速STD システムにおけるリスコアリング法の検討2016

    • Author(s)
      石原 元気,桂田 浩一,新田 恒雄,入部 百合絵
    • Organizer
      日本音響学会2016年春季研究発表会講演論文集
    • Place of Presentation
      桐蔭横浜大学(神奈川県横浜市)
    • Year and Date
      2016-03-09 – 2016-03-11
  • [Presentation] オートエンコーダと話者性変換ユニットを用いた声質変換法の提案2016

    • Author(s)
      入澤 浩太郎,桂田 浩一,新田 恒雄,入部 百合絵
    • Organizer
      日本音響学会2016年春季研究発表会講演論文集
    • Place of Presentation
      桐蔭横浜大学(神奈川県横浜市)
    • Year and Date
      2016-03-09 – 2016-03-11
  • [Presentation] Audio-visual speech recognition using deep bottleneck features and high-performance lipreading2015

    • Author(s)
      Satoshi Tamura, Hiroshi Ninomiya, Norihide Kitaoka, Shin Osuga, Yurie Iribe, Kazuya Takeda
    • Organizer
      APSIPA ASC 2015
    • Place of Presentation
      香港(中国)
    • Year and Date
      2015-12-16 – 2015-12-19
    • Int'l Joint Research
  • [Presentation] DEVELOPMENT OF NEW SPEECH CORPUS FOR ELDERLY JAPANESE SPEECH RECOGNITION2015

    • Author(s)
      Yurie Iribe, Norihide Kitaoka, Shuhei Segawa
    • Organizer
      O-COCOSDA 2015
    • Place of Presentation
      上海(中国)
    • Year and Date
      2015-10-28 – 2015-10-30
    • Int'l Joint Research
  • [Presentation] Audio-visual processing toward robust speech recognition in cars2015

    • Author(s)
      Satoshi Tamura, Hiroshi Ninomiya, Norihide Kitaoka, Shin Osuga, Yurie Iribe, Kazuya Takeda, Satoru Hayami
    • Organizer
      DSP in vehicle 2015
    • Place of Presentation
      バークレー(アメリカ)
    • Year and Date
      2015-10-14 – 2015-10-16
    • Int'l Joint Research
  • [Presentation] INVESTIGATION OF DNN-BASED MODELING FOR AUDIO-VISUAL SPEECH RECOGNITION2015

    • Author(s)
      Satoshi Tamura, Hiroshi Ninomiya, Norihide Kitaoka, Shin Osuga, Yurie Iribe, Kazuya Takeda, Satoru Hayamizu
    • Organizer
      MLSLP 2015
    • Place of Presentation
      会津大学(福島県会津若松市)
    • Year and Date
      2015-09-19 – 2015-09-20
    • Int'l Joint Research
  • [Presentation] AutoEncoderを用いたActive Appearance Modelsの性能評価2015

    • Author(s)
      渡辺 拓也,桂田 浩一,新田 恒雄,入部 百合絵
    • Organizer
      電子情報通信学会技術研究報告PRMU2015-85
    • Place of Presentation
      愛媛大学(愛媛県松山市)
    • Year and Date
      2015-09-14 – 2015-09-15
  • [Presentation] Integration of Deep Bottleneck Features for Audio-Visual Speech Recognition2015

    • Author(s)
      Hiroshi Ninomiya, Norihide Kitaoka, Satoshi Tamura, Yurie Iribe and Kazuya Takeda
    • Organizer
      InterSpeech 2015
    • Place of Presentation
      ドレスデン(ドイツ)
    • Year and Date
      2015-09-06 – 2015-09-10
    • Int'l Joint Research
  • [Presentation] Model Prioritization Voting Schemes for Phoneme Transition Network-based Grapheme-to-Phoneme Conversion2015

    • Author(s)
      Seng Kheang, Kouichi Katsurada, Yurie Iribe and Tsuneo Nitta
    • Organizer
      CIST2015
    • Place of Presentation
      オタワ(カナダ)
    • Year and Date
      2015-05-11 – 2015-05-12
    • Int'l Joint Research
  • [Remarks]

    • URL

      http://www.ist.aichi-pu.ac.jp/~iribe/

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi