• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

動的な話者適応性を考慮した統一的な音声知覚モデルの研究

Research Project

Project/Area Number 21700282
Research InstitutionTohoku University

Principal Investigator

伊藤 仁  Tohoku University, 大学院・工学研究科, 助教 (00436164)

Keywords音声学 / 認知科学
Research Abstract

フォルマントモデルとスペクトル全体形状モデルを包含する統一的な意声知覚モデルを構築するために,フォルマントピークとスペクトル傾きを操作した合成母音を用いて知覚実験を行った.この結果を,国際学会(Interspeech2009)と国内学会(日本音響学会2010年3月)で発表し,上述した既存の二種類のモデルでは十分に説明できない知覚現象が存在することを示した.この結果に基づいて,音声信号から知覚される音韻性を決定する計算モデルの構築を試みた.一次聴神経における音声の表現として興奮パタンを採用し,このパタンの局所的な形状を2次元のCOS展開で評価することにより,知覚実験の結果が単純なターゲットモデルで説明できる可能性があることを明らかにした.このモデルは,対立する既存の二つのモデルを矛盾なく統合できる点に価値があり,2010年3月の日本音響学会で発表した際には,多くの研究者から高い評価が得られた.また,提案モデルの弱点として指摘されていた,音声の指向特性によるスペクトル形状の変化の問題に関しては,定量的な音響測定実験を行い,少なくとも通常の発話環境では指向特性の影響は十分に小さいことを確認した.この結果は2009年9月の日本音響学会で発表している.また,提案モデルを不特定話者に拡張するために,発話時の話者の声道伝達特性を高い精度で推定する必要があり,これを実現するために正弦波モデルに基づく新たな音響分析手法を提案した.この手法は2010年3月にAcoustical Science and Technology誌に掲載された.

  • Research Products

    (5 results)

All 2010 2009

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (4 results)

  • [Journal Article] Source-filter separation for nonstationary voiced speech based on sinusoidal representation2010

    • Author(s)
      Masashi Ito, Keiji Ohara, Akinori Ito, Masafumi Yano
    • Journal Title

      Acoustical Science and Technology 31(2)

      Pages: 181-184

    • Peer Reviewed
  • [Presentation] フォルマントとスペクトル全体形状を統合した母音知覚モデルの検討2010

    • Author(s)
      伊藤仁, 小原桂二, 伊藤彰則, 矢野雅文
    • Organizer
      日本音響学会2010年春季研究発表会
    • Place of Presentation
      調布
    • Year and Date
      2010-03-08
  • [Presentation] フォルマントピークとスペクトル傾きが母音知覚に及ぼす影響2010

    • Author(s)
      小原桂二, 伊藤仁, 矢野雅文
    • Organizer
      日本音響学会2010年春季研究発表会
    • Place of Presentation
      調布
    • Year and Date
      2010-03-08
  • [Presentation] マイクロホンアレイを用いた音声の指向特性の計測2009

    • Author(s)
      伊藤仁, 伊藤彰則, 矢野雅文
    • Organizer
      日本音響学会2010年秋季研究発表会
    • Place of Presentation
      郡山
    • Year and Date
      2009-09-15
  • [Presentation] Relative importance of formant and whole-spectral cues for vowel perception2009

    • Author(s)
      伊藤仁, 小原桂二, 伊藤彰則, 矢野雅文
    • Organizer
      Interspeech 2009
    • Place of Presentation
      Brighton(UK)
    • Year and Date
      2009-09-06

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi