• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

人間による音声情報処理過程の分析とそれを応用した音声対話インターフェイスの構築

Research Project

Project/Area Number 16016219
Research Category

Grant-in-Aid for Scientific Research on Priority Areas

Allocation TypeSingle-year Grants
Review Section Science and Engineering
Research InstitutionThe University of Tokyo

Principal Investigator

峯松 信明  東京大学, 大学院・新領域創成科学研究科, 助教授 (90273333)

Co-Investigator(Kenkyū-buntansha) 広瀬 啓吉  東京大学, 大学院・情報理工学系研究科, 教授 (50111472)
Project Period (FY) 2004 – 2005
Project Status Completed (Fiscal Year 2005)
Budget Amount *help
¥11,600,000 (Direct Cost: ¥11,600,000)
Fiscal Year 2005: ¥6,000,000 (Direct Cost: ¥6,000,000)
Fiscal Year 2004: ¥5,600,000 (Direct Cost: ¥5,600,000)
Keywords構造不変の定理 / 音響的普遍構造 / 構造音韻論 / 聴覚生理学 / 音的差異 / 音声インターフェイス / 音声対話システム / ゲシュタルト / パラ言語情 / 構造サイズ / 韻律的特徴
Research Abstract

音声によって伝搬される情報は,言語情報,パラ言語情報,非言語情報に分類される。従来の音声情報処理パラダイムでは,まずパラ言語情報を音声の物理現象から分離し,言語情報+非言語情報となった音声に対して,非言語情報の和をとることで(即ち,数千,数万という話者の音声を集めることで)言語情報を抽出する,という方法論を構築してきた。聴覚生理学,脳科学の知見によれば,言語情報と非言語情報は分離して脳で処理されているとのモデルが提案されている。即ち「集めること」なく,両者を分離できる,ということである。本研究では,音声の物理現象から話者,音響機器特性などの静的な非言語情報を分離する枠組みを,脳科学の知見を考慮しつつ提案した。その応用として,一人の話者の音声を用いた不特定話者音声認識や,感情・意図といったパラ言語情報の高精度抽出を実現した。ケプストラムの時系列として表現される音声スペクトルを分布系列へと変換し,任意の二分布間距離と求める。この時,非ユークリッド空間における分布間距離を採用する(バタチャリヤ距離)と,非言語的特徴を表現する数学モデルであるアフィン変換に対して,分布間距離は不変となる。全ての二分布間距離を求めることは,全分布で張られる幾何学構造を規定することに等しいが,距離不変は構造不変の性質をもたらす。これは,構造音韻論と呼ばれる言語学の一分野を数学的,物理学的に解釈することに成功したことを意味する。音的差異(コントラスト)のみに着眼して音声を構造的に表象する方法論に基づいて,音声認識,及び感情・意図推定を検討した。前者については,孤立母音系列という非常に限られたタスクではあるが,四千人以上の音声データを用いた音響モデルよりも高い精度を示し,後者においても,ピッチに関する情報を付与することで従来方法と比較して,より精度の高い方法を実現した。

Report

(2 results)
  • 2005 Annual Research Report
  • 2004 Annual Research Report
  • Research Products

    (11 results)

All 2006 2005 2004

All Journal Article (11 results)

  • [Journal Article] 音声の構造的表象と音声の相対音感2006

    • Author(s)
      峯松信明, 西村多寿子, 櫻庭京子
    • Journal Title

      音響学会春期講演論文集 1-P-17

      Pages: 177-178

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Mathematical evidence of the acoustic universal structure in speech2005

    • Author(s)
      N.Minematsu
    • Journal Title

      Proc.ICASSP

      Pages: 889-992

    • Related Report
      2005 Annual Research Report 2004 Annual Research Report
  • [Journal Article] Japanese vowel recognition based on structural representation of speech2005

    • Author(s)
      T.Murakami, K.Maruyama, N.Minematsu, K.Hirose
    • Journal Title

      Proc.EUROSPEECH

      Pages: 1261-1264

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Japanese vowel recognition using external structure of speech2005

    • Author(s)
      T.Murakami, K.Maruayma, N.Minematsu, K.Hirose
    • Journal Title

      Proc.ASRU

      Pages: 203-208

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 構造不変の定理とそれに基づく音声ゲシュタルトの導出2005

    • Author(s)
      峯松信明, 西村多寿子, 西成活広裕, 櫻庭京子
    • Journal Title

      電子情報通信学会音声研究会資料 SP2005-12

      Pages: 1-8

    • NAID

      10016435675

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 音声の相対音感〜音声と音楽の同質性に関する一考察〜2005

    • Author(s)
      峯松信明, 西村多寿子
    • Journal Title

      電子情報通信学会音声研究会資料 SP2005-131

      Pages: 121-126

    • NAID

      110003486932

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 音声の音響的普遍構造に着眼したパラ・非言語情報推定に関する実験的検討2005

    • Author(s)
      藤野, 峯松, 広瀬
    • Journal Title

      日本音響学会春季講演論文集

      Pages: 59-60

    • NAID

      10018037084

    • Related Report
      2004 Annual Research Report
  • [Journal Article] 構造不変の定理に基づく音声の構造的表象とその距離尺度2005

    • Author(s)
      峯松他5人
    • Journal Title

      日本音響学会春季講演論文集

      Pages: 25-26

    • NAID

      10018036994

    • Related Report
      2004 Annual Research Report
  • [Journal Article] 音声の構造的表象に基づく音響的照合に関する実験的検討2005

    • Author(s)
      丸山, 村上, 峯松, 広瀬
    • Journal Title

      日本音響学会春季講演論文集

      Pages: 27-28

    • NAID

      10018037004

    • Related Report
      2004 Annual Research Report
  • [Journal Article] The acoustic universal structure in speech and its correlation to para-linguistic information in speech2004

    • Author(s)
      N.Minematsu et al.
    • Journal Title

      Proc.Int.Workshop on Man-machine Symbiotic Systems

      Pages: 69-79

    • Related Report
      2004 Annual Research Report
  • [Journal Article] 構造音韻論の物理実装に基づく新しい音声の音響的表象2004

    • Author(s)
      峯松, 松井, 広瀬
    • Journal Title

      電子情報通信学会音声研究会SP2004-27

      Pages: 47-52

    • NAID

      110003295854

    • Related Report
      2004 Annual Research Report

URL: 

Published: 2004-04-01   Modified: 2018-03-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi