• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

韻律と声質を考慮した発話スタイルの検出機構の構築と実環境への適用

Research Project

Project/Area Number 18680020
Research Category

Grant-in-Aid for Young Scientists (A)

Allocation TypeSingle-year Grants
Research Field Perception information processing/Intelligent robotics
Research InstitutionAdvanced Telecommunications Research Institute International

Principal Investigator

石井 カルロス寿憲  Advanced Telecommunications Research Institute International, 知能ロボティクス研究所, 研究員 (30418529)

Project Period (FY) 2006 – 2007
Project Status Completed (Fiscal Year 2007)
Budget Amount *help
¥17,810,000 (Direct Cost: ¥13,700,000、Indirect Cost: ¥4,110,000)
Fiscal Year 2007: ¥7,930,000 (Direct Cost: ¥6,100,000、Indirect Cost: ¥1,830,000)
Fiscal Year 2006: ¥9,880,000 (Direct Cost: ¥7,600,000、Indirect Cost: ¥2,280,000)
Keywords韻律 / 声質 / パラ言語情報 / EGG / りきみ
Research Abstract

音声には,言葉の系列として表現される言語情報と,発話スタイル(言い方の違い)によって表現される意図、態度、感情などのパラ言語情報が含まれる。これまでのパラ言語情報の抽出に関する多くの研究は,韻律特徴を重視して来たが,自然発話音声では,気息性や非周期性などを含んだ声質が現れやすく,韻律情報以外に,より高度な音声理解を求めるためには声質情報を考慮することが重要となる。本研究ではさまざまなパラ言語情報を抽出することを目標とし,韻律と声質の特徴を考慮した発話スタイルの検出機構の構築を行った。また,実環境への応用の問題点を解決するために,マイクと話者が離れた状況でも発話スタイルが正しく検出される機構の実現を目指している。
本年度では,声質の音響特徴の改善を行い,韻律と声質特徴の組み合わせで,「え」や「うん」のような非語彙的発話において,伝達される発話意図を識別するシステムを実現した。主な結果としては,韻律特徴は「肯定、相槌」,「聞き返し」,「考え中、戸惑い」など,意図を表現したカテゴリを識別するのに有効である一方,声質特徴は「驚き、意外」,「疑い、非難、嫌悪」,「感心」など感情や態度を表現したカテゴリを認識するのに有効であることが分かった。声質特徴に関しては,声帯の振動を測定したEGG(Electro-Glottograph)波形を用いて,声質との関連を調べ,声帯振動の生成の観点からりきみ発声の定義も提案した。また,マイクロホンアレイ処理をロボットに実装し,音声認識への評価を行いつつ,韻律や声質特徴への効果を調べた。

Report

(2 results)
  • 2007 Annual Research Report
  • 2006 Annual Research Report
  • Research Products

    (7 results)

All 2008 2007 2006

All Journal Article (6 results) (of which Peer Reviewed: 3 results) Presentation (1 results)

  • [Journal Article] A method for automatic detection of vocal fry2008

    • Author(s)
      Ishi, C.T., Sakakibara, K-I., Ishiguro, H., Hagita, N.
    • Journal Title

      IEEE Transactions on Audio, Speech and Langu age Processing 16(1)

      Pages: 47-56

    • Related Report
      2007 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Automatic extraction of paralinguistic information using prosodic features related to FO, duration and voice quality2008

    • Author(s)
      Ishi, C.T., Ishiguro, H., Hagita, N.
    • Journal Title

      Speech Communication 50(6)

    • Related Report
      2007 Annual Research Report
    • Peer Reviewed
  • [Journal Article] A robust speech recognition system for communication robots in noisy environments2008

    • Author(s)
      Ishi, C.T., et.al.
    • Journal Title

      IEEE Transactions on Robotics In press

    • Related Report
      2007 Annual Research Report
    • Peer Reviewed
  • [Journal Article] りきみの自動検出のための音響分析2006

    • Author(s)
      石井カルロス寿憲
    • Journal Title

      電子情報通信学会技術研究報告 106・178

      Pages: 1-6

    • NAID

      40020287838

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Vocal Fry発声の自動検出法2006

    • Author(s)
      石井カルロス寿憲
    • Journal Title

      電子情報通信学会論文誌D J89-D・12

      Pages: 2679-2687

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Acoustic analysis of pressed voice2006

    • Author(s)
      Carlos T. Ishi
    • Journal Title

      J. Acoust,. Soc, Am. (Proc. Fourth Joint Meeting : ASA and ASJ) 120・5

      Pages: 3374-3374

    • Related Report
      2006 Annual Research Report
  • [Presentation] Acoustic analysis of pressed phonation2007

    • Author(s)
      Ishi, Carlos T.
    • Organizer
      International Conference on Phonetic Sciences 2007
    • Place of Presentation
      Saarbrucken, Germany
    • Year and Date
      2007-08-07
    • Related Report
      2007 Annual Research Report

URL: 

Published: 2006-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi