• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2006 Fiscal Year Annual Research Report

時期差・時間差・気分による音声変動の解明と分散型話者認識への応用に関する研究

Research Project

Project/Area Number 17300065
Research InstitutionThe University of Tokushima

Principal Investigator

黒岩 眞吾  徳島大学, 大学院ソシオテクノサイエンス研究部, 助教授 (20333510)

Co-Investigator(Kenkyū-buntansha) 北 研二  徳島大学, 高度情報化基盤センター, 教授 (10243734)
任 福継  徳島大学, 大学院ソシオテクノサイエンス研究部, 教授 (20264947)
柘植 覚  徳島大学, 大学院ソシオテクノサイエンス研究部, 講師 (00325250)
Keywords音声学 / 音声データベース / 話者認識 / 話者識別 / 話者照合 / 分散型話者認識 / 分散型話者照合 / 音声変動
Research Abstract

データベース収集に関わる研究開発、収集したデータの分析、分散型話者認識手法の研究開発を行った。研究項目毎の研究実績の概要を以下に示す。
(1)朝昼晩音声データの収集と音声データベースの構築
週1日、朝昼晩の3回、音素バランス文50文を4名の話者が簡易防音室内で発声した音声の収集を続けている。昨年度に開発したツールを用い、現在までに,女性1名、男性2名の3年分のデータについて、データベース化を終了した。
(2)時期差・時間差・気分による音声変化の分析
収集した音声データベースのうち,女性話者1名のデータを用い発声回毎に音響モデルを作成し音声認識実験を行うことで、時期差・時間差・気分等の要因が認識率に与える影響を調査した。血圧、体温、前日の睡眠時間、自己申告の気分等と認識率に「関係があるとはいえない」ことが明らかとなる一方で、発声速度が認識率に与える影響の大きいことが明らかとなった。
(3)分散型話者認識手法の研究開発
情報圧縮に頑健な話者認識手法としてEarth Mover's Distance(EMD)とベクトル量子化を統合したノンパラメトリックな話者認識手法が国際会議ISCSLP2007の話者識別コンテストの回線特性クローズ部門で1位の成績を修めた。また、多次元距離尺度EMDの高速化アルゴリズムを開発し、従来の10分の1程度の計算量を達成した。さらに、提案手法を話者照合に適用するための判別手法を考案し、従来型の閾値を用いる方法に比べ誤りを半減できることを確認した(ただし、計算量は膨大)。
(4)音声言語情報からの感性情報抽出法の研究開発
人間の感情を内的状態と外部刺激により確率的に表現する「心的状態遷移ネットワーク」の遷移確率学習法を考案し、アンケート調査に基づき心的状態遷移ネットワークを構築した。また、感情別テキストコーパスを用いた感情推定アルゴリズムを考案した。

  • Research Products

    (9 results)

All 2007 2006

All Journal Article (9 results)

  • [Journal Article] スペクトルの微細構造を考慮した風雑音除去手法2007

    • Author(s)
      黒岩 眞吾
    • Journal Title

      電子情報通信学会論文誌(A) J90-A・1

      Pages: 1-12

  • [Journal Article] 分散音声認識における実時間周波数特性正規化手法2007

    • Author(s)
      柘植 覚
    • Journal Title

      情報処理学会論文誌 48・2

      Pages: 900-908

  • [Journal Article] A Model of Mental state Transition Network2007

    • Author(s)
      Hua Xiang
    • Journal Title

      IEEJ Transactions on Electronics, Information and Systems 127-C・3

      Pages: 434-442

  • [Journal Article] Effects of Phoneme Type and Frequency on Distributed Speaker Identification and Verification2006

    • Author(s)
      Mohamed Abdel Fattah
    • Journal Title

      IEICE Transactions on Information and Systems E89・5

      Pages: 1712-1719

  • [Journal Article] A Mind Model for an Affective Computer2006

    • Author(s)
      Hua Xiang
    • Journal Title

      International Journal of Computer Science and Network Security 6・6

      Pages: 62-69

  • [Journal Article] A New Question Answering System for Chinese Restricted Domain2006

    • Author(s)
      Haiqing Hu
    • Journal Title

      IEICE Transactions on Information and Systems E89-D・6

      Pages: 1848-1859

  • [Journal Article] Non-Verbal Voice Emotion Analysis System2006

    • Author(s)
      Shunji Mitsuyoshi
    • Journal Title

      International Journal of Innovative Computing, Information and Control 2・4

      Pages: 819-830

  • [Journal Article] The Emotion Recognition through classification with the Support Vector Machines2006

    • Author(s)
      Zhi Teng
    • Journal Title

      WSEAS Transactions on COMPUTERS 5・9

      Pages: 2008-2013

  • [Journal Article] The Validity of Metaphor in Emotion Recognizing Model2006

    • Author(s)
      Yu Zhang
    • Journal Title

      WSEAS Transactions on COMPUTERS 5・9

      Pages: 2049-2055

URL: 

Published: 2008-05-08   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi