• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

長期間収録音声コーパスに基づく話者内音声変動に頑健な話者認識手法の研究

Research Project

Project/Area Number 21300060
Research InstitutionChiba University

Principal Investigator

黒岩 眞吾  千葉大学, 大学院・融合科学研究科, 教授 (20333510)

Co-Investigator(Kenkyū-buntansha) 柘植 覚  大同大学, 情報学部, 准教授 (00325250)
長内 隆  科学警察研究所, 法科学第四部, 室長 (70392264)
篠崎 隆宏  千葉大学, 大学院・融合科学研究科, 助教 (80447903)
Keywords音声学 / 話者認識 / 話者識別 / 話者照合 / 音声認証 / 話者内変 / 音声データベース / 順位統計量
Research Abstract

音声コーパスの収集、既存の話者認識手法のツール化、及び新しい話者認識手法の研究を実施した。項目毎の研究実績を以下に示す。
(1A)多数話者長期間音声コーパスの構築:60名の話者が、約1か月ごとに延べ4回(1回あたりの発声時間4分)の発声を話者の家庭内で行ったデータを収集した。
(1B)少数話者の長・短期間音声コーパスの構築:話者1名の毎週1日、朝・昼・夕の音声収録を実施した。また、1話者1年分の音声データを外注によりファイリングを行い、『AWA長期間収録音声コーパス』として、国立情報学研究所より公開するための準備を進めた(2012年4月公開予定)
(2)話者認識手法の評価と体系化:GMM-SuperVector(SV)法による話者照合環境の構築及び話者照合実験を行い、登録音声が約30秒以上あれば、従来のベースライン(UBM-MAP)よりも高い性能となることを確認した。これにより、今後の検討において、ベースラインはUBM-MAP及びGMM-SV法の2つを準備することとした。
(3)話者性の抽出及び話者内変動のモデル化:『AWA長期間収録音声コーパス』から主成分分析により、話者の時期差成分を抽出する手法について実験結果をまとめ雑誌論文とした。一方で、音韻による時期差変動の違いが明らかになったため、非線形手法の検討を開始した。
(4)計算量にとらわれない高精度かつ頑健な新しい話者認識手法の検討: 順位統計量を用いた頑健な話者照合手法の実験結果をまとめ雑誌論文とした。さらに、限られた人数の話者から未知の話者のモデルを構築する疑似話者モデル構築手法及びそれに基づく話者照合手法(順位統計量を利用)を提案し、実験を進めている。
(5)法科学における話者照合の有効性の検討:法化学分野ではテキスト依存型話者認識が利用できる場面が多いことから、携帯電話音声を対象に発話内容と話者照合性能の関係を明らかにした。また、グローバル犯罪に対応していくため、日本語非母語話者の特徴を分析すると共に識別に有効なパラメータを検討した。その結果、FOパタンが有効であることが判明し、話者照合への導入も検討することとした。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

音声データの収集は順調に進んでいるが、収集したデータのコーパス化において、自動切り出しによるエラーが問題となることから人手による切り出し・確認作業を行うこととしたため、コーパスの構築にやや遅延が生じている。その他の話者認識手法の評価と体系化、話者性の抽出及び話者内変動のモデル化、計算量にとらわれない高精度かつ頑健な新しい話者認識手法の検討、及び、法科学における話者照合の有効性の検討については順調に進展している。以上のことから、本研究は「おおむね順調に進展している」と判断できる。

Strategy for Future Research Activity

長期間収録音声コーパスの一部である『AWA長期間収録音声コーパス』(1年分のデータ)を4月に公開すると共に、ホームページを作成し利用者からの要望・意見を収集する。なお、人手による音声データの聞き直し・ファイリング作業には本研究課題の予算では賄いきれないため、「研究成果公開促進費」等の応募・活用を進めて行く。音声収録や話者認識手法の評価・体系化は昨年同様に進めて行く。また、話者性の抽出及び話者内変動のモデル化、計算量にとらわれない高精度かつ頑健な新しい話者認識手法の検討、法科学における話者照合の有効性の検討については、各々成果が上がっているため、今後、各々の研究で得られた知見・技術を統合し話者内変動に頑健な話者認識手法の確立を目指す。さらに、残響やサイン音などの混入に対し頑健な手法も検討していく。

  • Research Products

    (15 results)

All 2012 2011

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (13 results)

  • [Journal Article] Text-Independent Speaker Identification Based on Reducing Inter-Session Variability of Speech Feature Using PCA Transformation2011

    • Author(s)
      Wenbin Zhang, Haoze Lu, Yasuo Horiuchi, Satoru Tsuge, Kenji Kita, Shingo Kuroiwa
    • Journal Title

      Journal of Signal Processing

      Volume: Vol.15, No.4 Pages: 275-278

    • Peer Reviewed
  • [Journal Article] 順位統計量を用いたテキスト独立型話者照合手法2011

    • Author(s)
      岡本悠, 柘植覚, 堀内靖雄, 黒岩眞吾
    • Journal Title

      電子情報通信学会論文誌D

      Volume: J49-D Pages: 1551-1560

    • Peer Reviewed
  • [Presentation] 日本語母語話者・非母語話者による読み上げ文章における調音速度2012

    • Author(s)
      網野加苗, 長内隆
    • Organizer
      日本音響学会 2012年秋季研究発表会
    • Place of Presentation
      横浜市
    • Year and Date
      2012-03-13
  • [Presentation] Acoustic Model Selection Method for Speaker Dependent Speech Recognition2012

    • Author(s)
      Kentaro Mori, Satoru Tsuge, Shingo Kuroiwa, Momoyo Ito, Koji Kashihara, Minoru Fukumi
    • Organizer
      RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing
    • Place of Presentation
      米国、ハワイ州、ホノルル
    • Year and Date
      2012-03-04
  • [Presentation] Pseudo Speaker Models for Text-Independent Speaker Verification Using Rank Threshold2011

    • Author(s)
      Shiori Takenaka, Takahiro Shinozaki, Yasuo Horiuchi, Shingo Kuroiwa
    • Organizer
      7th IEEE Conference on Natural Language Processing and Knowledge Engineering
    • Place of Presentation
      徳島市
    • Year and Date
      2011-11-29
  • [Presentation] 時期差に頑健な話者識別手法2011

    • Author(s)
      張文彬, 陸臭澤, 篠崎隆宏, 堀内靖雄, 黒岩眞吾
    • Organizer
      第1回バイオメトリクスと認識・認証シンポジウム
    • Place of Presentation
      東京
    • Year and Date
      2011-11-23
  • [Presentation] 電話番号読み上げ音声を用いた母語・非母語音声識別2011

    • Author(s)
      網野加苗, 長内隆
    • Organizer
      日本法科学技術学会 第17回学術集会
    • Place of Presentation
      東京
    • Year and Date
      2011-11-18
  • [Presentation] 単音節の子音と母音を用いた話者認識性能の比較2011

    • Author(s)
      長内隆, 網野加苗, 鎌田敏明, 蒔苗久則
    • Organizer
      日本法科学技術学会 第17回学術集会
    • Place of Presentation
      東京
    • Year and Date
      2011-11-18
  • [Presentation] 構内アナウンス環境下における音声認識のための音声区間検出2011

    • Author(s)
      紺野遼輔, 篠崎隆宏, 堀内靖雄, 黒岩眞吾
    • Organizer
      音響学会2011年秋季研究発表会
    • Place of Presentation
      松江市
    • Year and Date
      2011-09-22
  • [Presentation] 日本語の電話番号を用いた母語・非母語音声識別2011

    • Author(s)
      網野加苗, 長内隆
    • Organizer
      日本音響学会 2011年秋季研究発表会
    • Place of Presentation
      松江市
    • Year and Date
      2011-09-22
  • [Presentation] テキスト依存型話者照合における発話内容と話者照合性能2011

    • Author(s)
      長内隆, 網野加苗, 鎌田敏明, 蒔苗久則
    • Organizer
      日本音響学会 2011年秋季研究発表会
    • Place of Presentation
      松江市
    • Year and Date
      2011-09-21
  • [Presentation] Personal Identification Method using Footsteps2011

    • Author(s)
      Masato Miyoshi, Mori Kentaro, Kashihara Yasunori, Nakao Masafumi, Satoru Tsuge, Minoru Fukumi
    • Organizer
      SICE Annual Conference 2011
    • Place of Presentation
      東京
    • Year and Date
      2011-09-16
  • [Presentation] Realisation of the prosodic structure of spoken telephone numbers by native and non-native speakers of Japanese2011

    • Author(s)
      Kanae Amino, Takashi Osanai
    • Organizer
      17th International Congress of Phonetic Sciences
    • Place of Presentation
      香港
    • Year and Date
      2011-08-18
  • [Presentation] Feature Selection Method for Music Mood Score Detection2011

    • Author(s)
      Masato Miyoshi, Satoru Tsuge, Tadahiro Oyama, Momoyo Ito, Minoru Fukumi
    • Organizer
      5^<th> International conference on modeling, simulation and applied optimization (ICMSA2011)
    • Place of Presentation
      マレーシア、クアラルンプール
    • Year and Date
      2011-04-20
  • [Presentation] AWA長期間収録音声コーパスと時期差の分析2011

    • Author(s)
      黒岩眞吾, 柘植覚, 張文彬, 篠崎隆宏, 堀内靖雄
    • Organizer
      音響学会2012年春季研究発表会
    • Place of Presentation
      横浜市
    • Year and Date
      2011-03-15

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi