• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Research-status Report

音声ドキュメント内の検索とフィードバックに基づく高度なインデキシング機能の実現

Research Project

Project/Area Number 25330128
Research Category

Grant-in-Aid for Scientific Research (C)

Research InstitutionShizuoka University

Principal Investigator

甲斐 充彦  静岡大学, 工学(系)研究科(研究院), 准教授 (60283496)

Co-Investigator(Kenkyū-buntansha) 王 龍標  長岡技術科学大学, 学内共同利用施設等, 准教授 (30510458)
Project Period (FY) 2013-04-01 – 2016-03-31
Keywords音声ドキュメント検索 / 音声検索語検出 / STD / VAD / 話者認識 / 雑音残響環境 / 信頼度
Research Abstract

音声ドキュメントに対して、要求される情報検索の目的や精度に応じてインデキシングを効果的に進めるためのコンテンツ化支援システムの実現を目的として、基盤となる検索システムの要素技術の開発と改良を進めた。第一に、多様な音声収録環境が含まれる音声ドキュメント集合の高精度なインデキシングを実現するため、音声ドキュメント集合を話者や環境などで自動分類する手法の開発を目的として、雑音環境下音声における音声区間検出(VAD)や話者分類の性能改善を図った。まず、音声特徴抽出と識別器設計において、近年パターン認識等の分野で注目されているDeep Belief Network(DBN)の手法を利用した方法を提案し、雑音下音声のVAD性能評価において従来手法に比べて有効性を示した。更に、話者ダイアライゼーションへの応用も想定して、遠隔音声に対して話者の違いの特徴を頑健に抽出するためDBNのボトルネック特徴量を用いる方法を提案し、遠隔音声の話者認識のタスクにおいて従来手法と比べて性能を大きく改善することを示した。第二に、インデックス信頼度評価手法の開発に関連して、大語彙音声認識システムから得られる単語グラフ出力情報を用いて推定された検索語の候補区間の信頼度を用いて検索候補を絞り込み、以前に提案している音声検索語検出手法と併用する方法を提案し、従来手法に対して検索性能の改善を示した。更に、音声クエリを用いた音声検索語検出の予備的な評価においても、提案手法が検索性能を改善できることを示した。第三に、韻律・音響特徴パターンによるインデキシングの拡張技術の開発のための予備調査として、大規模な講演音声コーパスを用いて検索対象となりやすい検索フレーズ部分を対象として、信頼度および認識精度と韻律特徴との関係分析を行った。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

話者・環境クラスタリング手法の基盤となるVADや話者特徴抽出手法を改善する方法を開発して成果を示したが、これらをもとにした話者ダイアライゼーションの評価実験や改良は現在進行中である。

Strategy for Future Research Activity

これまでに基盤となる検索システムの要素技術の開発と改良の多くはおおよそ計画通りに進んでおり、やや遅れている話者ダイアライゼーションの評価実験も準備が進みつつある。今後、予定しているように話者ダイアライゼーションの評価実験と併せてインデックス信頼度評価手法の開発を進め、様々な雑音・残響下音声のデータベースによる評価実験も進めていく。

  • Research Products

    (6 results)

All 2013 Other

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (4 results)

  • [Journal Article] Using Acoustic Dissimilarity Measures Based on State-Level Distance Vector Representation for Improved Spoken Term Detection2013

    • Author(s)
      Naoki Yamamoto, Atsuhiko Kai
    • Journal Title

      Proc. of APSIPA Annual Summit and Conference 2013

      Volume: - Pages: -

    • DOI

      10.1109/APSIPA.2013.6694151

    • Peer Reviewed
  • [Journal Article] Improvement of distant-talking speaker identification using bottleneck features of DNN2013

    • Author(s)
      Takanori Yamada, Longbiao Wang, Atsuhiko Kai
    • Journal Title

      Proc. of INTERSPEECH 2013

      Volume: - Pages: 3661-3664

    • Peer Reviewed
  • [Presentation] Spoken Term Detection Using Distance-Vector based Dissimilarity Measures and Its Evaluation on the NTCIR-10 SpokenDoc-2 Task

    • Author(s)
      Naoki Yamamoto, Atsuhiko Kai
    • Organizer
      The 10th NTCIR Conference
    • Place of Presentation
      学術総合センター(東京)
  • [Presentation] 雑音に頑健な音声区間検出のためのDeep Belief Networkの適用

    • Author(s)
      中谷彰宏, 王 龍標, 甲斐充彦
    • Organizer
      日本音響学会2013年秋季研究発表会
    • Place of Presentation
      豊橋技術科学大学(愛知)
  • [Presentation] 分布間距離ベクトルに基づく音響的類似度とサブワード事後確率の併用による音声検索語検出の改善

    • Author(s)
      山本 直樹, 甲斐 充彦
    • Organizer
      情報処理学会音声言語情報処理研究会
    • Place of Presentation
      筑波大学文京キャンパス(東京)
  • [Presentation] 分布間距離ベクトル表現による音響的類似度を利用したテキスト及び音声クエリからの音声検索語検出の改善

    • Author(s)
      牧野光晃, 山本直樹, 甲斐充彦
    • Organizer
      第8回音声ドキュメント処理ワークショップ
    • Place of Presentation
      豊橋市民センター(愛知)

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi