• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Annual Research Report

大規模音声ドキュメントを対象とする超高速検索エンジンの構築

Research Project

Project/Area Number 22300060
Research InstitutionWaseda University

Principal Investigator

新田 恒雄  早稲田大学, グリーンコンピューティングシステム研究機構, 教授 (70314101)

Project Period (FY) 2010-04-01 – 2013-03-31
Keywords音声ドキュメント検索 / 大規模音声ドキュメント / 高速検索 / 高精度音素認識 / 調音特徴
Research Abstract

音声-音素変換精度改良と音声ドキュメント高速検索システム評価を行った。
(1)音声-音素高精度変換器の開発では,未知語に対する検索性能を保証するため,調音特徴ベースのサブワード音声認識エンジンを開発した。(a)では,高精度調音特徴抽出器(2段のMLNから構成)の組み込み,(b)では調音運動ベース音素認識HMMの最適設計(状態数,コンテキスト,IPによる湧出し制御他),(c)では約1,200種の日本語全短・長音節に対する言語モデル(tri-gram)の組み込みに注力した。また,抽出器に音素毎の固有ベクトルを反映した部分空間を組込む方式を評価し性能向上を確認した。調音特徴入力に最適化したHMM音響モデルを開発し,実時間音素認識エンジンを開発した。
(2) キーワード高速検索システムの構築では,放送大学の講義ビデオを対象に,講義毎に設定したキーワードを検索するシステムを構築し評価した。評価では,講義音声から人手で書き下したデータを作成し,任意キーワードを1秒以内の実時間で高精度(目標F値0.7)に検索可能なことを確認した。

Current Status of Research Progress
Reason

25年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

25年度が最終年度であるため、記入しない。

  • Research Products

    (6 results)

All 2013

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (4 results)

  • [Journal Article] Suffix Arrayを用いた高速音声検索語検出システムの性能評価2013

    • Author(s)
      桂田浩一,勝浦広大,入部百合絵,新田恒雄
    • Journal Title

      電子情報通信学会論文誌

      Volume: Vol.J96-D,No.10 Pages: 2540-2548

    • Peer Reviewed
  • [Journal Article] 調音特徴―声道音響パラメータ変換を用いた調音特徴運動HMM音声合成2013

    • Author(s)
      木村優志,入部百合絵,桂田浩一,新田恒雄
    • Journal Title

      電子情報通信学会論文誌

      Volume: Vol.J96-D,No.5 Pages: 1356-1364

    • Peer Reviewed
  • [Presentation] Acceleration of Spoken Term Detection Using a Suffix Array by Assigning Optimal Threshold Values to Sub-Keywords2013

    • Author(s)
      Kouichi Katsurada, Seiichi Miura, Kheang Seng, Yurie Iribe and Tsuneo Nitta
    • Organizer
      Proc. of InterSpeech 2013, pp.11-14 (2013-8).
    • Place of Presentation
      Lyon, France
    • Year and Date
      20130825-20130829
  • [Presentation] Introducing Articulatory Ancho-point to ANN Training for Corrective Learning of Pronunciation2013

    • Author(s)
      Yurie Iribe, Silasak Manosavanh, Kouichi Katsurada, Ryoko Hayashi, Chunyue Zhu, and Tsuneo Nitta
    • Organizer
      Proc of. ICASSP2013
    • Place of Presentation
      Vancouver, Canada
    • Year and Date
      20130526-20130531
  • [Presentation] 双対空間における調音特徴抽出の検討2013

    • Author(s)
      佐々木俊,入部百合絵,桂田浩一,新田恒雄
    • Organizer
      日本音響学会2013年春季研究発表会
    • Place of Presentation
      東京工科大学
    • Year and Date
      20130313-20130315
  • [Presentation] 調音運動音響モデルと長短音節言語モデルを用いた音素認識エンジン2013

    • Author(s)
      遠藤基,入部百合絵,桂田浩一,新田恒雄
    • Organizer
      日本音響学会2013年春季研究発表会
    • Place of Presentation
      東京工科大学
    • Year and Date
      20130313-20130315

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi