2012 Fiscal Year Annual Research Report
音声処理と言語処理の融合に基づく大規模音声ドキュメントの内容検索
Project/Area Number |
22500090
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
秋葉 友良 豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (00356346)
|
Co-Investigator(Kenkyū-buntansha) |
中川 聖一 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (20115893)
|
Project Period (FY) |
2010-04-01 – 2013-03-31
|
Keywords | 情報検索 / 音声ドキュメント処理 / 音声ドキュメント検索 / 音声中の検索語検出 / 音声内容検索 |
Research Abstract |
音声ドキュメントを対象とした検索について、(A)検索語が音声データ中のどこに現れたかを検出する検索語検出タスクと、(B)検索要求に合致する音声区間を特定する音声内容検索タスクの2つの手法の開発を進めるとともに、(C)両者の統合手法、を検討した。 (A)の音声検索語検出については、開発したMetric Subspace Indexing法に対し2つの方法で性能の向上を図った。第1に、これまでの音節系列を対象とした検出方法に対し、音節毎に継続時間長を考慮することによって検出性能を改善する手法を開発し、高再現率領域での性能改善を達成した。第2に、これまでの直線検出の枠組みに代えて、任意の挿入・脱落誤りを扱い可能なDynamic Time Warping法を導入し、距離順・高速な検出を保ちながら連続DPマッチング法と理論上検出性能を同じにする手法を開発した。 (B)の音声内容検索について、任意の可変長音声区間を適合区間として動的に決定する手法の検索手法を拡張し、検索質問拡張手法の一つである適合性モデルを導入して検索性能の向上を図った。また、認識誤りに対応するため、複数認識候補を対象とするようにテキスト検索手法を拡張した。 (C)の音声検索語検出と内容検索の統合について、提案法は未知語に頑健であるという性質を持つのに対し、従来法は既知語であれば高性能が期待できるという性質があるため、互いの相補的な性質を利用した両者の統合手法を開発し、未知語への頑健性と検索性能の向上を両立させた。また、音声検索語検出を前処理に用いることによって生じる偽陽性の問題に対応するために、認識結果の信頼度を利用した検索モデルを開発した。この手法は、単語に加えて単語の共起を素性としてベクトル空間法を適用するものである。この検索モデルにより、提案法だけではなく、従来法に適用した場合でも、検索性能が向上することを確認した。
|
Current Status of Research Progress |
Reason
24年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
24年度が最終年度であるため、記入しない。
|
-
-
[Journal Article] 音声中の検索語検出のためのテストコレクションの構築と分析2013
Author(s)
伊藤慶明,西崎博光,中川聖一,秋葉友良,河原達也,胡新輝,南條浩輝,松井知子,山下洋一,相川清明
-
Journal Title
情報処理学会論文誌
Volume: Vol.54,No.2
Pages: 471-483
Peer Reviewed
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-