2011 Fiscal Year Annual Research Report
音声処理と言語処理の融合に基づく大規模音声ドキュメントの内容検索
Project/Area Number |
22500090
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
秋葉 友良 豊橋技術科学大学, 大学院・工学研究科, 准教授 (00356346)
|
Co-Investigator(Kenkyū-buntansha) |
中川 聖一 豊橋技術科学大学, 大学院・工学研究科, 教授 (20115893)
|
Keywords | 音声ドキュメント / 検索 / 音声検索語検出 / 索引付け / パッセージ検索 / 音声認識 / クエリ拡張 / 認識誤り対策 |
Research Abstract |
音声ドキュメントを対象とした検索について、検索語が音声データ中のどこに現れたかを検出する検索語検出タスク(Spoken Term Detection)と、検索要求に合致する音声区間を特定する音声内容検索タスク(Spoken Document Retrieval)の2つの問題を設定し、それぞれ手法の開発を進めるとともに、両者の統合手法を検討した。 検索語検出タスクについて、開発したMetric Subspace Indexing法の性能向上と効率化を行った。予備実験により、これまでの単純な実装では正しい検出より先に誤検出が起り易いことが明らかになった。そのため、厳密に距離順に検出結果を出力するアルゴリズムを実装し、検出性能の大幅な向上を達成した。また、実装した厳密アルゴリズムを効率化するため、近似的に距離順に出力するアルゴリズムを実装し、性能を落とすこと無く従来の単純アルゴリズムに匹敵する高速化を達成できた。また、音声認識誤りの影響を抑えるための代替距離尺度や継続時間情報を導入する手法を導入し、高再現率領域での検出性能を改善した。 音声内容検索タスクについては、文書の一部にアクセスすることを可能にするパッセージ検索手法を拡張し、可変長の区間をそのまま検索する手法の開発を行った。また、音声認識誤の辞書未登録語や音声認識誤りによる検索性能の劣化を直接扱うために、音声検索語検出手法を内容検索システムに組み込む統合手法を開発した。本手法は、検索トピック中の語それぞれに対し検索語検出を行い、その結果の統計量を内容検索に用いることで、未登録語や認識誤りの影響を受けにくいことが特徴である。評価実験により、未登録語に頑健な本手法の利点を確認した。また、本手法の検索語検出の高速化を行い、本枠粗みに文書拡張手法を適用するための準備を進めた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初予定の音声検索語検出と音声内容検索、それぞれの基本技術開発はほぼ完了した。音声検索語検出の新しい手法であるMetric Subspace Indexing法のツール化も行った。両者の統合手法についても、その効果を実験的に確認している。
|
Strategy for Future Research Activity |
当初の予定通り、音声検索語検出と音声内容検索の統合システムの構築を進める。統合手法に用いる音声検索語検出の高速化を進めて、本枠組みへのクエリ拡張手法の導入を行う。また、新しい音声検索語検出手法であるMetric Subspace Indexing法の開発が順調に進んだため、統合手法の音声検索語検出法をこの新手法で置き換えることも検討する。これにより、本手法の距離順に検出結果を高速に出力するという特徴を活かした応用分野の検討を行う。
|
-
-
-
[Presentation] NTCIR-9総括と今後の展望2012
Author(s)
酒井哲也, 上保秀夫, 神門典子, 加藤恒昭, 相澤彰子, 秋葉友良, 後藤功雄, 木村文則, 三田村照子, 西崎博光, 嶋秀樹, 吉岡真治, Shlomo Geva, Ling-Xiang Tang, Andrew Trotman, Yue Xu
Organizer
第106回情報基礎とアクセス技術研究会
Place of Presentation
白百合女子大学(東京都)
Year and Date
2012-03-26
-
-
-
-
-
-
-
-
-
-
-