2010 年度実績報告書

音声処理と言語処理の融合に基づく大規模音声ドキュメントの内容検索

研究課題

研究課題/領域番号	22500090
研究機関	豊橋技術科学大学
研究代表者	秋葉友良豊橋技術科学大学, 大学院・工学研究科, 准教授 (00356346)
研究分担者	中川聖一豊橋技術科学大学, 大学院・工学研究科, 教授 (20115893)
キーワード	音声ドキュメント / 検索 / Spoken Term Detection / 索引付け / 適合性モデル / パッセージ検索 / クエリ拡張 / 音声認識
研究概要	音声ドキュメントを対象とした検索について、検索語が音声データ中のどこに現れたかを検出る検索語検出タスク(Spoken Term Detection)と、検索要求に合致する音声区間を特定する音声内容検索タスク(Spoken Document Retrieval)の2つの問題を設定し、それぞれ手法の開発を進めた。検索語検出タスクについて、新しい索引付け手法であるMetric Subspace Indexing法を開発した。本手法は、画像中の直線検出手法であるハフ変換を検索語検出タスクに適用した方法である。オンライン処理を前提とした画像処理と異なり、音声ドキュメントを対象とする場合は検出処理前にドキュメントが既知であるために、オフラインでの効率的な索引付けができる点に着目し、高速な検出法を実現した。従来の索引付け法と異なり、尤もらしい候補順に結果を出力できる点、認識結果に現れる複数代替候補を直接扱うことができる点、が大きな特徴である。音声内容検索タスクについて、パッセージ検索手法の開発および言語モデルに基づく検索手法の適用を行った。音声認識結果に対する検索は、誤認識の影響を受けるため、検索クエリや対象文書を関連語で補完する手法が有効と考え、適合性モデルをパッセージ検索に適用した。また、Webの関連文書を利用するように適合性モデルの拡張を行った。また、2つのタスクを統合して音声ドキュメント検索を行うための予備調査を行った。統合手法は、まず検索クエリから検索語を抽出し、対象音声ドキュメントに対して音声検索語検出を行う。次に、この検出結果を語の出現と見て、文書検索を実行する。本手法を講演の検索タスクに適用したところ、高速なサブワード認識結果を使っているのにも係らず、従来の大語彙連続音声認識とテキスト検索を組み合わせる手法の検索性能を改善できることが分かった。

研究成果

(10件)

すべて 2011 2010

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (7件)

[雑誌論文] Metric Subspace Indexing for Fast Spoken Term Detection2010
- 著者名/発表者名
  Taisuke Kaneko, Tomoyosi Akiba
- 雑誌名
  
  Proceedings of International Conference on Speech Communication and Technology
  
  ページ: 689-692
- 査読あり
[雑誌論文] Constructing Japanese Test Collections for Spoken Term Detection2010
- 著者名/発表者名
  Yoshiaki Itoh, Hiromitsu Nishizaki, Xinhui Hu, Hiroaki Nanjo, Tomoyosi Akiba, Tatsuya Kawahara, Seiichi Nakagawa, Tomoko Matsui, Yoichi Yamashita, Kiyoaki Aikawa
- 雑誌名
  
  Proceedings of International Conference on Speech Communication and Technology
  
  ページ: 677-680
- 査読あり
[雑誌論文] Language Modeling Approach for Retrieving Passages in Lecture Audio Data2010
- 著者名/発表者名
  Koichiro Honda, Tomoyoshi Akiba
- 雑誌名
  
  Proceedings of International Conference on Language Resources and Evaluation
  
  ページ: 1526-1530
- 査読あり
[学会発表] フレーズ拡張したワードラティスを用いた対訳コーパスのない言語からの統計的機械翻訳2011
- 著者名/発表者名
  楠本高康, 秋葉友良
- 学会等名
  言語処理学会年次大会
- 発表場所
  豊橋技科学大学(愛知県)
- 年月日
  2011-03-08
[学会発表] 音声検索語検出を利用した音声ドキュメント内容検索の検討2011
- 著者名/発表者名
  瀧上智子, 秋葉友良
- 学会等名
  音声ドキュメント処理ワークショップ
- 発表場所
  豊橋技術科学大学(愛知県)
- 年月日
  2011-03-07
[学会発表] 音声ドキュメントのパッセージ検索に対する適合モデルとWeb拡張の適用2011
- 著者名/発表者名
  本田耕一郎, 秋葉友良
- 学会等名
  音声ドキュメント処理ワークショップ
- 発表場所
  豊橋技術科学大学(愛知県)
- 年月日
  2011-03-07
[学会発表] NTCIR-9 Spoken Doc:音声検索語検索と音声ドキュメント検索の評価枠組みの設計2010
- 著者名/発表者名
  秋葉友良, 西崎博光, 相川清明, 河原達也, 松井知子, 伊藤慶明, 胡新輝, 中川聖一, 南條浩輝, 山下洋一
- 学会等名
  情報処理学会、電子情報通信学会、日本音響学会主催、音声言語シンポジウム
- 発表場所
  国立オリンピック記念青少年総合センター(東京都)
- 年月日
  2010-12-21
[学会発表] A Fast Spoken Term Detection Method based on Hough Transform2010
- 著者名/発表者名
  Taisuke Kaneko, Tomoyosi Akiba
- 学会等名
  17th Asian Symposium on Ecotechnology
- 発表場所
  宇奈月温泉(富山県)
- 年月日
  2010-10-12
[学会発表] 音声ドキュメント検索の現状と課題2010
- 著者名/発表者名
  秋葉友良
- 学会等名
  情報処理学会音声言語情報処理研究会
- 発表場所
  秋保温泉(宮城県仙台市)
- 年月日
  2010-07-23
[学会発表] Spoken Term Detectionのためのテストコレクション構築とベースライン評価2010
- 著者名/発表者名
  西崎博光, 胡新輝, 南條浩輝, 伊藤慶明, 秋葉友良, 河原達也, 中川聖一, 松井知子, 山下洋一, 相川清明
- 学会等名
  情報処理学会音声言語情報処理研究会
- 発表場所
  東京工業大学(東京都)
- 年月日
  2010-05-28

2010 年度 実績報告書

音声処理と言語処理の融合に基づく大規模音声ドキュメントの内容検索

研究代表者

秋葉 友良 豊橋技術科学大学, 大学院・工学研究科, 准教授 (00356346)

研究成果

[雑誌論文] Metric Subspace Indexing for Fast Spoken Term Detection2010

著者名/発表者名

雑誌名

[雑誌論文] Constructing Japanese Test Collections for Spoken Term Detection2010

著者名/発表者名

雑誌名

[雑誌論文] Language Modeling Approach for Retrieving Passages in Lecture Audio Data2010

著者名/発表者名

雑誌名

[学会発表] フレーズ拡張したワードラティスを用いた対訳コーパスのない言語からの統計的機械翻訳2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音声検索語検出を利用した音声ドキュメント内容検索の検討2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音声ドキュメントのパッセージ検索に対する適合モデルとWeb拡張の適用2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] NTCIR-9 Spoken Doc:音声検索語検索と音声ドキュメント検索の評価枠組みの設計2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] A Fast Spoken Term Detection Method based on Hough Transform2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音声ドキュメント検索の現状と課題2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Spoken Term Detectionのためのテストコレクション構築とベースライン評価2010

著者名/発表者名

学会等名

発表場所

年月日

2010 年度実績報告書

秋葉友良豊橋技術科学大学, 大学院・工学研究科, 准教授 (00356346)