• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

音声処理と言語処理の融合に基づく大規模音声ドキュメントの内容検索

Research Project

Project/Area Number 22500090
Research InstitutionToyohashi University of Technology

Principal Investigator

秋葉 友良  豊橋技術科学大学, 大学院・工学研究科, 准教授 (00356346)

Co-Investigator(Kenkyū-buntansha) 中川 聖一  豊橋技術科学大学, 大学院・工学研究科, 教授 (20115893)
Keywords音声ドキュメント / 検索 / Spoken Term Detection / 索引付け / 適合性モデル / パッセージ検索 / クエリ拡張 / 音声認識
Research Abstract

音声ドキュメントを対象とした検索について、検索語が音声データ中のどこに現れたかを検出る検索語検出タスク(Spoken Term Detection)と、検索要求に合致する音声区間を特定する音声内容検索タスク(Spoken Document Retrieval)の2つの問題を設定し、それぞれ手法の開発を進めた。
検索語検出タスクについて、新しい索引付け手法であるMetric Subspace Indexing法を開発した。本手法は、画像中の直線検出手法であるハフ変換を検索語検出タスクに適用した方法である。オンライン処理を前提とした画像処理と異なり、音声ドキュメントを対象とする場合は検出処理前にドキュメントが既知であるために、オフラインでの効率的な索引付けができる点に着目し、高速な検出法を実現した。従来の索引付け法と異なり、尤もらしい候補順に結果を出力できる点、認識結果に現れる複数代替候補を直接扱うことができる点、が大きな特徴である。
音声内容検索タスクについて、パッセージ検索手法の開発および言語モデルに基づく検索手法の適用を行った。音声認識結果に対する検索は、誤認識の影響を受けるため、検索クエリや対象文書を関連語で補完する手法が有効と考え、適合性モデルをパッセージ検索に適用した。また、Webの関連文書を利用するように適合性モデルの拡張を行った。
また、2つのタスクを統合して音声ドキュメント検索を行うための予備調査を行った。統合手法は、まず検索クエリから検索語を抽出し、対象音声ドキュメントに対して音声検索語検出を行う。次に、この検出結果を語の出現と見て、文書検索を実行する。本手法を講演の検索タスクに適用したところ、高速なサブワード認識結果を使っているのにも係らず、従来の大語彙連続音声認識とテキスト検索を組み合わせる手法の検索性能を改善できることが分かった。

  • Research Products

    (10 results)

All 2011 2010

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (7 results)

  • [Journal Article] Metric Subspace Indexing for Fast Spoken Term Detection2010

    • Author(s)
      Taisuke Kaneko, Tomoyosi Akiba
    • Journal Title

      Proceedings of International Conference on Speech Communication and Technology

      Pages: 689-692

    • Peer Reviewed
  • [Journal Article] Constructing Japanese Test Collections for Spoken Term Detection2010

    • Author(s)
      Yoshiaki Itoh, Hiromitsu Nishizaki, Xinhui Hu, Hiroaki Nanjo, Tomoyosi Akiba, Tatsuya Kawahara, Seiichi Nakagawa, Tomoko Matsui, Yoichi Yamashita, Kiyoaki Aikawa
    • Journal Title

      Proceedings of International Conference on Speech Communication and Technology

      Pages: 677-680

    • Peer Reviewed
  • [Journal Article] Language Modeling Approach for Retrieving Passages in Lecture Audio Data2010

    • Author(s)
      Koichiro Honda, Tomoyoshi Akiba
    • Journal Title

      Proceedings of International Conference on Language Resources and Evaluation

      Pages: 1526-1530

    • Peer Reviewed
  • [Presentation] フレーズ拡張したワードラティスを用いた対訳コーパスのない言語からの統計的機械翻訳2011

    • Author(s)
      楠本高康, 秋葉友良
    • Organizer
      言語処理学会年次大会
    • Place of Presentation
      豊橋技科学大学(愛知県)
    • Year and Date
      2011-03-08
  • [Presentation] 音声検索語検出を利用した音声ドキュメント内容検索の検討2011

    • Author(s)
      瀧上智子, 秋葉友良
    • Organizer
      音声ドキュメント処理ワークショップ
    • Place of Presentation
      豊橋技術科学大学(愛知県)
    • Year and Date
      2011-03-07
  • [Presentation] 音声ドキュメントのパッセージ検索に対する適合モデルとWeb拡張の適用2011

    • Author(s)
      本田耕一郎, 秋葉友良
    • Organizer
      音声ドキュメント処理ワークショップ
    • Place of Presentation
      豊橋技術科学大学(愛知県)
    • Year and Date
      2011-03-07
  • [Presentation] NTCIR-9 Spoken Doc:音声検索語検索と音声ドキュメント検索の評価枠組みの設計2010

    • Author(s)
      秋葉友良, 西崎博光, 相川清明, 河原達也, 松井知子, 伊藤慶明, 胡新輝, 中川聖一, 南條浩輝, 山下洋一
    • Organizer
      情報処理学会、電子情報通信学会、日本音響学会主催、音声言語シンポジウム
    • Place of Presentation
      国立オリンピック記念青少年総合センター(東京都)
    • Year and Date
      2010-12-21
  • [Presentation] A Fast Spoken Term Detection Method based on Hough Transform2010

    • Author(s)
      Taisuke Kaneko, Tomoyosi Akiba
    • Organizer
      17th Asian Symposium on Ecotechnology
    • Place of Presentation
      宇奈月温泉(富山県)
    • Year and Date
      2010-10-12
  • [Presentation] 音声ドキュメント検索の現状と課題2010

    • Author(s)
      秋葉友良
    • Organizer
      情報処理学会音声言語情報処理研究会
    • Place of Presentation
      秋保温泉(宮城県仙台市)
    • Year and Date
      2010-07-23
  • [Presentation] Spoken Term Detectionのためのテストコレクション構築とベースライン評価2010

    • Author(s)
      西崎博光, 胡新輝, 南條浩輝, 伊藤慶明, 秋葉友良, 河原達也, 中川聖一, 松井知子, 山下洋一, 相川清明
    • Organizer
      情報処理学会音声言語情報処理研究会
    • Place of Presentation
      東京工業大学(東京都)
    • Year and Date
      2010-05-28

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi