• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

自由発話音声による情報要求を活用したテキスト・音声・画像への情報アクセスの研究

Research Project

Project/Area Number 25330130
Research InstitutionToyohashi University of Technology

Principal Investigator

秋葉 友良  豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (00356346)

Co-Investigator(Kenkyū-buntansha) 中川 聖一  豊橋技術科学大学, その他部局等, 教授 (20115893)
Project Period (FY) 2013-04-01 – 2017-03-31
Keywordsボイスサーチ / 自由発話音声 / 音声ドキュメント検索 / 情報検索 / テストコレクション / 音声中の検索語検出 / 音声内容検索
Outline of Annual Research Achievements

前年度、本研究課題の目的である「自由発話音声による音声ドキュメント検索」を、国立情報学研究所の評価基盤構築プロジェクトNTCIRに提案し、評価タスクとして採択された。平成26年度は、前年度に収集した自由発話クエリに対し、評価データとしての整備を行った。具体的には、正解書き起こしと複数の音声認識結果の作成と音声との関連付け、発話からのキーワード抽出と各キーワードとその音声発声区間の時刻アライメント、などを行った。また、これを用いて評価タスクの運営を行い、参加11研究グループから得た検索結果を用いて適合性判定を行い、評価用の正解データを構築した。
一方、構築した評価データを用いて、自由発話音声を利用した音声ドキュメント検索の開発を進めた。自由発話音声に含まれる言語情報に加えて、ピッチ、パワー、話速などのパラ言語情報を抽出し、これらの検索処理に対する貢献度を分析した。また、抽出したパラ言語除法を言語情報とともに用いて、検索に利用する新規の音声ドキュメント検索手法の開発を行った。
また、音声ドキュメント検索における基盤技術の開発を進めた。研究を進めてきた距離順STD手法について複数検索語の同時検出に拡張した。この結果を利用して、順次検出される検索語を漸進的に利用する新しい音声内容検索(SCR)手法の開発を行った。その他、音声中の検索後検出(STD)については、音響尤度・言語尤度の再計算による検出精度向上手法を検討した。音声内容検索(SCR)については、現在のstate-of-the-artである言語モデルに基づく検索モデルに対して、音声認識の湧き出し誤りに頑健な拡張手法を開発した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

研究課題を研究コミュニティ共通の評価タスクとして設定し、国立情報学研究所の評価基盤構築プロジェクトNTCIRに提案し、採択されるに至った。これにより、共通課題の元で他の研究機関を巻き込んで研究推進することとなった。本研究課題について、本課題の研究グループの枠を超えた、幅広い研究成果が期待出来る。これに伴い、当初研究目標のうち(A) 「自由発話音声による情報要求の収集実験と分析」、および(B)「自由発話音声を情報要求に用いた音声ドキュメント検索システムの開発」に研究資源を集中させるように計画変更を行った。そのため、当初課題(C) 「自由発話音声による画像データ表現の調査とそれを用いた画像検索システムの開発」には着手していないが、これは当初計画のオプションとして記載した「(A)(B)の深化への目標変更」に該当し、目的どおりに進展している。

Strategy for Future Research Activity

本年度の「自由発話音声による音声ドキュメント検索」評価タスク実施の後、再度の評価タスクの実施を、国立情報学研究所の評価基盤構築プロジェクトNTCIRに提案し、採択された。今回は、収集する自由発話音声クエリのサイズを増やし、安定した評価が可能な評価データ構築に取り組む。この機会を活かした研究推進を目指すため、当初研究目標の(A) 「自由発話音声による情報要求の収集実験と分析」および(B)「自由発話音声を情報要求に用いた音声ドキュメント検索システムの開発」に研究資源を集中させる。評価タスクの運営を通して、他の研究機関と協力して研究課題に取り組み、多様な視点から課題達成の方法、およびその有効性を明らかにしていく。

  • Research Products

    (8 results)

All 2014 Other

All Presentation (6 results) Remarks (2 results)

  • [Presentation] Overview of the NTCIR-11 SpokenQuery&Doc Task2014

    • Author(s)
      Tomoyosi Akiba, Hiromitsu Nishizaki, Hiroaki Nanjo, Gareth Jones
    • Organizer
      the 11th NTCIR Conference
    • Place of Presentation
      学術総合センター、東京
    • Year and Date
      2014-12-09 – 2014-12-12
  • [Presentation] STD Score Combination with Acoustic Likelihood and Robust SCR Models for False Positives: Experiments at NTCIR-11 SpokenQuery&Doc2014

    • Author(s)
      Yusuke Takada, Sho Kawasaki, Hiroshi Oshima, Hiroshi Kawatani and Tomoyoshi Akiba
    • Organizer
      the 11th NTCIR Conference
    • Place of Presentation
      学術総合センター、東京
    • Year and Date
      2014-12-09 – 2014-12-12
  • [Presentation] Robust Retrieval Models for False Positive Errors in Spoken Documents2014

    • Author(s)
      Sho Kawasaki, Tomoyosi Akiba
    • Organizer
      International Conference on Speech Communication and Technology
    • Place of Presentation
      Singapore
    • Year and Date
      2014-09-14 – 2014-09-18
  • [Presentation] 自由発声した情報要求に含まれるキーワードの音響・言語的特長の調査2014

    • Author(s)
      大島翔, 秋葉友良
    • Organizer
      日本音響学会秋季研究発表会
    • Place of Presentation
      北海学園大学、札幌
    • Year and Date
      2014-09-03 – 2014-09-05
  • [Presentation] 音響尤度と音節列間距離の組み合わせに基づくSpoken Term Detection の精度向上2014

    • Author(s)
      高田優介, 秋葉友良
    • Organizer
      日本音響学会秋季研究発表会
    • Place of Presentation
      北海学園大学、札幌
    • Year and Date
      2014-09-03 – 2014-09-05
  • [Presentation] 感情ラベル付き会議録自動作成のための笑声・関心の自動検出2014

    • Author(s)
      佐藤聡介, 秋葉友良
    • Organizer
      日本音響学会秋季研究発表会
    • Place of Presentation
      北海学園大学、札幌
    • Year and Date
      2014-09-03 – 2014-09-05
  • [Remarks] NTCIR-11 Core Task: SpokenQuery&Doc

    • URL

      http://www.nlp.cs.tut.ac.jp/ntcir11

  • [Remarks] NTCIR-12 Core Task: SpokenQuery&Doc-2

    • URL

      http://www.nlp.cs.tut.ac.jp/ntcir12

URL: 

Published: 2016-05-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi