• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

自由発話音声による情報要求を活用したテキスト・音声・画像への情報アクセスの研究

研究課題

研究課題/領域番号 25330130
研究機関豊橋技術科学大学

研究代表者

秋葉 友良  豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (00356346)

研究分担者 中川 聖一  豊橋技術科学大学, その他部局等, 教授 (20115893)
研究期間 (年度) 2013-04-01 – 2017-03-31
キーワードボイスサーチ / 自由発話音声 / 音声ドキュメント検索 / 情報検索 / テストコレクション / 音声中の検索語検出 / 音声内容検索
研究実績の概要

前年度、本研究課題の目的である「自由発話音声による音声ドキュメント検索」を、国立情報学研究所の評価基盤構築プロジェクトNTCIRに提案し、評価タスクとして採択された。平成26年度は、前年度に収集した自由発話クエリに対し、評価データとしての整備を行った。具体的には、正解書き起こしと複数の音声認識結果の作成と音声との関連付け、発話からのキーワード抽出と各キーワードとその音声発声区間の時刻アライメント、などを行った。また、これを用いて評価タスクの運営を行い、参加11研究グループから得た検索結果を用いて適合性判定を行い、評価用の正解データを構築した。
一方、構築した評価データを用いて、自由発話音声を利用した音声ドキュメント検索の開発を進めた。自由発話音声に含まれる言語情報に加えて、ピッチ、パワー、話速などのパラ言語情報を抽出し、これらの検索処理に対する貢献度を分析した。また、抽出したパラ言語除法を言語情報とともに用いて、検索に利用する新規の音声ドキュメント検索手法の開発を行った。
また、音声ドキュメント検索における基盤技術の開発を進めた。研究を進めてきた距離順STD手法について複数検索語の同時検出に拡張した。この結果を利用して、順次検出される検索語を漸進的に利用する新しい音声内容検索(SCR)手法の開発を行った。その他、音声中の検索後検出(STD)については、音響尤度・言語尤度の再計算による検出精度向上手法を検討した。音声内容検索(SCR)については、現在のstate-of-the-artである言語モデルに基づく検索モデルに対して、音声認識の湧き出し誤りに頑健な拡張手法を開発した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

研究課題を研究コミュニティ共通の評価タスクとして設定し、国立情報学研究所の評価基盤構築プロジェクトNTCIRに提案し、採択されるに至った。これにより、共通課題の元で他の研究機関を巻き込んで研究推進することとなった。本研究課題について、本課題の研究グループの枠を超えた、幅広い研究成果が期待出来る。これに伴い、当初研究目標のうち(A) 「自由発話音声による情報要求の収集実験と分析」、および(B)「自由発話音声を情報要求に用いた音声ドキュメント検索システムの開発」に研究資源を集中させるように計画変更を行った。そのため、当初課題(C) 「自由発話音声による画像データ表現の調査とそれを用いた画像検索システムの開発」には着手していないが、これは当初計画のオプションとして記載した「(A)(B)の深化への目標変更」に該当し、目的どおりに進展している。

今後の研究の推進方策

本年度の「自由発話音声による音声ドキュメント検索」評価タスク実施の後、再度の評価タスクの実施を、国立情報学研究所の評価基盤構築プロジェクトNTCIRに提案し、採択された。今回は、収集する自由発話音声クエリのサイズを増やし、安定した評価が可能な評価データ構築に取り組む。この機会を活かした研究推進を目指すため、当初研究目標の(A) 「自由発話音声による情報要求の収集実験と分析」および(B)「自由発話音声を情報要求に用いた音声ドキュメント検索システムの開発」に研究資源を集中させる。評価タスクの運営を通して、他の研究機関と協力して研究課題に取り組み、多様な視点から課題達成の方法、およびその有効性を明らかにしていく。

  • 研究成果

    (8件)

すべて 2014 その他

すべて 学会発表 (6件) 備考 (2件)

  • [学会発表] Overview of the NTCIR-11 SpokenQuery&Doc Task2014

    • 著者名/発表者名
      Tomoyosi Akiba, Hiromitsu Nishizaki, Hiroaki Nanjo, Gareth Jones
    • 学会等名
      the 11th NTCIR Conference
    • 発表場所
      学術総合センター、東京
    • 年月日
      2014-12-09 – 2014-12-12
  • [学会発表] STD Score Combination with Acoustic Likelihood and Robust SCR Models for False Positives: Experiments at NTCIR-11 SpokenQuery&Doc2014

    • 著者名/発表者名
      Yusuke Takada, Sho Kawasaki, Hiroshi Oshima, Hiroshi Kawatani and Tomoyoshi Akiba
    • 学会等名
      the 11th NTCIR Conference
    • 発表場所
      学術総合センター、東京
    • 年月日
      2014-12-09 – 2014-12-12
  • [学会発表] Robust Retrieval Models for False Positive Errors in Spoken Documents2014

    • 著者名/発表者名
      Sho Kawasaki, Tomoyosi Akiba
    • 学会等名
      International Conference on Speech Communication and Technology
    • 発表場所
      Singapore
    • 年月日
      2014-09-14 – 2014-09-18
  • [学会発表] 自由発声した情報要求に含まれるキーワードの音響・言語的特長の調査2014

    • 著者名/発表者名
      大島翔, 秋葉友良
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      北海学園大学、札幌
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] 音響尤度と音節列間距離の組み合わせに基づくSpoken Term Detection の精度向上2014

    • 著者名/発表者名
      高田優介, 秋葉友良
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      北海学園大学、札幌
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] 感情ラベル付き会議録自動作成のための笑声・関心の自動検出2014

    • 著者名/発表者名
      佐藤聡介, 秋葉友良
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      北海学園大学、札幌
    • 年月日
      2014-09-03 – 2014-09-05
  • [備考] NTCIR-11 Core Task: SpokenQuery&Doc

    • URL

      http://www.nlp.cs.tut.ac.jp/ntcir11

  • [備考] NTCIR-12 Core Task: SpokenQuery&Doc-2

    • URL

      http://www.nlp.cs.tut.ac.jp/ntcir12

URL: 

公開日: 2016-05-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi