• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

音声言語と文字言語の統一的および相補的利用による音声言語情報アクセスの研究

Research Project

Project/Area Number 16K00153
Research InstitutionToyohashi University of Technology

Principal Investigator

秋葉 友良  豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (00356346)

Project Period (FY) 2016-04-01 – 2019-03-31
Keywords情報検索 / 音声ドキュメント検索 / 文字言語 / 音声言語 / 自由発話音声
Outline of Annual Research Achievements

本研究では、テキストで記述された言語情報と音声で記録された言語情報が分け隔てなく蓄積されるようになる未来を見据えて、両モダリティを統一的に、かつ各モダリティの特徴を活かしつつ、互いの利点を併用する音声言語情報アクセス技術を開発する。この視点から、研究課題を、(A)情報要求の獲得法、(B)情報検索手法、(C)情報提示法のそれぞれに設定した。
(A)について、これまでに申請者が収集した自由発話音声クエリと、それを再構成して作成したテキストクエリ、のペアからなるクエリセットについて、各クエリによる検索性能の違いを分析した。各クエリを構成要素(語)に分解して、それぞれの検索結果に対する貢献度を調べ、各クエリの有する利点と欠点を明らかにした。その結果、平均的にはにテキストクエリの方が検索性能が高いが、音声クエリの特徴である冗長性や多様性が効果的に機能する場合があるという知見を得た。また、これまでに開発してきた、自由発話音声に含まれる音響的特徴から検索への貢献度を推定する手法を改良し、音声ドキュメント検索性能の改善を行った。
(B)について、検索評価テストコレクションを整備し、検索対象として講演音声と発表用プレゼンテーションスライドに含まれるテキスト情報が混在するテストコレクションを構築した。この不均質なテストコレクションに対する文書検索手法を検討中である。また、音声ドキュメントとテキストの中間的な検索対象として、Twitterなどに代表されるマイクロブログに着目し、これに対する検索手法の検討を開始した。また、これまでに開発してきた、音声ドキュメントに対する未知語や誤認識に頑健な内容検索手法を改良し、検索結果を漸進的にユーザに提示するシステムを実装し、自動的もしくはユーザとのインタラクションを利用して、検索性能を最適化するように検索結果を確定する手法を開発した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究では、テキストで記述された言語情報と音声で記録された言語情報が分け隔てなく蓄積されるようになる未来を見据えて、両モダリティを統一的に、かつ各モダリティの特徴を活かしつつ、互いの利点を併用する音声言語情報アクセス技術を開発する。この視点から、研究課題を、(A)情報要求の獲得法、(B)情報検索手法、(C)情報提示法のそれぞれに設定した。
(A)(B)については順調に進展していると同時に、新たに着目した新規課題にも取り組んでいる。一方、(C)についてはこれまでに開発した手法に留まり、新たな開発に研究リソースを割くことはできなかった。
全体としては、概ね順調に進展していると考える。

Strategy for Future Research Activity

本研究では、テキストで記述された言語情報と音声で記録された言語情報が分け隔てなく蓄積されるようになる未来を見据えて、両モダリティを統一的に、かつ各モダリティの特徴を活かしつつ、互いの利点を併用する音声言語情報アクセス技術を開発する。この視点から、研究課題を、(A)情報要求の獲得法、(B)情報検索手法、(C)情報提示法のそれぞれに設定した。
今後は、研究リソースの配分を考慮して、より大きな進展が見込まれる課題(A)と(B)に注力し、(C)を来年度以降に実施するように計画を変更する。特に、(B)について、音声ドキュメントとテキストの中間的な検索対象として、マイクロブログを対象とした内容検索に取り組む。音声とテキストの中間的なメディアは、今後情報発信メディアとして増加していくと考えられるため、研究計画では考慮していなかった第3のメディアとして捉えて、これら3者が共存する状況での情報アクセス技術の開発に取り組んでいく。

Causes of Carryover

近年の深層学習の発展により、GPU搭載の高性能ワークステーションが必要になった。次年度に使用額をまとめて導入することにした。

Expenditure Plan for Carryover Budget

GPU搭載の高性能ワークステーションの導入に使用する。

  • Research Products

    (9 results)

All 2017 2016

All Presentation (9 results) (of which Int'l Joint Research: 5 results,  Invited: 1 results)

  • [Presentation] DNNに基づくフィルタバンクの再学習による話者クラス適応の検討2017

    • Author(s)
      関 博史, 山本 一公, 秋葉 友良, 中川 聖一
    • Organizer
      日本音響学会春季研究発表会
    • Place of Presentation
      明治大学生田キャンパス, 神奈川県
    • Year and Date
      2017-03-15 – 2017-03-17
  • [Presentation] 自然発話クエリの音響・言語特徴を利用した確率的検索モデルによる音声内容検索2017

    • Author(s)
      田崎 広人, 秋葉 友良
    • Organizer
      日本音響学会春季研究発表会
    • Place of Presentation
      明治大学生田キャンパス, 神奈川県
    • Year and Date
      2017-03-15 – 2017-03-17
  • [Presentation] 統計的機械翻訳における未知の一般語と固有名への対処2017

    • Author(s)
      水上仁志, 秋葉友良
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      筑波大学, 茨城県
    • Year and Date
      2017-03-14 – 2017-03-16
  • [Presentation] Taking advantage of spontaneous speech for document retrieval: Lessons from the organization of evaluation tasks2016

    • Author(s)
      Tomoyosi Akiba
    • Organizer
      5th Joint Meeting Acoustical Society of America and Acoustical Society of Japan
    • Place of Presentation
      Hawaii, USA
    • Year and Date
      2016-11-28 – 2016-12-02
    • Int'l Joint Research / Invited
  • [Presentation] 距離順音声検索語検出に基づく音声ドキュメントの漸進的内容検索2016

    • Author(s)
      河谷浩志, 大野哲平, 秋葉友良
    • Organizer
      日本音響学会秋季研究発表会
    • Place of Presentation
      富山大学, 富山県
    • Year and Date
      2016-09-14 – 2016-09-16
  • [Presentation] Effects of Class-based Statistical Machine Translation on Unknown Names2016

    • Author(s)
      Hitoshi Mizukami, Tomoyosi Akiba
    • Organizer
      International Conference on Advanced Informatics: Concepts, Theory and Applications
    • Place of Presentation
      Penang, Malaysia
    • Year and Date
      2016-08-16 – 2016-08-18
    • Int'l Joint Research
  • [Presentation] Overview of the NTCIR-11 SpokenQuery&Doc-2 Task2016

    • Author(s)
      Tomoyosi Akiba, Hiromitsu Nishizaki, Hiroaki Nanjo, Gareth Jones
    • Organizer
      the 12th NTCIR Conference
    • Place of Presentation
      学術情報センター, 東京都
    • Year and Date
      2016-06-07 – 2016-06-10
    • Int'l Joint Research
  • [Presentation] Graph-based Document Expansion and Robust SCR Models for False Positives: Experiments at the NTCIR-12 SpokenQuery&Doc-22016

    • Author(s)
      Sho Kawasaki, Hiroshi Oshima, Tomoyosi Akiba
    • Organizer
      the 12th NTCIR Conference
    • Place of Presentation
      学術情報センター, 東京都
    • Year and Date
      2016-06-07 – 2016-06-10
    • Int'l Joint Research
  • [Presentation] Repeated Event Discovery from Image Sequences by Using Segmental Dynamic Time Warping: Experiment at the NTCIR-12 Lifelog Task2016

    • Author(s)
      Kosuke Yamauchi, Tomoyosi Akiba
    • Organizer
      the 12th NTCIR Conference
    • Place of Presentation
      学術情報センター, 東京都
    • Year and Date
      2016-06-07 – 2016-06-10
    • Int'l Joint Research

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi