• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Research-status Report

人間対人間の対話情報を事前知識とした情報検索音声対話戦略

Research Project

Project/Area Number 23500209
Research InstitutionNagoya University

Principal Investigator

北岡 教英  名古屋大学, 情報科学研究科, 准教授 (10333501)

Co-Investigator(Kenkyū-buntansha) 武田 一哉  名古屋大学, 情報科学研究科, 教授 (20273295)
宮島 千代美  名古屋大学, 情報科学研究科, 助教 (90335092)
Project Period (FY) 2011-04-28 – 2014-03-31
Keywords音声対話 / 情報検索 / 人間対人間 / 潜在意味
Research Abstract

音声言語や音楽などの概念を空間上で表現するための検討を行った。まず、音声言語については、単語認識により得られた結果を単語の頻度に基づいたベクトルとして表現することにより空間に配置する方法と、より音響的な情報を用いた音節認識結果に基づいて、その3連鎖の頻度に基づいたベクトルとして空間に配置する方法を併用することにより、音声認識誤りなどに強い音声言語の空間表現を提案した。そして、それらを入力された単語集合から検索するタスクによって評価することにより、空間上で意味的な近さを表現できていることを確認した。また、音楽については、主観的な類似と音響的な特徴との関係を調査するためにデータを収集し分析した。その結果、個人的な指向が大きく影響しているなどの結果が得られた。また、対話戦略については、空間内での探索問題としてユーザの意図にたどり着く方法をこれまでに提案しているが、そのうちのシステム応答文を選択するための評価尺度として、効率的な探索に加えてユーザにとって自然であることを評価することを提案した論文を投稿し、採録された。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

検索対象となるメディアを音声言語と音楽と選択し、それぞれに対して事前知識をポテンシャルとして表現するための空間表現を実現することをができた。これを、これまでに提案している人間対人間の対話の音声認識に基づいた検索を拡張し、空間上での距離をポテンシャルへと変換することによって、計画している探索空間の事前知識とみなすことができると考えられ、それへ向けた進展があったと考える。また、対話における複数理解のスコアリングに関しては論文として相応の評価がなされた。この複数理解は、同様に空間上に配置することができ、その空間と、上記の検索対象を表現する空間とを対応付ける手法が開発できれば、複数の理解それぞれにポテンシャルをスコアに変換して与えることが可能になり、探索空間に事前知識を与えて効率化・高度化するという目的を達することができる。

Strategy for Future Research Activity

人間対人間対話の収録および情報検索タスクを遂行するための模擬対話を収録することにより、確率統計的手法に基づいたポテンシャル表現法や対話理解表現の研究試料とする。また、最近音声対話手法として非常によくつかわれるPOMDP(Partially Observable Markov Decision Process)法と提案している手法との関連を明確にする。そのため、実際に実現した音楽検索タスクにおける提案手法をPOMDPで表現する場合との比較を含めた論文を執筆し、それを明確にする。また、検索対象空間上でのポテンシャルの、事前情報としての確率的表現への変換方法を研究する。可能であれば実際の対話から統計処理によって変換法を得ることが望ましい。そのためにも上記のデータ収集を行う。さらに、これまでは対話の言語的情報にのみ着目してきたが、特に事前情報として場の雰囲気などを表現する能力の高い韻律などからパラ言語的情報を抽出することを考え、その基礎検討を開始する。

Expenditure Plans for the Next FY Research Funding

主な繰り越し分の使用目的として、今年度の発売が期待された計算機の発売を待ち、早々に購入することがあげられる。本機の購入によりデータ収録・対話システムを構築する。また、対話評価に関する研究および音声言語情報の空間表現に関する研究の発表のため、数回の国内発表および2回程度の国際会議発表を計画している。

  • Research Products

    (4 results)

All 2012

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (3 results)

  • [Journal Article] 複数理解候補の保持と効率性・自然性を考慮した応答生成による誤認識に頑健な音声対話戦略とその評価2012

    • Author(s)
      北岡教英, 矢野浩利, 杉本夏樹, 山本一公, 中川聖一
    • Journal Title

      電子情報通信学会論文誌(D)

      Volume: J95-D Pages: 982-994

    • Peer Reviewed
  • [Presentation] クエリ拡張と音節認識の統合による音声ドキュメント検索2012

    • Author(s)
      大橋宏正, 柘植 覚, 北岡教英, 武田一哉, 北 研二
    • Organizer
      日本音響学会春季研究発表会
    • Place of Presentation
      神奈川大学(神奈川県)
    • Year and Date
      2012年3月15日
  • [Presentation] 音声ドキュメント検索におけるクエリ拡張と音節認識の併用の効果2012

    • Author(s)
      大橋宏正, 柘植 覚, 北岡教英, 武田一哉, 北 研二
    • Organizer
      電子情報通信学会音声研究会
    • Place of Presentation
      東北大学(宮城県)
    • Year and Date
      2012年2月10日
  • [Presentation] 楽曲間主観的類似度データの収集実験2012

    • Author(s)
      川渕将太, 宮島千代美, 北岡教英, 武田一哉
    • Organizer
      日本音響学会春季研究発表会
    • Year and Date
      20120000

URL: 

Published: 2013-07-10  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi