• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Annual Research Report

多段階誤り原因推定に基づく発話誘導型音声対話インタフェース

Research Project

Project/Area Number 19024043
Research InstitutionKyoto University

Principal Investigator

駒谷 和範  Kyoto University, 情報学研究科, 助教 (40362579)

Keywords人工知能 / 自然言語処理 / 音声対話システム / 音声認識誤り / ヘルプ生成 / WFST / ユーザモデリング / バージイン
Research Abstract

本研究では, 音声対話システムにおけるエラーを4階(Conversation/Intention/Signal/Channel)で定義し, これらを検出することで, ユーザ発話をシステムの受理可能な範囲内へと誘導する対話管理法の実現を目指している. 平成20年度はIntention Levelの誤りのさらに詳細な検出方法を開発した. さらにChannel Levelの情報を用いてエラーを検出する実験も行った.
【言語表現の一致(Intention Levelのエラー)の詳細な検出法の開発】
ユーザの発話表現が各文法のレベルでシステムの受理可能な表現と一致するかどうかを判定する手法を開発した. 本研究ではこれを文法検証技術と呼ぶ. 具体的にはWeighted Finite State Transducer (WFST)を利用することで, 音声認識の各種誤り(挿入/置換/削除)が音声認識結果の単語列中の任意の場所に現れる可能性を考慮したうえで, ユーザ発話に最も近い言語理解結果とその文法を求める. これにより発話が文法外である場合や, 発話全体は文法内だがその単語部分のみが認識できていない場合を検出できる. またこの結果を利用して, ユーザにヘルプメッセージを提示する順序をランキングする手法も開発した.
【Channel Levelでるバージインの頻度に着目したエラーの検出】
各ユーザがバージイン(システム発話への割り込み)を行う率を手がかりとして音声認識誤りを予測する実験を行った. ユーザの慣れを考慮するためにバージイン率の計算時に窓を設定し, その中での平均や分散を用いる. 適切な窓幅を選択することで予測率が向上することを実験的に示した.

  • Research Products

    (14 results)

All 2009 2008

All Journal Article (4 results) (of which Peer Reviewed: 4 results) Presentation (10 results)

  • [Journal Article] マルチドメイン音声対話システムにおけるトピック推定と対話履歴の統合によるドメイン選択手法2009

    • Author(s)
      池田智志, 駒谷和範, 尾形哲也, 奥乃博
    • Journal Title

      情報処理学会論文誌 Vol.50 No.2

      Pages: 488-500

    • Peer Reviewed
  • [Journal Article] 音声対話システムにおけるラピッドプロトタイピングを指向した言語理解2008

    • Author(s)
      福林雄一朗, 駒谷和範, 他5名
    • Journal Title

      情報処理学会論文誌 Vol.49 No.8

      Pages: 2762-2772

    • Peer Reviewed
  • [Journal Article] Managing Out-of-Grammar Utterances by Topic Estimation with Domain Extensibility in Muli-Domain Spoken Dialogue Systems2008

    • Author(s)
      Kazunori Komatani, Satoshi Ikeda, Tetsuva Ogata. Hiroshi G. Okuno
    • Journal Title

      Speech Communication Vol.50 Issue 10

      Pages: 863-870

    • Peer Reviewed
  • [Journal Article] Game-Theoretic Model of Referential Coherence and Its Empirical Verification Using Large Japanese and English Corpora2008

    • Author(s)
      Shun Shiramatsu, Kazunori Komatani, 他3名
    • Journal Title

      ACM Transactions on Speech and Language Processing Vol.5 No.3

    • Peer Reviewed
  • [Presentation] 音声対話システムにおける想定外発話の文法検証を用いた対話行為推定に基づくヘルプ生成2009

    • Author(s)
      池田智志, 駒谷和範, 高橋徹, 尾形哲也, 奥乃博
    • Organizer
      情報処理学会第71回全国大会
    • Place of Presentation
      立命館大学
    • Year and Date
      2009-03-11
  • [Presentation] 音声認識と言語理解を動的に選択する音声理解フレームワーク2009

    • Author(s)
      勝丸真樹, 中野幹生, 駒谷和範, 他6名
    • Organizer
      情報処理学会第71回全国大会
    • Place of Presentation
      立命館大学
    • Year and Date
      2009-03-11
  • [Presentation] 実環境音声対話システムにおけるバージイン発話タイミングを活用した指示対象の同定2009

    • Author(s)
      松山匡子, 駒谷和範, 他4名
    • Organizer
      情報処理学会第71回全国大会
    • Place of Presentation
      立命館大学
    • Year and Date
      2009-03-11
  • [Presentation] 話題遷移図の可視化と話題遷移に応じた関連情報提示による議事録閲覧支援2009

    • Author(s)
      白松俊, 駒谷和範, 尾形哲也, 高橋徹, 奥乃博
    • Organizer
      言語処理学会第15回年次大会
    • Place of Presentation
      鳥取大学
    • Year and Date
      2009-03-03
  • [Presentation] 複数の言語モデル・言語理解方式を用いた音声理解の高精度化2009

    • Author(s)
      勝丸真樹, 中野幹生, 駒谷和範 ,他6名
    • Organizer
      情報処理学会音声言語情報処理研究会(SIG-SLP)
    • Place of Presentation
      越後湯沢東映ホテル
    • Year and Date
      2009-02-07
  • [Presentation] SalienceGraph : Visualizing Salience Dynamics of Written Discourse by Using Reference Probability and PLSA2008

    • Author(s)
      Shun Shiramatsu, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • Organizer
      Pacific Rim International Conference on Artificial Intelligence (PRICAI-08)
    • Place of Presentation
      Hanoi, Vietnam
    • Year and Date
      2008-12-18
  • [Presentation] Predicting ASR Errors by Exploiting Barge-In Rate of Individual Users for Spoken Dialogue Systems2008

    • Author(s)
      Kazunori Komatani, Tatsuya Kawahara. Hiroshi G. Okuno
    • Organizer
      Interspeech 2008
    • Place of Presentation
      Brisbane, Australia
    • Year and Date
      2008-09-23
  • [Presentation] Expanding Vocabulary for Recognizing User's Abbreviations of Proper Nouns without Increasing ASR Error Rates in Spoken Dialogue Systems2008

    • Author(s)
      Masaki Katsumaru, Kazunori Komatani, Tetsuya Ogata, Hiroshi G. Okuno
    • Organizer
      Interspeech 2008
    • Place of Presentation
      Brisbane, Australia
    • Year and Date
      2008-09-23
  • [Presentation] SalienceGraph : 参照確率に基づく話題遷移図の可視化2008

    • Author(s)
      白松俊, 久保田祐史, 駒谷和範, 尾形哲也, 奥乃博
    • Organizer
      人工知能学会全国大会
    • Place of Presentation
      旭川市・ときわ市民ホール/勤労者福祉総合センター
    • Year and Date
      2008-06-11
  • [Presentation] 音声対話システムにおける簡略表現認識のための誤認識増加を抑制する自動語彙拡張2008

    • Author(s)
      勝丸真樹, 駒谷和範, 尾形哲也, 奥乃博
    • Organizer
      情報処理学会音声言語情報処理研究会(SIG-SLP)
    • Place of Presentation
      横浜国立大学
    • Year and Date
      2008-05-23

URL: 

Published: 2010-06-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi