• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 研究成果報告書

聞き手の反応に着目した音声会話の解析と生成

研究課題

  • PDF
研究課題/領域番号 22240013
研究種目

基盤研究(A)

配分区分補助金
応募区分一般
研究分野 知覚情報処理・知能ロボティクス
研究機関京都大学

研究代表者

河原 達也  京都大学, 学術情報メディアセンター, 教授 (00234104)

研究分担者 角 康之  公立はこだて未来大学, システム情報科学部, 教授 (30362578)
秋田 祐哉  京都大学, 学術情報メディアセンター, 助教 (90402742)
森 信介  京都大学, 学術情報メディアセンター, 准教授 (90456773)
研究期間 (年度) 2010-04-01 – 2014-03-31
キーワード画像、文章、音声等認識 / コンテンツ・アーカイブ / エージェント / マルチモーダルインターフェース / 音声会話
研究概要

音声によるコミュニケーションの解析とそれに基づく音声対話システムの高度化を行った。本研究では、特に聞き手の反応に着目した新たなアプローチを提案し、そのモデル化と実現を行った。人間どうしのインタラクションにおいて、聞き手の視線・相槌や笑い声などの反応を検出し、これらの情報に基づいて興味度・理解度の推定を行った。また、聞き手の興味や焦点に応じて、話題を選択して情報提供する音声対話システムの構築も行った。

  • 研究成果

    (44件)

すべて 2014 2013 2012 2011 2010

すべて 雑誌論文 (14件) (うち査読あり 14件) 学会発表 (30件)

  • [雑誌論文] Lexicon optimization based on discriminative learning for automatic speech recognition of agglutinative language2014

    • 著者名/発表者名
      M. Ablimit, T. Kawahara, and A. Hamdulla
    • 雑誌名

      Speech Communication

      巻: Vol.60 ページ: 78-87

    • DOI

      10.1016/j.specom.2013.09.011

    • 査読あり
  • [雑誌論文] 述語項構造を介した文の選択に基づく音声対話用言語モデルの構築2014

    • 著者名/発表者名
      吉野幸一郎, 森信介, 河原達也
    • 雑誌名

      人工知能学会論文誌

      巻: Vol.29, No.1 ページ: 53-59

    • 査読あり
  • [雑誌論文] 講演に対する読点の複数アノテーションに基づく自動挿入2013

    • 著者名/発表者名
      秋田祐哉, 河原達也
    • 雑誌名

      情報処理学会論文誌

      巻: Vol.54, No.2 ページ: 463-470

    • 査読あり
  • [雑誌論文] A monotonic statistical machine translation approach to speaking style transformation2012

    • 著者名/発表者名
      G. Neubig, Y. Akita, S. Mori, and T. Kawahara
    • 雑誌名

      Computer Speech and Language

      巻: Vol.26, No.5 ページ: 349-370

    • DOI

      10.1016/j.csl.2012.02.003

    • 査読あり
  • [雑誌論文] 会議音声認識におけるBICに基づく高速な話者正規化と話者適応2012

    • 著者名/発表者名
      三村正人, 河原達也
    • 雑誌名

      電子情報通信学会論文誌

      巻: Vol.J95-D, No.7 ページ: 1467-1475

    • 査読あり
  • [雑誌論文] Bayesian learning of a language model from continuous speech2012

    • 著者名/発表者名
      G. Neubig, M. Mimura, S. Mori, and T. Kawahara
    • 雑誌名

      IEICE Trans

      巻: Vol.E95-D, No.2 ページ: 614-625

    • 査読あり
  • [雑誌論文] 述語項の類似度に基づく情報抽出・推薦を行う音声対話システム2011

    • 著者名/発表者名
      吉野幸一郎, 森信介, 河原達也
    • 雑誌名

      情報処理学会論文誌

      巻: Vol.52, No.12 ページ: 3386-3397

    • 査読あり
  • [雑誌論文] 音声会話コンテンツにおける聴衆の反応に基づく 音響イベントとホットスポットの検出2011

    • 著者名/発表者名
      河原達也, 須見康平, 緒方淳, 後藤真孝
    • 雑誌名

      情報処理学会論文誌

      巻: Vol.52, No.12 ページ: 3363-3373

    • 査読あり
  • [雑誌論文] 統計的言語モデル変換を用いた音響モデルの準教師付き学習2011

    • 著者名/発表者名
      三村正人, 秋田祐哉, 河原達也
    • 雑誌名

      電子情報通信学会論文誌

      巻: Vol.J94-D, No.2 ページ: 460-468

    • 査読あり
  • [雑誌論文] Online unsupervised classification with model comparison in the Variational Bayes framework for voice activity detection2010

    • 著者名/発表者名
      D. Cournapeau, S. Watanabe, A. Nakamura, and T. Kawahara
    • 雑誌名

      IEEE J. Selected Topics in Signal Processing

      巻: Vol.4, No.6 ページ: 1071-1083

    • DOI

      10.1109/JSTSP.2010.2080821

    • 査読あり
  • [雑誌論文] 会議録作成支援のための国会審議の音声認識システム2010

    • 著者名/発表者名
      秋田祐哉, 三村正人, 河原達也
    • 雑誌名

      電子情報通信学会論文誌

      巻: Vol.J93-D, No.9 ページ: 1736-1744

    • 査読あり
  • [雑誌論文] Robust speech recognition based on dereverberation parameter optimization using acoustic model likelihood2010

    • 著者名/発表者名
      R. Gomez and T. Kawahara
    • 雑誌名

      IEEE Trans. Audio, Speech ¥& Language Process

      巻: Vol.18, No.7 ページ: 1708-1716

    • DOI

      10.1109/TASL.2010.2052610

    • 査読あり
  • [雑誌論文] Statistical transformation of language and pronunciation models for spontaneous speech recognition2010

    • 著者名/発表者名
      Y. Akita and T. Kawahara
    • 雑誌名

      IEEE Trans. Audio, Speech & Language Process

      巻: Vol.18, No.6 ページ: 1539-1549

    • DOI

      10.1109/TASL.2009.2037400

    • 査読あり
  • [雑誌論文] Speech activity detection for multi-party conversation analyses based on likelihood ratio test on spatial magnitude2010

    • 著者名/発表者名
      K. Ishizuka, S. Araki, and T. Kawahara
    • 雑誌名

      IEEE Trans. Audio, Speech & Language Process

      巻: Vol.18, No.6 ページ: 1354-1365

    • DOI

      10.1109/TASL.2009.2033955

    • 査読あり
  • [学会発表] Smart posterboard : Multi-modal sensing and analysis of poster conversations2013

    • 著者名/発表者名
      T. Kawahara
    • 学会等名
      Proc. APSIPA ASC, (plenary overview talk)
    • 発表場所
      台湾・高雄
    • 年月日
      20131000
  • [学会発表] Estimation of interest and comprehension level of audience through multi-modal behaviors in poster conversations2013

    • 著者名/発表者名
      T. Kawahara, S. Hayashi, and K. Takanashi
    • 学会等名
      Proc. INTERSPEECH
    • 発表場所
      フランス・リヨン
    • 年月日
      20130800
  • [学会発表] Incorporating semantic information to selection of web texts for language model of spoken dialogue system2013

    • 著者名/発表者名
      K. Yoshino, S. Mori, and T. Kawahara
    • 学会等名
      Proc. IEEE-ICASSP
    • 発表場所
      カナダ・バンクーバー
    • 年月日
      20130500
  • [学会発表] Language modeling for spoken dialogue system based on filtering using predicate-argument structures2012

    • 著者名/発表者名
      K. Yoshino, S. Mori, and T. Kawahara
    • 学会等名
      Proc. COLING
    • 発表場所
      インド・ムンバイ
    • 年月日
      20121200
  • [学会発表] Hybrid vector space model for flexible voice search2012

    • 著者名/発表者名
      C. Lee and T. Kawahara
    • 学会等名
      Proc. APSIPA ASC
    • 発表場所
      米国・ロサンジェルス
    • 年月日
      20121200
  • [学会発表] Language modeling for spoken dialogue system based on sentence transformation and filtering using predicate-argument structures2012

    • 著者名/発表者名
      K. Yoshino, S. Mori, and T. Kawahara
    • 学会等名
      Proc. APSIPA ASC
    • 発表場所
      米国・ロサンジェルス
    • 年月日
      20121200
  • [学会発表] Automatic transcription of lecture speech using language model based on speaking-style transformation of proceeding texts2012

    • 著者名/発表者名
      Y. Akita, M. Watanabe, and T. Kawahara
    • 学会等名
      Proc. INTERSPEECH
    • 発表場所
      米国・ポートランド
    • 年月日
      20120900
  • [学会発表] Dereverberation based on wavelet packet filtering for robust automatic speech recognition2012

    • 著者名/発表者名
      R. Gomez and T. Kawahara
    • 学会等名
      Proc. INTERSPEECH
    • 発表場所
      米国・ポートランド
    • 年月日
      20120900
  • [学会発表] Prediction of turn-taking by combining prosodic and eye-gaze information in poster conversations2012

    • 著者名/発表者名
      T. Kawahara, T. Iwatate, and K. Takanashi
    • 学会等名
      Proc. INTERSPEECH
    • 発表場所
      米国・ポートランド
    • 年月日
      20120900
  • [学会発表] Can we predict who in the audience will ask what kind of questions with their feedback behaviors in poster conversation?2012

    • 著者名/発表者名
      T. Kawahara, T. Iwatate, T. Tsuchiya, and K. Takanashi
    • 学会等名
      Proc. Interdisciplinary Workshop on Feedback Behaviors in Dialog
    • 発表場所
      米国・ポートランド
    • 年月日
      20120900
  • [学会発表] Transcription system using automatic speech recognition for the Japanese Parliament (Diet)2012

    • 著者名/発表者名
      T. Kawahara
    • 学会等名
      Proc. AAAI/IAAI
    • 発表場所
      カナダ・トロント
    • 年月日
      20120700
  • [学会発表] Multi-modal sensing and analysis of poster conversations toward smart posterboard2012

    • 著者名/発表者名
      T. Kawahara
    • 学会等名
      Proc. SIGdial Meeting Discourse ¥& Dialogue
    • 発表場所
      韓国・ソウル
    • 年月日
      20120700
  • [学会発表] Discriminative approach to lexical entry selection for automatic speech recognition of agglutinative language2012

    • 著者名/発表者名
      M. Ablimit, T. Kawahara, and A. Hamdulla
    • 学会等名
      Proc. IEEE-ICASSP
    • 発表場所
      京都
    • 年月日
      20120300
  • [学会発表] Optimized wavelet-based speech enhancement for speech recognition in noisy and reverberant conditions2011

    • 著者名/発表者名
      R. Gomez and T. Kawahara
    • 学会等名
      Proc. APSIPA ASC
    • 発表場所
      中国・西安
    • 年月日
      20111000
  • [学会発表] Fast speaker normalization and adaptation based on BIC for meeting speech recognition2011

    • 著者名/発表者名
      M. Mimura and T. Kawahara
    • 学会等名
      Proc. APSIPA ASC
    • 発表場所
      中国・西安
    • 年月日
      20111000
  • [学会発表] Lexicon optimization for automatic speech recognition based on discriminative learning2011

    • 著者名/発表者名
      M. Ablimit, T. Kawahara, and A. Hamdulla
    • 学会等名
      Proc. APSIPA ASC
    • 発表場所
      中国・西安
    • 年月日
      20111000
  • [学会発表] Info-concierge : Proactive multi-modal interaction through mind probing2011

    • 著者名/発表者名
      T. Hirayama, Y. Sumi, T. Kawahara, and T. Matsuyama
    • 学会等名
      Proc. APSIPA ASC
    • 発表場所
      中国・西安
    • 年月日
      20111000
  • [学会発表] Combining slot-based vector space model for voice book search2011

    • 著者名/発表者名
      C. Lee, T. Kawahara, and A. Rudnicky
    • 学会等名
      Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)
    • 発表場所
      スペイン・グラナダ
    • 年月日
      20110900
  • [学会発表] Automatic comma insertion of lecture transcripts based on multiple annotations2011

    • 著者名/発表者名
      Y. Akita and T. Kawahara
    • 学会等名
      Proc. INTERSPEECH
    • 発表場所
      イタリア・フィレンチェ
    • 年月日
      20110800
  • [学会発表] Denoising using optimized wavelet filtering for automatic speech recognition2011

    • 著者名/発表者名
      R. Gomez and T. Kawahara
    • 学会等名
      Proc. INTERSPEECH
    • 発表場所
      イタリア・フィレンチェ
    • 年月日
      20110800
  • [学会発表] Spoken dialogue system based on information extraction using similarity of predicate argument structures2011

    • 著者名/発表者名
      K. Yoshino, S. Mori, and T. Kawahara
    • 学会等名
      Proc. SIGdial Meeting Discourse ¥& Dialogue
    • 発表場所
      米国・ポートランド
    • 年月日
      20110600
  • [学会発表] Optimizing wavelet parameters for dereverberation in automatic speech recognition2010

    • 著者名/発表者名
      R. Gomez and T. Kawahara
    • 学会等名
      Proc. APSIPA ASC
    • 発表場所
      シンガポール
    • 年月日
      20101200
  • [学会発表] Automatic transcription of parliamentary meetings and classroom lectures - a sustainable approach and real system evaluations -2010

    • 著者名/発表者名
      T. Kawahara
    • 学会等名
      Proc. Int'l Sympo. Chinese Spoken Language Processing (ISCSLP)
    • 発表場所
      台湾・台南
    • 年月日
      20101200
  • [学会発表] Spoken dialogue system based on information extraction from web text2010

    • 著者名/発表者名
      K. Yoshino and T. Kawahara
    • 学会等名
      Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)
    • 発表場所
      御殿場
    • 年月日
      20100900
  • [学会発表] Detection of hot spots in poster conversations based on reactive tokens of audience2010

    • 著者名/発表者名
      T. Kawahara, K. Sumi, Z.Q.Chang, and K. Takanashi
    • 学会等名
      Proc. INTERSPEECH
    • 発表場所
      幕張
    • 年月日
      20100900
  • [学会発表] Learning a language model from continuous speech2010

    • 著者名/発表者名
      G. Neubig, M. Mimura, S. Mori, and T. Kawahara
    • 学会等名
      Proc. INTERSPEECH
    • 発表場所
      幕張
    • 年月日
      20100900
  • [学会発表] Classroom note-taking system for hearing impaired students using automatic speech recognition adapted to lectures2010

    • 著者名/発表者名
      T. Kawahara, N. Katsumaru, Y. Akita, and S. Mori
    • 学会等名
      Proc. INTERSPEECH
    • 発表場所
      幕張
    • 年月日
      20100900
  • [学会発表] An improved wavelet-based dereverberation for robust automatic speech recognition2010

    • 著者名/発表者名
      R. Gomez and T. Kawahara
    • 学会等名
      Proc. INTERSPEECH
    • 発表場所
      幕張
    • 年月日
      20100900
  • [学会発表] Semi-automated update of automatic transcription system for the Japanese national congress2010

    • 著者名/発表者名
      Y. Akita, M. Mimura, G. Neubig, and T. Kawahara
    • 学会等名
      Proc. INTERSPEECH
    • 発表場所
      幕張
    • 年月日
      20100900
  • [学会発表] Analysis on prosodic features of Japanese reactive tokens in poster conversations2010

    • 著者名/発表者名
      T. Kawahara, Z.Q. Chang, and K. Takanashi
    • 学会等名
      Proc. Int'l Conf. Speech Prosody
    • 発表場所
      米国・シカゴ
    • 年月日
      20100500

URL: 

公開日: 2015-06-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi