• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Annual Research Report

聞き手の反応に着目した音声会話の解析と生成

Research Project

Project/Area Number 22240013
Research InstitutionKyoto University

Principal Investigator

河原 達也  京都大学, 学術情報メディアセンター, 教授 (00234104)

Co-Investigator(Kenkyū-buntansha) 角 康之  公立はこだて未来大学, システム情報科学部, 教授 (30362578)
秋田 祐哉  京都大学, 学術情報メディアセンター, 助教 (90402742)
森 信介  京都大学, 学術情報メディアセンター, 准教授 (90456773)
Project Period (FY) 2010-04-01 – 2014-03-31
Keywords画像、文章、音声等認識 / コンテンツ・アーカイブ / エージェント / マルチモーダルインターフェース / 音声会話
Research Abstract

話し言葉の音声認識に関する研究、音声会話の聞き手の反応に着目した分析を進めるとともに、音声対話エージェントの高度化も行った。
音声対話システムのための音声認識における言語モデル構築のために、Web上で収集される文から適切なものを選択する手法を研究した。従来手法では文表層のパープレキシティを用いた文選択が一般的であったが、提案手法では音声対話において利用される文書集合(=ドメイン)との意味的な類似度を定義し、これを文選択に用いる。具体的には、ドメイン固有の述語項構造パターンに着目し、統計的な尺度を定義する。この意味的な類似度と従来のパープレキシティに基づく手法を組み合わせることも検討する。2種類の異なるドメインにおける音声認識実験によって、提案する文選択手法が有効であることが示された。
また、ポスターセッションにおける会話(=「ポスター会話」)に焦点をおいて研究を進めている。ポスター会話は、講演と会議の中間的な形態と捉えることができる。すなわち、発表者が自身の研究内容について少人数の聴衆に説明する一方、聴衆の側も相槌や頷きなどでリアルタイムにフィードバックし、時折質問やコメントも行う。本研究では、視線・話者・発話区間などの検出に加えて、聴衆の理解・興味度の推定などを行っている。これらは会話アーカイブに対する新たなインデキシングの枠組みを提供することが期待される。さらに、将来自動でプレゼンテーションを行う知的な会話エージェントの基盤にもなる。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

音声認識、会話の分析・アノテーション、音声対話システム(会話エージェント)の各要素に関して、成果が出ており、論文発表も順調に行えている。特に今年度は、国際会議での基調講演、国内会議でも多数の招待講演を行う機会があった。

Strategy for Future Research Activity

各要素をさらに高度化していくとともに、それらの成果を統合したシステムの構築も進めていく予定である。

  • Research Products

    (11 results)

All 2013 2012 Other

All Journal Article (6 results) (of which Peer Reviewed: 3 results) Presentation (5 results) (of which Invited: 4 results)

  • [Journal Article] 講演に対する読点の複数アノテーションに基づく自動挿入2013

    • Author(s)
      秋田祐哉, 河原達也
    • Journal Title

      情報処理学会論文誌

      Volume: Vol.54, No.2 Pages: 463-470

    • Peer Reviewed
  • [Journal Article] 音声対話システムの進化と淘汰 ―歴史と最近の技術動向―2013

    • Author(s)
      河原達也
    • Journal Title

      人工知能学会誌

      Volume: 28 Pages: 45--51

  • [Journal Article] A monotonic statistical machine translation approach to speaking style transformation2012

    • Author(s)
      G. Neubig, Y. Akita, S. Mori, and T. Kawahara
    • Journal Title

      Computer Speech and Language

      Volume: Vol.26, No.5 Pages: 349-370

    • DOI

      10.1016/j.csl.2012.02.003

    • Peer Reviewed
  • [Journal Article] 会議音声認識におけるBICに基づく高速な話者正規化と話者適応2012

    • Author(s)
      三村正人, 河原達也
    • Journal Title

      電子情報通信学会論文誌

      Volume: Vol.J95-D, No.7 Pages: 1467-1475

    • Peer Reviewed
  • [Journal Article] 話し言葉の音声認識の進展 ―議会の会議録作成から講演・講義の字幕付与へ―2012

    • Author(s)
      河原達也
    • Journal Title

      メディア教育研究

      Volume: 9 Pages: 1--8

    • DOI

      http://www.code.ouj.ac.jp/media/pdf/vol9no1_shotai_1.pdf

  • [Journal Article] 音声認識技術を用いた講演・講義への字幕付与2012

    • Author(s)
      河原達也
    • Journal Title

      映像情報メディア学会誌

      Volume: 66 Pages: 641--644

  • [Presentation] Transcription system using automatic speech recognition for the Japanese Parliament (Diet)

    • Author(s)
      Tatsuya Kawahara
    • Organizer
      AAAI/IAAI
    • Place of Presentation
      カナダ・トロント
  • [Presentation] Multi-modal sensing and analysis of poster conversations toward smart posterboard

    • Author(s)
      Tatsuya Kawahara
    • Organizer
      SIGdial Meeting Discourse & Dialogue
    • Place of Presentation
      韓国・ソウル大学
    • Invited
  • [Presentation] スマートポスターボード: ポスター発表における場のマルチモーダルなセンシングと認識

    • Author(s)
      河原達也
    • Organizer
      電子情報通信学会 パターン認識・メディア処理研究会
    • Place of Presentation
      大阪府立大学
    • Invited
  • [Presentation] 音声対話システムの進化と淘汰

    • Author(s)
      河原達也
    • Organizer
      人工知能学会 言語・音声理解と対話処理研究会
    • Place of Presentation
      ニューウェルシティ湯河原(静岡県熱海市)
    • Invited
  • [Presentation] スマートポスターボード: ポスター会話のマルチモーダルなセンシングと認識

    • Author(s)
      河原達也
    • Organizer
      電子情報通信学会 音声研究会
    • Place of Presentation
      滝の湯(山形県天童市)
    • Invited

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi