• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

多層モデルの階層間密統合に基づく音声理解フレームワークの研究

Research Project

Project/Area Number 21300066
Research InstitutionNagoya Institute of Technology

Principal Investigator

李 晃伸  名古屋工業大学, 大学院・工学研究科, 准教授 (80332766)

Co-Investigator(Kenkyū-buntansha) 秋田 祐哉  京都大学, 学術情報メディアセンター, 助教 (90402742)
駒谷 和範  名古屋大学, 工学研究科, 准助教 (40362579)
西村 竜一  和歌山大学, システム工学部, 助教 (00379611)
篠崎 隆宏  千葉大学, 融合科学研究科, 助教 (80447903)
西田 昌史  同志社大学, 理工学部, 准助教 (80361442)
南條 浩輝  龍谷大学, 理工学部, 助教 (50388162)
Keywords音声言語理解 / 音声対話 / 音声認識
Research Abstract

本研究課題の目的は、音声言語理解において、信号処理から意味理解、ユーザモデルまでの各層の実際的な関係や統計的性質を明らかにし、それに基づいて処理を確率的に密統合することで、より高度かつ柔軟な音声言語処理と、高度な音声言語インタフェースを実現することである。
H22年度は、初年度の成果をもとに、各層における確率的な制約表現方法、ならびに他層との接続に関する研究を遂行した。1)制約条件の調査では、昨年度の討議をもとに、各層ごとのモデルユニットについて討議を行った。また、言語情報と認識処理の融合の一つとして、辞書情報に基づいて認識結果を早期確定する手法を検証・評価した。2)言語モデルについては、言語・発音モデルの統計的変換手法を探索過程へ動的に組み込む方法について検討した。また言語モデルの話題依存性、タスク適応、効率的なワードスポッティング手法についても研究した。3)ベイズリスク最少化深索においては、音声認識エンジンJuliusへ手法の組み込みを行い、それに基づく情報検索システムを試作して評価を行った。4)音響モデルについては、多様な話者層や言語に対応する音声認識システムの構築を通じて音響モデルの多様性を検証するとともに、様々な特徴量やモデルパラメータの動的な制御について調査した。5)データ収集用音声対話システムについては、音声対話システムを用いた自然な対話発声データの大規模収集のためのシステムの開発と改善を行っており、プロトタイプを完成させつつある。6)統計的ユーザモデル及び統計的対話モデルについては、対話制御の効率的な統計的モデル化の検討を行うとともに、目標である他層情報との密結合の試行として、発語行為(音声の発話タイミング)を対話制御に直接反映させてモデル化する手法を検討し、評価した。

  • Research Products

    (17 results)

All 2011 2010

All Journal Article (6 results) (of which Peer Reviewed: 2 results) Presentation (11 results)

  • [Journal Article] Statistical transformation of language and pronunciation models for spontaneous speech recognition2010

    • Author(s)
      Yuya Akita
    • Journal Title

      IEEE Trans.Audio, Speech & Language Process.

      Volume: 18(6) Pages: 1539-1549

    • Peer Reviewed
  • [Journal Article] An Efficient Prosody Adaptation Method and Its Application to HMM-based Speech Synthesis2010

    • Author(s)
      Hosana Kamiyama, Takahiro Shinozaki, Koji Iwano, Sadaoki Furui
    • Journal Title

      Proc.Asia-Pacific Signal and Information Processing Association(APSIPA)

      Volume: 1 Pages: 82-85

    • Peer Reviewed
  • [Journal Article] 単語亜要度を用いたN-gram補完手法が与える音声認識性能の調査2010

    • Author(s)
      島田敏明, 西村竜一, 河原英紀, 入野俊夫
    • Journal Title

      情報処理学会研究報告

      Volume: 2010-SLP-82(19) Pages: 1-6

  • [Journal Article] 発語行為レベルの情報を活用した音声対話システムの研究2010

    • Author(s)
      駒谷和範, 松山匡子, 奥乃博
    • Journal Title

      人工知能学会研究会資料

      Volume: SIG-SLUD-B002-12 Pages: 53-58

  • [Journal Article] 連続単語認識における認識結果の逐次早期確定アルゴリズムの評価2010

    • Author(s)
      大野博之, 小島弘, 南角吉彦, 李晃伸, 徳田恵一
    • Journal Title

      電子情報通信学会技術研究報告

      Volume: 110 Pages: 77-82

  • [Journal Article] 音声対話システムのための複数キーワードの共起制約に基づくスポッティングアルゴリズムの評価2010

    • Author(s)
      加藤杏樹, 南角吉彦, 李晃伸, 徳田恵一
    • Journal Title

      電子情報通信学会技術研究報告

      Volume: 110 Pages: 25-30

  • [Presentation] 双方向探索に基づくN-gramを用いたキーワードからの文生成2011

    • Author(s)
      平野隆司, 南角吉彦, 李晃伸, 徳田恵一
    • Organizer
      日本音響学会2011年春季研究発表会
    • Place of Presentation
      早稲田大学(東京都)
    • Year and Date
      2011-03-10
  • [Presentation] クロス言語検索を用いた中国語音声認識による乗換案内システム2011

    • Author(s)
      張〓, 大西翼, 篠崎隆宏, 古井貞熙
    • Organizer
      日本音響学会2011年春季講演論文集
    • Place of Presentation
      早稲田大学(東京都)
    • Year and Date
      2011-03-10
  • [Presentation] ウェブを用いたトピック関連N-gramエントリ抽出手法の検討2011

    • Author(s)
      島田敏明
    • Organizer
      日本音響学会2011年春季研究発表会
    • Place of Presentation
      早稲田大学(東京都)
    • Year and Date
      2011-03-10
  • [Presentation] 実環境発話を用いた子ども判別アルゴリズムの検討2011

    • Author(s)
      宮森翔子
    • Organizer
      日本音響学会2011年春季研究発表会
    • Place of Presentation
      早稲田大学(東京都)
    • Year and Date
      2011-03-10
  • [Presentation] 音声対話システムの応答における親密度と情報最に着目した心的負担に関する分析2011

    • Author(s)
      芦沢卓也, 西田昌史, 山本誠一
    • Organizer
      情報処理学会第73回全国大会
    • Place of Presentation
      東京工業大学大岡山キャンパス(東京都)
    • Year and Date
      2011-03-03
  • [Presentation] 音声認識エンジンJuliusへの認識誤り最小化機能の実装-賢い音声認識を目指して2010

    • Author(s)
      吉谷遼, 南條浩輝
    • Organizer
      日本音響学会関西支部第13回関西支部若手研究者交流研究発表会
    • Place of Presentation
      同志社大学室町キャンパス寒梅館(京都府)
    • Year and Date
      2010-12-05
  • [Presentation] 実環境発話を入力とする子ども利用者判別技術の開発2010

    • Author(s)
      宮森翔子
    • Organizer
      日本ロボット学会第28回学術講演会
    • Place of Presentation
      名古屋工業大学(愛知県)
    • Year and Date
      2010-09-22
  • [Presentation] ウェブ収集発話に基づく子ども向け対話インタフェースの開発2010

    • Author(s)
      宮森翔子
    • Organizer
      日本音響学会2010年秋季研究発表会
    • Place of Presentation
      関西大学(大阪府)
    • Year and Date
      2010-09-16
  • [Presentation] 講演発話を用いたN-gram補完手法の音声認識性能評価2010

    • Author(s)
      島田敏明
    • Organizer
      日本音響学会2010年秋季研究発表会
    • Place of Presentation
      関西大学(大阪府)
    • Year and Date
      2010-09-14
  • [Presentation] 音声ウェブシステムを用いて収集した実環境子供発話に関する調査2010

    • Author(s)
      栗原理紗
    • Organizer
      FIT2010第9回情報科学技術フォーラム
    • Place of Presentation
      九州大学(福岡県)
    • Year and Date
      2010-09-07
  • [Presentation] ちょっとした一言の音声認識による子ども利用者判別法の検討2010

    • Author(s)
      宮森翔子
    • Organizer
      FIT2010第9回情報科学技術フォーラム
    • Place of Presentation
      九州大学(福岡県)
    • Year and Date
      2010-09-07

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi