• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

多層モデルの階層間密統合に基づく音声理解フレームワークの研究

研究課題

研究課題/領域番号 21300066
研究機関名古屋工業大学

研究代表者

李 晃伸  名古屋工業大学, 大学院・工学研究科, 准教授 (80332766)

研究分担者 秋田 祐哉  京都大学, 学術情報メディアセンター, 助教 (90402742)
駒谷 和範  名古屋大学, 工学研究科, 准助教 (40362579)
西村 竜一  和歌山大学, システム工学部, 助教 (00379611)
篠崎 隆宏  千葉大学, 融合科学研究科, 助教 (80447903)
西田 昌史  同志社大学, 理工学部, 准助教 (80361442)
南條 浩輝  龍谷大学, 理工学部, 助教 (50388162)
キーワード音声言語理解 / 音声対話 / 音声認識
研究概要

本研究課題の目的は、音声言語理解において、信号処理から意味理解、ユーザモデルまでの各層の実際的な関係や統計的性質を明らかにし、それに基づいて処理を確率的に密統合することで、より高度かつ柔軟な音声言語処理と、高度な音声言語インタフェースを実現することである。
H22年度は、初年度の成果をもとに、各層における確率的な制約表現方法、ならびに他層との接続に関する研究を遂行した。1)制約条件の調査では、昨年度の討議をもとに、各層ごとのモデルユニットについて討議を行った。また、言語情報と認識処理の融合の一つとして、辞書情報に基づいて認識結果を早期確定する手法を検証・評価した。2)言語モデルについては、言語・発音モデルの統計的変換手法を探索過程へ動的に組み込む方法について検討した。また言語モデルの話題依存性、タスク適応、効率的なワードスポッティング手法についても研究した。3)ベイズリスク最少化深索においては、音声認識エンジンJuliusへ手法の組み込みを行い、それに基づく情報検索システムを試作して評価を行った。4)音響モデルについては、多様な話者層や言語に対応する音声認識システムの構築を通じて音響モデルの多様性を検証するとともに、様々な特徴量やモデルパラメータの動的な制御について調査した。5)データ収集用音声対話システムについては、音声対話システムを用いた自然な対話発声データの大規模収集のためのシステムの開発と改善を行っており、プロトタイプを完成させつつある。6)統計的ユーザモデル及び統計的対話モデルについては、対話制御の効率的な統計的モデル化の検討を行うとともに、目標である他層情報との密結合の試行として、発語行為(音声の発話タイミング)を対話制御に直接反映させてモデル化する手法を検討し、評価した。

  • 研究成果

    (17件)

すべて 2011 2010

すべて 雑誌論文 (6件) (うち査読あり 2件) 学会発表 (11件)

  • [雑誌論文] Statistical transformation of language and pronunciation models for spontaneous speech recognition2010

    • 著者名/発表者名
      Yuya Akita
    • 雑誌名

      IEEE Trans.Audio, Speech & Language Process.

      巻: 18(6) ページ: 1539-1549

    • 査読あり
  • [雑誌論文] An Efficient Prosody Adaptation Method and Its Application to HMM-based Speech Synthesis2010

    • 著者名/発表者名
      Hosana Kamiyama, Takahiro Shinozaki, Koji Iwano, Sadaoki Furui
    • 雑誌名

      Proc.Asia-Pacific Signal and Information Processing Association(APSIPA)

      巻: 1 ページ: 82-85

    • 査読あり
  • [雑誌論文] 単語亜要度を用いたN-gram補完手法が与える音声認識性能の調査2010

    • 著者名/発表者名
      島田敏明, 西村竜一, 河原英紀, 入野俊夫
    • 雑誌名

      情報処理学会研究報告

      巻: 2010-SLP-82(19) ページ: 1-6

  • [雑誌論文] 発語行為レベルの情報を活用した音声対話システムの研究2010

    • 著者名/発表者名
      駒谷和範, 松山匡子, 奥乃博
    • 雑誌名

      人工知能学会研究会資料

      巻: SIG-SLUD-B002-12 ページ: 53-58

  • [雑誌論文] 連続単語認識における認識結果の逐次早期確定アルゴリズムの評価2010

    • 著者名/発表者名
      大野博之, 小島弘, 南角吉彦, 李晃伸, 徳田恵一
    • 雑誌名

      電子情報通信学会技術研究報告

      巻: 110 ページ: 77-82

  • [雑誌論文] 音声対話システムのための複数キーワードの共起制約に基づくスポッティングアルゴリズムの評価2010

    • 著者名/発表者名
      加藤杏樹, 南角吉彦, 李晃伸, 徳田恵一
    • 雑誌名

      電子情報通信学会技術研究報告

      巻: 110 ページ: 25-30

  • [学会発表] 双方向探索に基づくN-gramを用いたキーワードからの文生成2011

    • 著者名/発表者名
      平野隆司, 南角吉彦, 李晃伸, 徳田恵一
    • 学会等名
      日本音響学会2011年春季研究発表会
    • 発表場所
      早稲田大学(東京都)
    • 年月日
      2011-03-10
  • [学会発表] クロス言語検索を用いた中国語音声認識による乗換案内システム2011

    • 著者名/発表者名
      張〓, 大西翼, 篠崎隆宏, 古井貞熙
    • 学会等名
      日本音響学会2011年春季講演論文集
    • 発表場所
      早稲田大学(東京都)
    • 年月日
      2011-03-10
  • [学会発表] ウェブを用いたトピック関連N-gramエントリ抽出手法の検討2011

    • 著者名/発表者名
      島田敏明
    • 学会等名
      日本音響学会2011年春季研究発表会
    • 発表場所
      早稲田大学(東京都)
    • 年月日
      2011-03-10
  • [学会発表] 実環境発話を用いた子ども判別アルゴリズムの検討2011

    • 著者名/発表者名
      宮森翔子
    • 学会等名
      日本音響学会2011年春季研究発表会
    • 発表場所
      早稲田大学(東京都)
    • 年月日
      2011-03-10
  • [学会発表] 音声対話システムの応答における親密度と情報最に着目した心的負担に関する分析2011

    • 著者名/発表者名
      芦沢卓也, 西田昌史, 山本誠一
    • 学会等名
      情報処理学会第73回全国大会
    • 発表場所
      東京工業大学大岡山キャンパス(東京都)
    • 年月日
      2011-03-03
  • [学会発表] 音声認識エンジンJuliusへの認識誤り最小化機能の実装-賢い音声認識を目指して2010

    • 著者名/発表者名
      吉谷遼, 南條浩輝
    • 学会等名
      日本音響学会関西支部第13回関西支部若手研究者交流研究発表会
    • 発表場所
      同志社大学室町キャンパス寒梅館(京都府)
    • 年月日
      2010-12-05
  • [学会発表] 実環境発話を入力とする子ども利用者判別技術の開発2010

    • 著者名/発表者名
      宮森翔子
    • 学会等名
      日本ロボット学会第28回学術講演会
    • 発表場所
      名古屋工業大学(愛知県)
    • 年月日
      2010-09-22
  • [学会発表] ウェブ収集発話に基づく子ども向け対話インタフェースの開発2010

    • 著者名/発表者名
      宮森翔子
    • 学会等名
      日本音響学会2010年秋季研究発表会
    • 発表場所
      関西大学(大阪府)
    • 年月日
      2010-09-16
  • [学会発表] 講演発話を用いたN-gram補完手法の音声認識性能評価2010

    • 著者名/発表者名
      島田敏明
    • 学会等名
      日本音響学会2010年秋季研究発表会
    • 発表場所
      関西大学(大阪府)
    • 年月日
      2010-09-14
  • [学会発表] 音声ウェブシステムを用いて収集した実環境子供発話に関する調査2010

    • 著者名/発表者名
      栗原理紗
    • 学会等名
      FIT2010第9回情報科学技術フォーラム
    • 発表場所
      九州大学(福岡県)
    • 年月日
      2010-09-07
  • [学会発表] ちょっとした一言の音声認識による子ども利用者判別法の検討2010

    • 著者名/発表者名
      宮森翔子
    • 学会等名
      FIT2010第9回情報科学技術フォーラム
    • 発表場所
      九州大学(福岡県)
    • 年月日
      2010-09-07

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi