• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2007 年度 実績報告書

多レベルの学習機能を有する音声対話システムの研究

研究課題

研究課題/領域番号 19500147
研究機関京都工芸繊維大学

研究代表者

荒木 雅弘  京都工芸繊維大学, 工芸科学研究科, 准教授 (50252490)

キーワード音声対話システム / ユーザ適応 / 音響モデル / 言語モデル / 意味解析 / 対話管理
研究概要

本研究は、音響モデル・言語モデル・意味解析規則・対話戦略・ユーザモデル・文生成など、音声対話システムにおける様々な知識源をユーザに適応させる手法の開発を目的として行った。本年度は各モジュールでカスタマイズ可能な音声対話システムのフレームワークを実装し、音響・言語モデルのログからの学習を実現した。また、あるレベルの学習結果を他のレベルの学習に利用する方式の検討を行った。
1. 学習可能なフレームワークに関しては、情報処理学会試行標準ワーキンググループの提案するアーキテクチャに基づいて実装を行った。
2. 各モジュールでの学習機能の実現については、以下のとおりである。
(1)音響モデル:対話の進行に伴って収集される音声ログを適応用データとして、隠れマルコフモデル構築ツールキットHTKを用いて、MLLRによる話者適応を行い、認識率の向上を確認した。
(2)言語モデル:新聞記事モデルから生成したコーパスと、認識結果ログ(文法を用いたものとディクテーションを用いたものの両方)を重み付きで結合したものから言語モデルを学習することによって、認識率が向上することを確認した。
3. 他のレベルの情報の利用法については、意味解析にオントロジーを用いた場合に、その出現頻度に応じて言語モデルのパラメータを変化させる方式や、対話処理におけるユーザに適応した主導権の選択に応じて、出現するユーザ発話に適した意味解析規則・言語モデルのチューニングについて、その実現方法を示した。

  • 研究成果

    (5件)

すべて 2008 2007 その他

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (2件) 備考 (1件)

  • [雑誌論文] Filling the gap between a large-scale database and multimodal interactions2008

    • 著者名/発表者名
      M. Araki
    • 雑誌名

      Lecture Note in Computer Science 4938

      ページ: 179-185

    • 査読あり
  • [雑誌論文] Proposal of a Markup Language for Multimodal Semantic Interaction2007

    • 著者名/発表者名
      M. Araki
    • 雑誌名

      Proceedings of Workshop on Multimodal Interfaces in Semantic Interaction

      ページ: 58-62

    • 査読あり
  • [学会発表] 音声対話システムにおけるユーザ適応技術の統合手法の提案2007

    • 著者名/発表者名
      守時 理裕
    • 学会等名
      人工知能学会 言語・音声理解と対話処理研究会
    • 発表場所
      関西学院大学 大阪梅田キャンパス
    • 年月日
      2007-11-12
  • [学会発表] マルチモーダル対話システムのための階層的アーキテクチャの提案2007

    • 著者名/発表者名
      荒木 雅弘
    • 学会等名
      情報処理学会 音声言語情報処理研究会
    • 発表場所
      早稲田大学
    • 年月日
      2007-10-19
  • [備考]

    • URL

      http://www.ii.is.kit.ac.jp/araki/research/index.html

URL: 

公開日: 2010-02-04   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi