• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Annual Research Report

多層モデルの階層間密統合に基づく音声理解フレームワークの研究

Research Project

Project/Area Number 21300066
Research InstitutionNagoya Institute of Technology

Principal Investigator

李 晃伸  名古屋工業大学, 工学(系)研究科(研究院), 准教授 (80332766)

Co-Investigator(Kenkyū-buntansha) 西村 竜一  和歌山大学, システム工学部, 助教 (00379611)
駒谷 和範  名古屋大学, 工学(系)研究科(研究院), 准教授 (40362579)
南條 浩輝  龍谷大学, 理工学部, 助教 (50388162)
西田 昌史  同志社大学, 理工学部, 准教授 (80361442)
篠崎 隆宏  東京工業大学, 総合理工学研究科(研究院), 准教授 (80447903)
秋田 祐哉  京都大学, 学内共同利用施設等, 助教 (90402742)
Project Period (FY) 2009-04-01 – 2014-03-31
Keywords音声言語処理 / 音声認識 / 音声対話 / 言語モデル / 対話エージェント
Research Abstract

本研究課題の目標は、音響信号処理から対話モデルまで、音声言語理解における各処理層の統計的性質を明らかにし、それらを密統合することで高度で柔軟な統合的音声対話システムを実現することである。最終年度であるH25年度は、前年度までの成果をもとに実際のタスクを想定した実験評価を行うとともに、統合の基盤となる音声対話ツールキットの構築・拡張、さらに音声インタフェースへの応用について検証を行った。(統合システム)音声対話システム構築ツールキットMMDAgentのアーキテクチャを様々な情報を扱えるよう改善した。また、腕時計型スマートデバイスの検討を行った。(対話エージェント)システムの適応の一つとして、性別や年齢層に応じて対話対象のエージェントを切り替えることで対話が活性化することを検証した。また音声入力を用いるUIデザインの指針をユーザビリティ評価により検討した。(対話管理)ターンテイキングの誤り修復について、昨年度開発した提案手法をMMDAgentのプラグインとして実装し,デモシステムを構築した.さらに機械学習によりそのような修復が必要か否かを高精度に判別する手法を開発した.(音声認識)多層の制約を音声認識に直接組み入れるベイズリスク最小化探索を音声認識エンジンJuliusへ組み込み、層間の統合の基盤を構築した。また、複数認識結果の統合および各単語の誤りリスク自動決定法について研究し、音声ドキュメント検索システムにおいて評価を行った。(音声モデル)ニューラルネットワークを用いた音声モデルについてメモリ量や計算量を削減する手法に取り組み、それらの削減量と認識精度の関係を明らかにした。(言語モデル)対話のコンテキストや話題に適合した言語モデルを構築することを目標としてモデル選択および少量テキストによる自動適応の枠組みを検討した.研究成果の一部は論文およびソフトウェアとして公開されている。

Current Status of Research Progress
Reason

25年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

25年度が最終年度であるため、記入しない。

  • Research Products

    (17 results)

All 2014 2013

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (15 results) (of which Invited: 3 results)

  • [Journal Article] オープンソース音声認識エンジンJuliusへのベイズリスク最小化機能の実装と評価2013

    • Author(s)
      南條浩輝,古谷遼,西田昌史
    • Journal Title

      電子情報通信学会論文誌

      Volume: Vol.J96-D, No.10 Pages: 2530-2539

    • Peer Reviewed
  • [Journal Article] 音声入力型情報検索におけるベイズリスク最小化音声認識のための単語重要度の自動推定2013

    • Author(s)
      古谷遼,七里崇,南條浩輝
    • Journal Title

      情報処理学会論文誌

      Volume: Vol.54, No.7 Pages: 1967-1977

    • Peer Reviewed
  • [Presentation] 腕時計型スマートデバイスにおける音声GUIの有効性の検討2014

    • Author(s)
      山本 宗典,篠崎 隆宏,堀内 靖雄,黒岩 眞吾
    • Organizer
      日本音響学会 2014 年春季研究発表会
    • Place of Presentation
      日本大学理工学部 駿河台キャンパス
    • Year and Date
      20140310-20140312
  • [Presentation] 日本語スピーキングテストS-CATの音声入力インタフェース設計2014

    • Author(s)
      田藤千弘, 西村竜一, 河原英紀, 入野俊夫, 今井新悟
    • Organizer
      日本音響学会2014年度春季研究発表会
    • Place of Presentation
      日本大学理工学部 駿河台キャンパス
    • Year and Date
      20140310-20140312
  • [Presentation] 条件付き確率場に基づく仮説の逐次早期確定を用いた低遅延音声インタフェース2014

    • Author(s)
      伊神 陽介,李 晃伸,徳田 恵一,南角 吉彦.
    • Organizer
      日本音響学会2014年春季研究発表会
    • Place of Presentation
      日本大学理工学部 駿河台キャンパス
    • Year and Date
      20140310-20140312
  • [Presentation] 音声発話の誤分割修復のための修復必要性の判定2014

    • Author(s)
      堀田 尚希,駒谷 和範,佐藤 理史,中野 幹生
    • Organizer
      第70回 言語・音声理解と対話処理研究会(SIG-SLUD)
    • Place of Presentation
      情報通信研究機構本部
    • Year and Date
      20140305-20140305
  • [Presentation] テーマセッション:"「音声認識」は今後こうなる!,"2014

    • Author(s)
      篠崎隆宏
    • Organizer
      SIG-SLP第100回記念シンポジウム
    • Place of Presentation
      伊豆長岡温泉 ホテルサンバレー富士見
    • Year and Date
      20140131-20140201
    • Invited
  • [Presentation] テーマセッション「音声応用は今後こうなる!」2014

    • Author(s)
      李晃伸
    • Organizer
      SIG-SLP第100回記念シンポジウム
    • Place of Presentation
      伊豆長岡温泉 ホテルサンバレー富士見
    • Year and Date
      20140131-20140201
    • Invited
  • [Presentation] Hierarchical Utterance Understanding for Robust Human-Robot Spoken Dialogues2014

    • Author(s)
      Kazunori Komatani
    • Organizer
      International Workshop on Spoken Dialogue Systems (IWSDS2014)
    • Place of Presentation
      Napa, CA, USA
    • Year and Date
      20140118-20140120
    • Invited
  • [Presentation] Restoring Incorrectly Segmented Keywords and Turn-Taking Caused by Short Pauses2014

    • Author(s)
      Kazunori Komatani, Naoki Hotta, Satoshi Sato
    • Organizer
      International Workshop on Spoken Dialogue Systems (IWSDS2014)
    • Place of Presentation
      Napa, CA, USA
    • Year and Date
      20140118-20140120
  • [Presentation] 音声入力による音声ドキュメント検索における単語重要度を考慮したベイズリスク最小化音声認識2013

    • Author(s)
      志々見亮, 西田昌史, 古谷遼, 南條浩輝, 山本誠一
    • Organizer
      情報処理学会 第99回 音声言語情報処理研究会
    • Place of Presentation
      筑波大学文京キャンパス
    • Year and Date
      20131219-20131220
  • [Presentation] ベイズリスク最小化音声認識を適用した音声入力型音声ドキュメント検索2013

    • Author(s)
      志々見亮,西田昌史,南條浩輝,山本 誠一
    • Organizer
      日本音響学会研究発表会
    • Place of Presentation
      豊橋技術科学大学
    • Year and Date
      20130925-20130927
  • [Presentation] 音声認識を用いたオンライン自動字幕作成・編集システム2013

    • Author(s)
      秋田祐哉, 河原達也
    • Organizer
      日本音響学会秋季研究発表会
    • Place of Presentation
      豊橋技術科学大学
    • Year and Date
      20130925-20130927
  • [Presentation] 基本周波数操作による音声の好感度改善に関連する物理的特徴の検討2013

    • Author(s)
      吉元照貴, 西村竜一, 入野俊夫, 河原英紀
    • Organizer
      日本音響学会2013年度秋季研究発表会
    • Place of Presentation
      豊橋技術科学大学
    • Year and Date
      20130925-20130927
  • [Presentation] ベイズリスク最小化音声認識の複数仮説を用いた音声検索2013

    • Author(s)
      南條浩輝, 古谷遼
    • Organizer
      情報処理学会 第97回 音声言語情報処理研究会
    • Place of Presentation
      遠刈田温泉 壮鳳
    • Year and Date
      20130725-20130727
  • [Presentation] MMDAgent --- A Fully Open-Source Toolkit for Voice Interaction Systems2013

    • Author(s)
      Akinobu Lee, Keiichiro Oura, Keiichi Tokuda
    • Organizer
      IEEE ICASSP2013
    • Place of Presentation
      Vancouver, BC, Canada
    • Year and Date
      20130526-20130531
  • [Presentation] ユーザ発話の誤分割に起因する問題を事後的に修復する音声対話システム2013

    • Author(s)
      堀田 尚希,駒谷 和範,佐藤 理史:
    • Organizer
      情報処理学会第96回音声言語情報処理研究会
    • Place of Presentation
      北陸先端科学技術大学院大学 東京サテライト
    • Year and Date
      20130523-20130524

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi