2013 Fiscal Year Annual Research Report

多層モデルの階層間密統合に基づく音声理解フレームワークの研究

Research Project

Project/Area Number	21300066
Research Institution	Nagoya Institute of Technology
Principal Investigator	李晃伸名古屋工業大学, 工学(系)研究科(研究院), 准教授 (80332766)
Co-Investigator(Kenkyū-buntansha)	西村竜一和歌山大学, システム工学部, 助教 (00379611) 駒谷和範名古屋大学, 工学(系)研究科(研究院), 准教授 (40362579) 南條浩輝龍谷大学, 理工学部, 助教 (50388162) 西田昌史同志社大学, 理工学部, 准教授 (80361442) 篠崎隆宏東京工業大学, 総合理工学研究科(研究院), 准教授 (80447903) 秋田祐哉京都大学, 学内共同利用施設等, 助教 (90402742)
Project Period (FY)	2009-04-01 – 2014-03-31
Keywords	音声言語処理 / 音声認識 / 音声対話 / 言語モデル / 対話エージェント
Research Abstract	本研究課題の目標は、音響信号処理から対話モデルまで、音声言語理解における各処理層の統計的性質を明らかにし、それらを密統合することで高度で柔軟な統合的音声対話システムを実現することである。最終年度であるH25年度は、前年度までの成果をもとに実際のタスクを想定した実験評価を行うとともに、統合の基盤となる音声対話ツールキットの構築・拡張、さらに音声インタフェースへの応用について検証を行った。（統合システム）音声対話システム構築ツールキットMMDAgentのアーキテクチャを様々な情報を扱えるよう改善した。また、腕時計型スマートデバイスの検討を行った。（対話エージェント）システムの適応の一つとして、性別や年齢層に応じて対話対象のエージェントを切り替えることで対話が活性化することを検証した。また音声入力を用いるUIデザインの指針をユーザビリティ評価により検討した。（対話管理）ターンテイキングの誤り修復について、昨年度開発した提案手法をMMDAgentのプラグインとして実装し，デモシステムを構築した．さらに機械学習によりそのような修復が必要か否かを高精度に判別する手法を開発した．（音声認識）多層の制約を音声認識に直接組み入れるベイズリスク最小化探索を音声認識エンジンJuliusへ組み込み、層間の統合の基盤を構築した。また、複数認識結果の統合および各単語の誤りリスク自動決定法について研究し、音声ドキュメント検索システムにおいて評価を行った。（音声モデル）ニューラルネットワークを用いた音声モデルについてメモリ量や計算量を削減する手法に取り組み、それらの削減量と認識精度の関係を明らかにした。（言語モデル）対話のコンテキストや話題に適合した言語モデルを構築することを目標としてモデル選択および少量テキストによる自動適応の枠組みを検討した．研究成果の一部は論文およびソフトウェアとして公開されている。
Current Status of Research Progress	Reason 25年度が最終年度であるため、記入しない。
Strategy for Future Research Activity	25年度が最終年度であるため、記入しない。

Research Products
(17 results)

All 2014 2013

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (15 results) (of which Invited: 3 results)

[Journal Article] オープンソース音声認識エンジンJuliusへのベイズリスク最小化機能の実装と評価2013
- Author(s)
  南條浩輝，古谷遼，西田昌史
- Journal Title
  
  電子情報通信学会論文誌
  
  Volume: Vol.J96-D, No.10 Pages: 2530-2539
- Peer Reviewed
[Journal Article] 音声入力型情報検索におけるベイズリスク最小化音声認識のための単語重要度の自動推定2013
- Author(s)
  古谷遼，七里崇，南條浩輝
- Journal Title
  
  情報処理学会論文誌
  
  Volume: Vol.54, No.7 Pages: 1967-1977
- Peer Reviewed
[Presentation] 腕時計型スマートデバイスにおける音声GUIの有効性の検討2014
- Author(s)
  山本宗典，篠崎隆宏，堀内靖雄，黒岩眞吾
- Organizer
  日本音響学会 2014 年春季研究発表会
- Place of Presentation
  日本大学理工学部　駿河台キャンパス
- Year and Date
  20140310-20140312
[Presentation] 日本語スピーキングテストS-CATの音声入力インタフェース設計2014
- Author(s)
  田藤千弘, 西村竜一, 河原英紀, 入野俊夫, 今井新悟
- Organizer
  日本音響学会2014年度春季研究発表会
- Place of Presentation
  日本大学理工学部　駿河台キャンパス
- Year and Date
  20140310-20140312
[Presentation] 条件付き確率場に基づく仮説の逐次早期確定を用いた低遅延音声インタフェース2014
- Author(s)
  伊神陽介，李晃伸，徳田恵一，南角吉彦.
- Organizer
  日本音響学会2014年春季研究発表会
- Place of Presentation
  日本大学理工学部　駿河台キャンパス
- Year and Date
  20140310-20140312
[Presentation] 音声発話の誤分割修復のための修復必要性の判定2014
- Author(s)
  堀田尚希，駒谷和範，佐藤理史，中野幹生
- Organizer
  第70回言語・音声理解と対話処理研究会(SIG-SLUD)
- Place of Presentation
  情報通信研究機構本部
- Year and Date
  20140305-20140305
[Presentation] テーマセッション："「音声認識」は今後こうなる！,"2014
- Author(s)
  篠崎隆宏
- Organizer
  SIG-SLP第100回記念シンポジウム
- Place of Presentation
  伊豆長岡温泉ホテルサンバレー富士見
- Year and Date
  20140131-20140201
- Invited
[Presentation] テーマセッション「音声応用は今後こうなる！」2014
- Author(s)
  李晃伸
- Organizer
  SIG-SLP第100回記念シンポジウム
- Place of Presentation
  伊豆長岡温泉ホテルサンバレー富士見
- Year and Date
  20140131-20140201
- Invited
[Presentation] Hierarchical Utterance Understanding for Robust Human-Robot Spoken Dialogues2014
- Author(s)
  Kazunori Komatani
- Organizer
  International Workshop on Spoken Dialogue Systems (IWSDS2014)
- Place of Presentation
  Napa, CA, USA
- Year and Date
  20140118-20140120
- Invited
[Presentation] Restoring Incorrectly Segmented Keywords and Turn-Taking Caused by Short Pauses2014
- Author(s)
  Kazunori Komatani, Naoki Hotta, Satoshi Sato
- Organizer
  International Workshop on Spoken Dialogue Systems (IWSDS2014)
- Place of Presentation
  Napa, CA, USA
- Year and Date
  20140118-20140120
[Presentation] 音声入力による音声ドキュメント検索における単語重要度を考慮したベイズリスク最小化音声認識2013
- Author(s)
  志々見亮, 西田昌史, 古谷遼, 南條浩輝, 山本誠一
- Organizer
  情報処理学会第99回音声言語情報処理研究会
- Place of Presentation
  筑波大学文京キャンパス
- Year and Date
  20131219-20131220
[Presentation] ベイズリスク最小化音声認識を適用した音声入力型音声ドキュメント検索2013
- Author(s)
  志々見亮，西田昌史，南條浩輝，山本誠一
- Organizer
  日本音響学会研究発表会
- Place of Presentation
  豊橋技術科学大学
- Year and Date
  20130925-20130927
[Presentation] 音声認識を用いたオンライン自動字幕作成・編集システム2013
- Author(s)
  秋田祐哉, 河原達也
- Organizer
  日本音響学会秋季研究発表会
- Place of Presentation
  豊橋技術科学大学
- Year and Date
  20130925-20130927
[Presentation] 基本周波数操作による音声の好感度改善に関連する物理的特徴の検討2013
- Author(s)
  吉元照貴, 西村竜一, 入野俊夫, 河原英紀
- Organizer
  日本音響学会2013年度秋季研究発表会
- Place of Presentation
  豊橋技術科学大学
- Year and Date
  20130925-20130927
[Presentation] ベイズリスク最小化音声認識の複数仮説を用いた音声検索2013
- Author(s)
  南條浩輝, 古谷遼
- Organizer
  情報処理学会第97回音声言語情報処理研究会
- Place of Presentation
  遠刈田温泉壮鳳
- Year and Date
  20130725-20130727
[Presentation] MMDAgent --- A Fully Open-Source Toolkit for Voice Interaction Systems2013
- Author(s)
  Akinobu Lee, Keiichiro Oura, Keiichi Tokuda
- Organizer
  IEEE ICASSP2013
- Place of Presentation
  Vancouver, BC, Canada
- Year and Date
  20130526-20130531
[Presentation] ユーザ発話の誤分割に起因する問題を事後的に修復する音声対話システム2013
- Author(s)
  堀田尚希，駒谷和範，佐藤理史：
- Organizer
  情報処理学会第96回音声言語情報処理研究会
- Place of Presentation
  北陸先端科学技術大学院大学東京サテライト
- Year and Date
  20130523-20130524

2013 Fiscal Year Annual Research Report

多層モデルの階層間密統合に基づく音声理解フレームワークの研究

Principal Investigator

李 晃伸 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (80332766)

Reason

Research Products

[Journal Article] オープンソース音声認識エンジンJuliusへのベイズリスク最小化機能の実装と評価2013

Author(s)

Journal Title

[Journal Article] 音声入力型情報検索におけるベイズリスク最小化音声認識のための単語重要度の自動推定2013

Author(s)

Journal Title

[Presentation] 腕時計型スマートデバイスにおける音声GUIの有効性の検討2014

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 日本語スピーキングテストS-CATの音声入力インタフェース設計2014

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 条件付き確率場に基づく仮説の逐次早期確定を用いた低遅延音声インタフェース2014

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 音声発話の誤分割修復のための修復必要性の判定2014

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] テーマセッション："「音声認識」は今後こうなる！,"2014

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] テーマセッション「音声応用は今後こうなる！」2014

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Hierarchical Utterance Understanding for Robust Human-Robot Spoken Dialogues2014

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Restoring Incorrectly Segmented Keywords and Turn-Taking Caused by Short Pauses2014

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 音声入力による音声ドキュメント検索における単語重要度を考慮したベイズリスク最小化音声認識2013

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] ベイズリスク最小化音声認識を適用した音声入力型音声ドキュメント検索2013

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 音声認識を用いたオンライン自動字幕作成・編集システム2013

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 基本周波数操作による音声の好感度改善に関連する物理的特徴の検討2013

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] ベイズリスク最小化音声認識の複数仮説を用いた音声検索2013

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] MMDAgent --- A Fully Open-Source Toolkit for Voice Interaction Systems2013

Author(s)

Organizer

李晃伸名古屋工業大学, 工学(系)研究科(研究院), 准教授 (80332766)