2010 Fiscal Year Annual Research Report

多層モデルの階層間密統合に基づく音声理解フレームワークの研究

Research Project

Project/Area Number	21300066
Research Institution	Nagoya Institute of Technology
Principal Investigator	李晃伸名古屋工業大学, 大学院・工学研究科, 准教授 (80332766)
Co-Investigator(Kenkyū-buntansha)	秋田祐哉京都大学, 学術情報メディアセンター, 助教 (90402742) 駒谷和範名古屋大学, 工学研究科, 准助教 (40362579) 西村竜一和歌山大学, システム工学部, 助教 (00379611) 篠崎隆宏千葉大学, 融合科学研究科, 助教 (80447903) 西田昌史同志社大学, 理工学部, 准助教 (80361442) 南條浩輝龍谷大学, 理工学部, 助教 (50388162)
Keywords	音声言語理解 / 音声対話 / 音声認識
Research Abstract	本研究課題の目的は、音声言語理解において、信号処理から意味理解、ユーザモデルまでの各層の実際的な関係や統計的性質を明らかにし、それに基づいて処理を確率的に密統合することで、より高度かつ柔軟な音声言語処理と、高度な音声言語インタフェースを実現することである。 H22年度は、初年度の成果をもとに、各層における確率的な制約表現方法、ならびに他層との接続に関する研究を遂行した。1)制約条件の調査では、昨年度の討議をもとに、各層ごとのモデルユニットについて討議を行った。また、言語情報と認識処理の融合の一つとして、辞書情報に基づいて認識結果を早期確定する手法を検証・評価した。2)言語モデルについては、言語・発音モデルの統計的変換手法を探索過程へ動的に組み込む方法について検討した。また言語モデルの話題依存性、タスク適応、効率的なワードスポッティング手法についても研究した。3)ベイズリスク最少化深索においては、音声認識エンジンJuliusへ手法の組み込みを行い、それに基づく情報検索システムを試作して評価を行った。4)音響モデルについては、多様な話者層や言語に対応する音声認識システムの構築を通じて音響モデルの多様性を検証するとともに、様々な特徴量やモデルパラメータの動的な制御について調査した。5)データ収集用音声対話システムについては、音声対話システムを用いた自然な対話発声データの大規模収集のためのシステムの開発と改善を行っており、プロトタイプを完成させつつある。6)統計的ユーザモデル及び統計的対話モデルについては、対話制御の効率的な統計的モデル化の検討を行うとともに、目標である他層情報との密結合の試行として、発語行為(音声の発話タイミング)を対話制御に直接反映させてモデル化する手法を検討し、評価した。

Research Products
(17 results)

All 2011 2010

All Journal Article (6 results) (of which Peer Reviewed: 2 results) Presentation (11 results)

[Journal Article] Statistical transformation of language and pronunciation models for spontaneous speech recognition2010
- Author(s)
  Yuya Akita
- Journal Title
  
  IEEE Trans.Audio, Speech & Language Process.
  
  Volume: 18(6) Pages: 1539-1549
- Peer Reviewed
[Journal Article] An Efficient Prosody Adaptation Method and Its Application to HMM-based Speech Synthesis2010
- Author(s)
  Hosana Kamiyama, Takahiro Shinozaki, Koji Iwano, Sadaoki Furui
- Journal Title
  
  Proc.Asia-Pacific Signal and Information Processing Association(APSIPA)
  
  Volume: 1 Pages: 82-85
- Peer Reviewed
[Journal Article] 単語亜要度を用いたN-gram補完手法が与える音声認識性能の調査2010
- Author(s)
  島田敏明, 西村竜一, 河原英紀, 入野俊夫
- Journal Title
  
  情報処理学会研究報告
  
  Volume: 2010-SLP-82(19) Pages: 1-6
[Journal Article] 発語行為レベルの情報を活用した音声対話システムの研究2010
- Author(s)
  駒谷和範, 松山匡子, 奥乃博
- Journal Title
  
  人工知能学会研究会資料
  
  Volume: SIG-SLUD-B002-12 Pages: 53-58
[Journal Article] 連続単語認識における認識結果の逐次早期確定アルゴリズムの評価2010
- Author(s)
  大野博之, 小島弘, 南角吉彦, 李晃伸, 徳田恵一
- Journal Title
  
  電子情報通信学会技術研究報告
  
  Volume: 110 Pages: 77-82
[Journal Article] 音声対話システムのための複数キーワードの共起制約に基づくスポッティングアルゴリズムの評価2010
- Author(s)
  加藤杏樹, 南角吉彦, 李晃伸, 徳田恵一
- Journal Title
  
  電子情報通信学会技術研究報告
  
  Volume: 110 Pages: 25-30
[Presentation] 双方向探索に基づくN-gramを用いたキーワードからの文生成2011
- Author(s)
  平野隆司, 南角吉彦, 李晃伸, 徳田恵一
- Organizer
  日本音響学会2011年春季研究発表会
- Place of Presentation
  早稲田大学(東京都)
- Year and Date
  2011-03-10
[Presentation] クロス言語検索を用いた中国語音声認識による乗換案内システム2011
- Author(s)
  張〓, 大西翼, 篠崎隆宏, 古井貞熙
- Organizer
  日本音響学会2011年春季講演論文集
- Place of Presentation
  早稲田大学(東京都)
- Year and Date
  2011-03-10
[Presentation] ウェブを用いたトピック関連N-gramエントリ抽出手法の検討2011
- Author(s)
  島田敏明
- Organizer
  日本音響学会2011年春季研究発表会
- Place of Presentation
  早稲田大学(東京都)
- Year and Date
  2011-03-10
[Presentation] 実環境発話を用いた子ども判別アルゴリズムの検討2011
- Author(s)
  宮森翔子
- Organizer
  日本音響学会2011年春季研究発表会
- Place of Presentation
  早稲田大学(東京都)
- Year and Date
  2011-03-10
[Presentation] 音声対話システムの応答における親密度と情報最に着目した心的負担に関する分析2011
- Author(s)
  芦沢卓也, 西田昌史, 山本誠一
- Organizer
  情報処理学会第73回全国大会
- Place of Presentation
  東京工業大学大岡山キャンパス(東京都)
- Year and Date
  2011-03-03
[Presentation] 音声認識エンジンJuliusへの認識誤り最小化機能の実装-賢い音声認識を目指して2010
- Author(s)
  吉谷遼, 南條浩輝
- Organizer
  日本音響学会関西支部第13回関西支部若手研究者交流研究発表会
- Place of Presentation
  同志社大学室町キャンパス寒梅館(京都府)
- Year and Date
  2010-12-05
[Presentation] 実環境発話を入力とする子ども利用者判別技術の開発2010
- Author(s)
  宮森翔子
- Organizer
  日本ロボット学会第28回学術講演会
- Place of Presentation
  名古屋工業大学(愛知県)
- Year and Date
  2010-09-22
[Presentation] ウェブ収集発話に基づく子ども向け対話インタフェースの開発2010
- Author(s)
  宮森翔子
- Organizer
  日本音響学会2010年秋季研究発表会
- Place of Presentation
  関西大学(大阪府)
- Year and Date
  2010-09-16
[Presentation] 講演発話を用いたN-gram補完手法の音声認識性能評価2010
- Author(s)
  島田敏明
- Organizer
  日本音響学会2010年秋季研究発表会
- Place of Presentation
  関西大学(大阪府)
- Year and Date
  2010-09-14
[Presentation] 音声ウェブシステムを用いて収集した実環境子供発話に関する調査2010
- Author(s)
  栗原理紗
- Organizer
  FIT2010第9回情報科学技術フォーラム
- Place of Presentation
  九州大学(福岡県)
- Year and Date
  2010-09-07
[Presentation] ちょっとした一言の音声認識による子ども利用者判別法の検討2010
- Author(s)
  宮森翔子
- Organizer
  FIT2010第9回情報科学技術フォーラム
- Place of Presentation
  九州大学(福岡県)
- Year and Date
  2010-09-07

2010 Fiscal Year Annual Research Report

多層モデルの階層間密統合に基づく音声理解フレームワークの研究

Principal Investigator

李 晃伸 名古屋工業大学, 大学院・工学研究科, 准教授 (80332766)

Research Products

[Journal Article] Statistical transformation of language and pronunciation models for spontaneous speech recognition2010

Author(s)

Journal Title

[Journal Article] An Efficient Prosody Adaptation Method and Its Application to HMM-based Speech Synthesis2010

Author(s)

Journal Title

[Journal Article] 単語亜要度を用いたN-gram補完手法が与える音声認識性能の調査2010

Author(s)

Journal Title

[Journal Article] 発語行為レベルの情報を活用した音声対話システムの研究2010

Author(s)

Journal Title

[Journal Article] 連続単語認識における認識結果の逐次早期確定アルゴリズムの評価2010

Author(s)

Journal Title

[Journal Article] 音声対話システムのための複数キーワードの共起制約に基づくスポッティングアルゴリズムの評価2010

Author(s)

Journal Title

[Presentation] 双方向探索に基づくN-gramを用いたキーワードからの文生成2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] クロス言語検索を用いた中国語音声認識による乗換案内システム2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] ウェブを用いたトピック関連N-gramエントリ抽出手法の検討2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 実環境発話を用いた子ども判別アルゴリズムの検討2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 音声対話システムの応答における親密度と情報最に着目した心的負担に関する分析2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 音声認識エンジンJuliusへの認識誤り最小化機能の実装-賢い音声認識を目指して2010

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 実環境発話を入力とする子ども利用者判別技術の開発2010

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] ウェブ収集発話に基づく子ども向け対話インタフェースの開発2010

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 講演発話を用いたN-gram補完手法の音声認識性能評価2010

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 音声ウェブシステムを用いて収集した実環境子供発話に関する調査2010

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] ちょっとした一言の音声認識による子ども利用者判別法の検討2010

Author(s)

Organizer

Place of Presentation

Year and Date

李晃伸名古屋工業大学, 大学院・工学研究科, 准教授 (80332766)