• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2000 Fiscal Year Annual Research Report

漸次的な音声認識の解探索過程における韻律句境界情報の利用

Research Project

Project/Area Number 12780270
Research InstitutionJapan Advanced Institute of Science and Technology

Principal Investigator

中井 満  北陸先端科学技術大学院大学, 情報科学研究科, 助手 (60283149)

Keywords音声認識 / 韻律 / 漸次的音声認識 / 音声対話 / HMM / アクセント句 / 音韻信頼度 / 音響信頼度
Research Abstract

従来の漸次的な音声対話システムに,アクセト等の韻律情報を加えて,より円滑な音声対話システムの構築について検討を行った.本年度の研究実績は以下の通りである.
1)漸次的な韻律処理部の構築
韻律処理部には先行研究(信学論(A),Vol.J77-A,No.2,pp206-214,1994年2月)のアクセント句境界検出器を応用した.まず,従来のDP整合に代えて,HMM(Hidden Markov Model)を用い,尤度最大基準によって句境界を検出するようにした.また,この検出器から得られる任意の時刻までの句境界仮説を用いて,その時刻における韻律信頼度(句境界らしさ)を定量化し,時間に同期して出力するように改良した.
2)漸次的な音声認識部の構築
任意の時刻における音声認識の進行状況を漸次的にユーザにフィードバックできるような音声認識部を整備した.研究用音声認識エンジンとして,IPA(情報処理振興事業協会)の研究成果物の"julius"を利用し、これを漸次的出力型に改良した.また,音響信頼度(認識の確からしさ)を認識候補の尤度差を用いて,定量化した.
3)音声認識部と韻律処理部の統合
韻律信頼度と音響信頼度の結合関数である総合信頼度を用いて,意味的にまとまりのある時刻(文節,韻律句などの発声直後)で,かつ認識候補が確からしい場合に相槌を打つシステムを構築した.
4)音声資料の収集および評価
発声が明瞭な音声として,ATR日本語連続音声データベース・セットBを用い,また漸次的理解や相槌挿入に適した音声として,対話型の音声を新たに録音収集し,評価を行った.韻律の寄与の度合によって,相槌を打つ頻度およびタイミングが制御できる事を示した.

  • Research Products

    (3 results)

All Other

All Publications (3 results)

  • [Publications] 山崎義人,中井満,下平博,嵯峨山茂樹: "音声対話における音響・韻律信頼度を用いた応答タイミング制御の検討"日本音響学会2001年春季研究発表会講演論文集. (2001)

  • [Publications] 川本真一,山崎義人,高坂大輔,坂井伸圭,田村紗雪,松下善則,中井満,下平博,嵯峨山茂樹: "声の好みによって確率的に振舞が変化する擬人化対話エージェント"Interaction 2001. (2001)

  • [Publications] 山崎義人,中井満,下平博,嵯峨山茂樹: "韻律信頼度を用いた漸次的音声認識出力の検討"平成12年電気関係学会北陸支部大会講演論文集. 458 (2000)

URL: 

Published: 2002-04-03   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi