1995 Fiscal Year Annual Research Report
音素・単語・フレーズの同時スポッティングによる対話音声の解析評価
Project/Area Number |
07221216
|
Research Institution | Ryukoku University |
Principal Investigator |
有木 康夫 龍谷大学, 理工学部, 教授 (10135519)
|
Keywords | 対話音声 / 単語スポッティング / 音素認識 |
Research Abstract |
人間が音声を聞き取り内容を理解する場合には、文のレベルで常に聞いているのではなく、音素、単語、フレーズ、文といった階層を選択していると考えられる。人間と機械の音声対話においても、文レベルで完全に解析するのではなく、解析できるところだけを解析して繋ぎ合わせ意味を補完する方法は、対話の文法が完全ではないので、有効でありかつ実現可能な方法と考えられる。解析可能な単位としては、単語、フレーズ、部分文を考えることができるが、本研究では、単語・フレーズに限定して連続音声からこれを抽出(スポッティング)し、対話音声を評価することを目的としている。ワードスポッティングの技術は連続音声から既知語と未知語を判定しながら、既知語のみを抽出する技術である。平成6年度までの研究により、既知語と未知語の判別処理は、「連続音声のある時刻で既知語が終結するという事象の事後確率」を求める処理と等価であることを明らかにしてきた。この事後確率は、連続音声がすべて入力されてから計算されるため、実時間の処理が難しい。本研究では、発話の終了を待つことなく、フレーム同期で既知語の事後確率を計算してワードスポッティングを行う方式について研究した。この方式では、前向き尤度を利用できるため実時間向きのアルゴリズムを実現できる可能性がある。この提案手法を、平成6年度までに研究した方式と比較し、対話音声の解析手法を評価した。また、従来の代表的なワードスポッティング手法であるAT&T, BBN, NECの方式とも比較評価した。
|
-
[Publications] 有木康雄、土井啓輔: "音素HMMの連結学習における学習区間限定の効果" 電子情報通信学会論文誌. J78-D-II. 1733-1740 (1995)
-
[Publications] 田頭茂明、有木康雄: "話者部分空間への写像による話者認識と話者正規化" 電子情報通信学会音声研究会. Sp95-28. 25-32 (1995)
-
[Publications] 田頭茂明、有木康雄: "部分空間射影による話者正規化を用いた不特定話者HMM" 電子情報通信学会研究会. Sp95-98. 31-38 (1995)
-
[Publications] 田頭茂明、有木康雄: "ニュース音声中の語彙反復による情報検索" 情報処理学会音声言語処理研究会. 99-104 (1996)
-
[Publications] 田頭茂明、有木康雄: "話者部分空間への写像に基づく話者正規化の複数話者に対する有効性" 日本音響学会平成7年度秋期研究発表会. 3-2-8. 121-122 (1995)
-
[Publications] 桜井光康、有木康雄: "ビタビ法とフォワード・バックワード法によるキーワードスポッティング" 日本音響学会平成7年度秋期研究発表会. 1-Q-21. 179-180 (1995)