1999 Fiscal Year Annual Research Report
キーワード検出に基づく音声データの話題セグメンテーション
Project/Area Number |
10680415
|
Research Institution | Ritsumeikan University |
Principal Investigator |
山下 洋一 立命館大学, 理工学部, 助教授 (80174689)
|
Keywords | 話題決定 / ワードスポッティング / 湧き出し誤り / ニュース音声 / シミュレーション |
Research Abstract |
大量のニュース音声データベースからある特定の話題に関するニュースのみを検索しその情報を得るようにするにはニュース音声に対する話題インデキシングの技術が必要になる。本研究ではニュース音声に対しキーワードスポッティングに基づいた話題のインデキシングを行った。まず話題との相互情報量、単語長を選出基準として、話題の同定に貢献する名詞3000単語をキーワードとして選出した。このキーワードの話題に関する条件付き確率を基にテキストベース上で記事ごとに話題同定の実験を行ったところ約76%の記事を正しく同定することができた。さらにニュース音声に対しスポッティングを行い、抽出されたキーワードの音韻スコアと条件付き確率を基にして話題ごとに「話題の確からしさ」の計算を行い、話題同定を行った。正しい話題が話題同定結果の上位3位以内に含まれていれば正解分類とした場合、約66.5%の記事の話題を正しく同定することができた。 ワードスポッティングにおける単語の検出精度を予測する手法を提案し、単語音素長による予測と比較した。言語モデルに基づいて生成した音素列に対する音声認識シミュレーションによって、湧き出し誤りおよび正しい単語検出を予測する。湧き出し誤りの予測では、単語の音素長を用いるよりシミュレーションに基づいて計算された尺度の方が強い相関を示し、予測がうまくいくことを明らかにした。一方、正しい単語検出の予測では、単語の音素長を用いる方が単語のスコアとの相関が大きく、検出制度の予測に改善の余地が残された。さらに、湧き出し誤りのスコア予測の結果をスポッティングにおけるスコア正規化に利用し、従来の方法よりも高いFOM値を得た。
|
Research Products
(2 results)
-
[Publications] 山下 洋一: "スポッティングにおける湧き出し予測のための音声認識シミュレーション"日本音響学会春季講演論文集. 163-164 (1999)
-
[Publications] Yoichi Yamashita: "Prediction of Keyword Spotting Accuracy Based on Simulation"Proc. of Eurospeech '99. 3. 1235-1238 (1999)