大量のニュース音声データベースからある特定の話題に関するニュースのみを検索しその情報を得るようにするにはニュース音声に対する話題インデキシングの技術が必要になる。本研究では、ニュース音声に対しキーワードスポッティングに基づいた話題のインデキシングを行った。まず話題との相互情報量、単語長を選出基準として、話題の同定に貢献する名詞3000単語をキーワードとして選出した。ニュース音声に対しスポッティングを行い、抽出されたキーワードの音韻スコアと条件付き確率を基にして話題ごとに「話題の確からしさ」の計算を行い、話題同定を行った。正しい話題が話題同定結果の上位3位以内に含まれていれば正解分類とした場合、約66.5%の記事の話題を正しく同定することができた。 音韻的特徴だけでなく基本周波数情報も合わせて利用し入力音声のキーワードらしさを決定する手法を検討した。キーワードの基本周波数パターンをあらかじめテンプレートとして登録しておき、入力音声の基本周波数パタンとDPマッチングによって比較し、得られた非類似度と音韻尤度によってキーワードらしさを測る。ニュース音声を用いた評価実験において、同等の検出率で比較して、30%から 50%の湧き出し誤りを削減することが出来た。 ワードスポッティングにおける単語の検出精度を予測する手法を提案し、単語音素長による予測と比較した。言語モデルに基づいて生成した音素列に対する音声認識シミュレーションによって、湧き出し誤りおよび正しい単語検出を予測する。湧き出し誤りの予測では、単語の音素長を用いるよりシミュレーションに基づいて計算された尺度の方が強い相関を示し、予測がうまくいくことを明らかにした。
|