1998 Fiscal Year Annual Research Report
キーワード検出に基づく音声データの話題セグメンテーション
Project/Area Number |
10680415
|
Research Institution | Ritsumeikan University |
Principal Investigator |
山下 洋一 立命館大学, 理工学部, 助教授 (80174689)
|
Keywords | キーワードスポッティング / シミュレーション / 音声認識 / DPマッチング / 湧き出し誤り |
Research Abstract |
ニュース音声の話題決定では、音声中から抽出したキーワードに基づいて話題を自動的に決定する。このためにはまず、話題との関連性の強い語をあらかじめキーワードとして選択しておき、それを音声から抽出しなければならない。ワードスポッティングに基づいてニュース音声の話題決定を行なうには、話題決定への寄与度だけでなくスポッティングにおける検出容易さも考慮して検出すべきキーワードセットを決定しなければならない。そこで、キーワードに対する湧き出し誤り(キーワードの誤検出)の起こり易さを音声認識のシミュレーションによって予測する手法を提案した。マルコフモデルによって日本語文中の音素列をモデル化し、そのモデルを用いて音素列を生成する。音声認識システムの音素認識誤りの傾向に基づいてDPマッチングを利用することによって、音素列がキーワードと誤認識される確率を計算する。 TVニュースを対象として評価実験を行なった。音声データとしては雑音の少ない26分間の発話を用い、キーワードとしてはこのニュースによく出てきた「代理署名」「学校給食」など54個の単語を用いた。提案手法に基づいて計算した湧き出し誤り数と実際の湧き出し誤り数の間での総関係数として0.73を得た。湧き出し誤り数を予測するための簡単な手法として、キーワードの音素長を用いる手法がある。この場合の相関係数は0.58であり、提案手法の方が精度良く湧き出し誤り数の予測が行なえることを示した。また、シミュレーションにおける音素認識誤りの傾向に関して、前後の音素環境を考慮したコンテキスト依存の場合と音素環境によらないコンテキスト独立の場合を試したが、大きな差は見られなかった。
|