研究課題
H24年度は、音声ドキュメントからの検索語の高速・高精度検索について研究を行った。まず、従来から我々が行っていた音節のトライグラムのインデックス化を、トライグラム、バイグラム、ユニグラムを併用する方法に改善した。これは、例えば、ABCDEの5音節からなる検索語に対して、従来法では、ABCとCDEの二つのトライグラムで検索していたが、この場合、音節Cが、2重に検索されており、厳密な5音節としての検索距離が求められていなかった。そこで、今回は、ABCのトライグラムとDEのバイグラムの検索結果を統合する手法に改善した。また、従来は、検索結果の検索語の長さの相違による正規化係数として、分割したトライグラム数で正規化していたのを、音節数に変更した。以上の改善・変更により、検索精度が向上した。例えば、従来44時間の講演音声ドキュメントに対して、未知語の検索に対して、F値は、従来法で0.611であったのが0.681まで向上した。また、ベースラインである、音節列同士のDPマッチングによる方法では、0.591であり、ベースラインを大きく上回ることが出来た。ただし、これにより、検索時間が遅くなったが、依然DPマッチング法よりは高速で、17倍である。次に、検索語を音声入力で行う方法を検討した。まず、検索語の音声を音声認識で音節列に変換する。その第一候補の音節列を、従来のタイプ入力による検索語と見做して、検索を行った。提案法は、今回の検索語の音節の認識率が検索対象の音声ドキュメントの音節認識よりも悪く、十分な検索性能を得られていないが、ベースラインのDPマッチングによる性能を上回っている。これにより、検索語の音声入力による問題点(脱落誤りの影響が大きい。第一候補だけでは、音節認識の性能が低く、検索性能も低い)が明らかになった。
24年度が最終年度であるため、記入しない。
すべて 2013 2012 その他
すべて 雑誌論文 (11件) (うち査読あり 11件) 学会発表 (5件) (うち招待講演 1件) 図書 (1件)
情報処理学会論文誌
巻: Vol.54, No.2 ページ: 471-483
巻: Vol.54, No.2 ページ: 506-517
巻: Vol.54, No.2 ページ: 484-494
巻: Vol.54, No.2 ページ: 495-505
Speech Communication
巻: Vol.35 ページ: 470-485
DOI:10.1016/j.specom.2012.12.001
Journal of Natural Language Processing
巻: Vol.19, No.4 ページ: 330-350
DOI:10.5715/jnlp.19.329
IEICE Trans. Inf. & Syst
巻: Vol.E95-D,No.11 ページ: 2674-2681
DOI:10.1587/transinf.E95.D.2674
巻: Vol.E95-D,No.9 ページ: 2308-2316
DOI:10.1587/transinf.E95.D.2308
IEICE Trans. Inf. & Syst.
巻: Vol.E95-D, No.8 ページ: 2094-2104
DOI:10.1587/transinf.E95.D.2094
IEICE Trans. Information and Systems
巻: Vol.E-95, No.4 ページ: 1101-1111
DOI:10.1587/transinf.E95.D.1101
IEEE Trans. Audio,Speech and Language Processing
巻: Vol.20, No.5 ページ: 1513-1525
DOI:10.1109/TASL.2012.2183870