本研究ではSuffix Arrayを用いた高速な音声検索システムにおいて,高速化のために導入しているキーワード分割に関して,最適な検索閾値を分割キーワードに与えるための理論的枠組みを検討した. 従来の方法ではキーワードを分割した際に各分割キーワードに同じ検索閾値を与えていたが,分割キーワードによっては検索結果が多くなり,多大な検索時間が必要となる場合があった.これに対して本研究では分割キーワードに与える検索閾値を調整することにより,全ての分割キーワードを検索する時間の合計を最小化することを目指した.このために,本研究では検索時間の増加傾向を回帰分析によってモデル化し,合計の検索時間が最小になるよう検索閾値をモデルに基づいて解析的に求める方法を採った. この手法の有効性を検証するためにCSJコーパス(606時間)を対象に,NTCIR-9 SpokenDocテストコレクションのSTD(Spoken Term Detection)ALLタスク用キーワード50個のうち分割検索を行う長いキーワード(10音素から18音素)30個を検索したところ,検索時間を7.0%~34.0%削減することができた. また,検索システムの開発については放送大学と共同開発を行うことで,サーバ・クライアント型およびスタンドアローン型のプロトタイプシステムを完成させた.放送大学で実施された20講義の音声データを用いた検索システムの評価を行ったところ,平均の最大F値が0.66であるとの結果が得られた.本研究と別途実施した市場調査ではF値が0.7程度であれば実用性があるとの結果が得られており,あと僅かな性能の向上で実用化に到達できる性能であることが確認された.
|