2012 Fiscal Year Annual Research Report
音声ドキュメントの高精度認識と整形・要約および高速・高精度音声検索に関する研究
Project/Area Number |
22300059
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
中川 聖一 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (20115893)
|
Co-Investigator(Kenkyū-buntansha) |
秋葉 友良 豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (00356346)
山本 一公 豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (40324230)
土屋 雅稔 豊橋技術科学大学, 学内共同利用施設等(情報メディア基盤センター), 助教 (70378256)
|
Project Period (FY) |
2010-04-01 – 2013-03-31
|
Keywords | 音節トライグラム / nグラムインデックス / 音声検索語検索 / 音声ドキュメント / 音声認識 / 音声検索 / 音声入力 |
Research Abstract |
H24年度は、音声ドキュメントからの検索語の高速・高精度検索について研究を行った。まず、従来から我々が行っていた音節のトライグラムのインデックス化を、トライグラム、バイグラム、ユニグラムを併用する方法に改善した。これは、例えば、ABCDEの5音節からなる検索語に対して、従来法では、ABCとCDEの二つのトライグラムで検索していたが、この場合、音節Cが、2重に検索されており、厳密な5音節としての検索距離が求められていなかった。そこで、今回は、ABCのトライグラムとDEのバイグラムの検索結果を統合する手法に改善した。また、従来は、検索結果の検索語の長さの相違による正規化係数として、分割したトライグラム数で正規化していたのを、音節数に変更した。以上の改善・変更により、検索精度が向上した。例えば、従来44時間の講演音声ドキュメントに対して、未知語の検索に対して、F値は、従来法で0.611であったのが0.681まで向上した。また、ベースラインである、音節列同士のDPマッチングによる方法では、0.591であり、ベースラインを大きく上回ることが出来た。ただし、これにより、検索時間が遅くなったが、依然DPマッチング法よりは高速で、17倍である。 次に、検索語を音声入力で行う方法を検討した。まず、検索語の音声を音声認識で音節列に変換する。その第一候補の音節列を、従来のタイプ入力による検索語と見做して、検索を行った。提案法は、今回の検索語の音節の認識率が検索対象の音声ドキュメントの音節認識よりも悪く、十分な検索性能を得られていないが、ベースラインのDPマッチングによる性能を上回っている。これにより、検索語の音声入力による問題点(脱落誤りの影響が大きい。第一候補だけでは、音節認識の性能が低く、検索性能も低い)が明らかになった。
|
Current Status of Research Progress |
Reason
24年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
24年度が最終年度であるため、記入しない。
|
-
[Journal Article] 音声中の検索語検出のためのテストコレクションの構築と分析2013
Author(s)
伊藤慶明,西崎博光,中川聖一,秋葉友良,河原達也,胡新輝,南篠浩光,松井知子,山下洋一,相川清明
-
Journal Title
情報処理学会論文誌
Volume: Vol.54, No.2
Pages: 471-483
Peer Reviewed
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-