2011 Fiscal Year Research-status Report
音声中の任意語彙検出の高度化と音声認識・音声ドキュメント内容検索への応用
Project/Area Number |
23700111
|
Research Institution | University of Yamanashi |
Principal Investigator |
西崎 博光 山梨大学, 医学工学総合研究部, 助教 (40362082)
|
Project Period (FY) |
2011-04-28 – 2014-03-31
|
Keywords | 音声ドキュメント処理 / 音声中の検索語検出(STD) / 音声ドキュメント検索(SDR) / 音声認識 / 音声インタフェース / 情報検索 |
Research Abstract |
本研究の目的は大規模音声データから,任意の語彙が発話されている区間を特定する音声中の任意語彙検出(Spoken Term Detection,STD)技術の高度化を図ること,その技術を大規模音声ドキュメント内容検索(Spoken Document Retrieval,SDR)と音声認識に応用しこれらの精度を改善させることである.平成23年度は,STD技術の高度化に重点を置いて研究を行った.まず,検索対象の音声データをN個の音声認識器を用いて音声認識する.それぞれの音声認識器毎に出力される音声認識結果の特徴が異なることを有効利用する.つまり,認識器によって得意な音声,不得意な音声がある.そこで,このN個の認識結果を統合することで,多様な情報を持った語彙検出のためのインデックスを構築した.認識結果の統合方法には多数決法を導入した.例えば,N=10とした場合,/a/という音素が10個中8個の音声認識器から出力されたとすれば,この音素/a/に高い重み係数を設定する統合方法である.これにより誤検出を大幅に抑制することに成功した.さらに,検索用語彙に依存した動的な検索手法も行った.検索語の長さに応じて検索用のパラメータを調整することで,さらに検索精度を改善することができた.具体的には,情報処理学会音声言語情報処理研究会音声ドキュメント処理ワーキンググループが制定したSTD用テストコレクションの中の未知語セットを用いて評価した結果,検索精度を示すF値がベースラインに比べて17%向上した.また,国立情報学研究所が主催する国際ワークショップ「NTCIR-9(第9回NTCIRワークショップ成果報告会)」に参加した.このワークショップではSTDを対象とした競争型タスクが提案され,NTCIR-9に参加した全7チーム中,本STDシステムが最も良い検索精度を出し,本技術の優位性を示すことができた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成23年度の目標は,STD技術の高度化を図ることであった.本報告書の「研究実績の概要」でも説明したように,平成23年度は,高い検索精度が得られるSTD技術の開発を行い,その実力を,一般公開されている共通のテストコレクションや,国際ワークショップで示すことができた.このことから,計画通りにおおむね順調に研究が進んでいると言える.
|
Strategy for Future Research Activity |
これまでの研究成果により,高い検索精度を持つSTD技術を開発することができた.しかし,検索精度は高いが,検索時間が遅く,実用的に本技術を利用するには難がある.そこで,本年度は,開発したSTDの検索精度を損なわない処理の高速化の研究を行う.具体的には,分散処理あるいはインデキシングの改良によって,これを実現する予定である.さらに,開発したSTD技術を用いて,音声認識の高精度化を目指す.まず,音声認識対象の音声からSTD用インデックスを作成する.音声認識に必要な言語モデルを学習するための学習データ(テキスト)に含まれている単語を,STD技術を用いて選別する.これにより,学習データのどの単語が認識対象の音声に含まれているのかを判断することができる.逆に言えば,音声認識でモデル化をする必要のない単語も分かる.不要な単語を学習しないようにすることで,音声認識対象音声に適応化(特化)した言語モデルを学習することができ,認識率の大幅な改善が期待できる.また,STD技術の応用を模索する.例えば,音声ドキュメント内容検索へ応用することで,検索の高精度化を目指す.また,音声インタフェースを備えたシステムに組み込むことで,使い勝手の良いインタフェースの実現を目指す.
|
Expenditure Plans for the Next FY Research Funding |
平成24年度以降は,STDの分散処理化を計画しているため,高速計算機を3台購入予定にしている.さらに,平成23年度の研究成果を国際会議で報告するための旅費,研究成果をまとめた論文の論文掲載料を計上している.
|
Research Products
(11 results)