研究課題/領域番号 |
25330130
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
秋葉 友良 豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (00356346)
|
研究分担者 |
中川 聖一 豊橋技術科学大学, その他部局等, 教授 (20115893)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | ボイスサーチ / 自由発話音声 / 音声ドキュメント検索 / 情報検索 / テストコレクション / 音声中の検索語検出 / 音声内容検索 |
研究実績の概要 |
前年度、本研究課題の目的である「自由発話音声による音声ドキュメント検索」を、国立情報学研究所の評価基盤構築プロジェクトNTCIRに提案し、評価タスクとして採択された。平成26年度は、前年度に収集した自由発話クエリに対し、評価データとしての整備を行った。具体的には、正解書き起こしと複数の音声認識結果の作成と音声との関連付け、発話からのキーワード抽出と各キーワードとその音声発声区間の時刻アライメント、などを行った。また、これを用いて評価タスクの運営を行い、参加11研究グループから得た検索結果を用いて適合性判定を行い、評価用の正解データを構築した。 一方、構築した評価データを用いて、自由発話音声を利用した音声ドキュメント検索の開発を進めた。自由発話音声に含まれる言語情報に加えて、ピッチ、パワー、話速などのパラ言語情報を抽出し、これらの検索処理に対する貢献度を分析した。また、抽出したパラ言語除法を言語情報とともに用いて、検索に利用する新規の音声ドキュメント検索手法の開発を行った。 また、音声ドキュメント検索における基盤技術の開発を進めた。研究を進めてきた距離順STD手法について複数検索語の同時検出に拡張した。この結果を利用して、順次検出される検索語を漸進的に利用する新しい音声内容検索(SCR)手法の開発を行った。その他、音声中の検索後検出(STD)については、音響尤度・言語尤度の再計算による検出精度向上手法を検討した。音声内容検索(SCR)については、現在のstate-of-the-artである言語モデルに基づく検索モデルに対して、音声認識の湧き出し誤りに頑健な拡張手法を開発した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究課題を研究コミュニティ共通の評価タスクとして設定し、国立情報学研究所の評価基盤構築プロジェクトNTCIRに提案し、採択されるに至った。これにより、共通課題の元で他の研究機関を巻き込んで研究推進することとなった。本研究課題について、本課題の研究グループの枠を超えた、幅広い研究成果が期待出来る。これに伴い、当初研究目標のうち(A) 「自由発話音声による情報要求の収集実験と分析」、および(B)「自由発話音声を情報要求に用いた音声ドキュメント検索システムの開発」に研究資源を集中させるように計画変更を行った。そのため、当初課題(C) 「自由発話音声による画像データ表現の調査とそれを用いた画像検索システムの開発」には着手していないが、これは当初計画のオプションとして記載した「(A)(B)の深化への目標変更」に該当し、目的どおりに進展している。
|
今後の研究の推進方策 |
本年度の「自由発話音声による音声ドキュメント検索」評価タスク実施の後、再度の評価タスクの実施を、国立情報学研究所の評価基盤構築プロジェクトNTCIRに提案し、採択された。今回は、収集する自由発話音声クエリのサイズを増やし、安定した評価が可能な評価データ構築に取り組む。この機会を活かした研究推進を目指すため、当初研究目標の(A) 「自由発話音声による情報要求の収集実験と分析」および(B)「自由発話音声を情報要求に用いた音声ドキュメント検索システムの開発」に研究資源を集中させる。評価タスクの運営を通して、他の研究機関と協力して研究課題に取り組み、多様な視点から課題達成の方法、およびその有効性を明らかにしていく。
|