研究課題/領域番号 |
25330130
|
研究種目 |
基盤研究(C)
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
秋葉 友良 豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (00356346)
|
研究分担者 |
中川 聖一 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (20115893)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | ボイスサーチ / 自由発話音声 / 音声ドキュメント検索 / 情報検索 / テストコレクション / 音声中の検索語検出 / 音声内容検索 |
研究概要 |
平成25年度は、当初の計画通り、自由発話音声情報要求の収集実験、および収集した音声の分析を行った。音声収録実験は、当初計画の既存のテキスト検索用検索課題を用いた擬似的な収集方法に加え、検索対象の文書を与えて自由に課題を作成してもらう方法も試し、前者39、後者42の課題を収集した。また、収録した音声について、検索に効果的な特徴を探るために、音響的・言語的分析を行った。 また、本研究課題の目的である「自由発話音声による音声ドキュメント検索」を、国立情報学研究所の評価基盤構築プロジェクトNTCIRに提案し、2014年に実施する新規評価タスクとして採択されるに至った。これにより、本研究課題で収集した自由発話音声情報要求は、評価タスクに参加する研究機関(平成25年度末現在、10グループ)に配布し、共通研究課題として研究を進める土台が出来上がった。 その他、音声ドキュメント検索における基盤技術を開発し、対外発表を行った。音声中の検索語検出(STD)については、研究を進めてきた距離順STD手法の検出性能改善、索引構造の見直しによる空間効率改善、アルゴリズムの改善による高速化、今後の音声内容検索への応用のための複数検索後の同時検出、を実現した。音声内容検索(SCR)については、音声ドキュメントの任意の音声区間を検索するための可変長パッセージ検索手法、音声認識誤りや未知語(偽陰性誤り)に対応するSTDベースの検索手法、湧き出し誤り(偽陽性誤り)に対処するための検索モデルの開発、を実現した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
研究計画通りの研究に加えて、研究課題を研究コミュニティ共通の評価タスクとして設定し、国立情報学研究所の評価基盤構築プロジェクトNTCIRに提案し、採択されるに至った。これにより、共通課題の元で他の研究機関を巻き込んで研究推進することとなった。本研究課題について、本課題の研究グループの枠を超えた、幅広い研究成果が期待出来る。
|
今後の研究の推進方策 |
評価基盤構築プロジェクトNTCIRでの評価タスク実施の機会を活かした研究推進を目指す。来年度は、NTCIRプロジェクトの枠組みを利用して、他の研究機関と協力して研究課題に取り組んでいく。そのため、少なくとも来年度は、当初研究目標のうち(B)「自由発話音声を情報要求に用いた音声ドキュメント検索システムの開発」に研究資源を集中させる。
|