2016 Fiscal Year Research-status Report
音声言語と文字言語の統一的および相補的利用による音声言語情報アクセスの研究
Project/Area Number |
16K00153
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
秋葉 友良 豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (00356346)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 情報検索 / 音声ドキュメント検索 / 文字言語 / 音声言語 / 自由発話音声 |
Outline of Annual Research Achievements |
本研究では、テキストで記述された言語情報と音声で記録された言語情報が分け隔てなく蓄積されるようになる未来を見据えて、両モダリティを統一的に、かつ各モダリティの特徴を活かしつつ、互いの利点を併用する音声言語情報アクセス技術を開発する。この視点から、研究課題を、(A)情報要求の獲得法、(B)情報検索手法、(C)情報提示法のそれぞれに設定した。 (A)について、これまでに申請者が収集した自由発話音声クエリと、それを再構成して作成したテキストクエリ、のペアからなるクエリセットについて、各クエリによる検索性能の違いを分析した。各クエリを構成要素(語)に分解して、それぞれの検索結果に対する貢献度を調べ、各クエリの有する利点と欠点を明らかにした。その結果、平均的にはにテキストクエリの方が検索性能が高いが、音声クエリの特徴である冗長性や多様性が効果的に機能する場合があるという知見を得た。また、これまでに開発してきた、自由発話音声に含まれる音響的特徴から検索への貢献度を推定する手法を改良し、音声ドキュメント検索性能の改善を行った。 (B)について、検索評価テストコレクションを整備し、検索対象として講演音声と発表用プレゼンテーションスライドに含まれるテキスト情報が混在するテストコレクションを構築した。この不均質なテストコレクションに対する文書検索手法を検討中である。また、音声ドキュメントとテキストの中間的な検索対象として、Twitterなどに代表されるマイクロブログに着目し、これに対する検索手法の検討を開始した。また、これまでに開発してきた、音声ドキュメントに対する未知語や誤認識に頑健な内容検索手法を改良し、検索結果を漸進的にユーザに提示するシステムを実装し、自動的もしくはユーザとのインタラクションを利用して、検索性能を最適化するように検索結果を確定する手法を開発した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では、テキストで記述された言語情報と音声で記録された言語情報が分け隔てなく蓄積されるようになる未来を見据えて、両モダリティを統一的に、かつ各モダリティの特徴を活かしつつ、互いの利点を併用する音声言語情報アクセス技術を開発する。この視点から、研究課題を、(A)情報要求の獲得法、(B)情報検索手法、(C)情報提示法のそれぞれに設定した。 (A)(B)については順調に進展していると同時に、新たに着目した新規課題にも取り組んでいる。一方、(C)についてはこれまでに開発した手法に留まり、新たな開発に研究リソースを割くことはできなかった。 全体としては、概ね順調に進展していると考える。
|
Strategy for Future Research Activity |
本研究では、テキストで記述された言語情報と音声で記録された言語情報が分け隔てなく蓄積されるようになる未来を見据えて、両モダリティを統一的に、かつ各モダリティの特徴を活かしつつ、互いの利点を併用する音声言語情報アクセス技術を開発する。この視点から、研究課題を、(A)情報要求の獲得法、(B)情報検索手法、(C)情報提示法のそれぞれに設定した。 今後は、研究リソースの配分を考慮して、より大きな進展が見込まれる課題(A)と(B)に注力し、(C)を来年度以降に実施するように計画を変更する。特に、(B)について、音声ドキュメントとテキストの中間的な検索対象として、マイクロブログを対象とした内容検索に取り組む。音声とテキストの中間的なメディアは、今後情報発信メディアとして増加していくと考えられるため、研究計画では考慮していなかった第3のメディアとして捉えて、これら3者が共存する状況での情報アクセス技術の開発に取り組んでいく。
|
Causes of Carryover |
近年の深層学習の発展により、GPU搭載の高性能ワークステーションが必要になった。次年度に使用額をまとめて導入することにした。
|
Expenditure Plan for Carryover Budget |
GPU搭載の高性能ワークステーションの導入に使用する。
|