2013 Fiscal Year Annual Research Report
人間対人間の対話情報を事前知識とした情報検索音声対話戦略
Project/Area Number |
23500209
|
Research Institution | Nagoya University |
Principal Investigator |
北岡 教英 名古屋大学, 情報科学研究科, 准教授 (10333501)
|
Co-Investigator(Kenkyū-buntansha) |
武田 一哉 名古屋大学, 情報科学研究科, 教授 (20273295)
宮島 千代美 名古屋大学, 情報科学研究科, 助教 (90335092)
|
Keywords | 音声ドキュメント / 楽曲 / 類似度 / 音声対話 / 検索 |
Research Abstract |
音声対話の事前情報として、人間同士の対話から得られた情報をもとに、検索対象となる音楽やドキュメントの間の類似性を数値化する研究を行った。 事前に得た対話と類似性のある検索対象に優先度を与えるための音声ドキュメントの類似性の評価法として、これまでベクトル空間モデルに基づいた方法を用いてきた。しかし、一般にテキスト検索では3種類の基本的な手法が存在する。その他の二つが、クエリ尤度モデルに基づく方法と、適合モデルに基づく方法である。これを、音声認識結果の類似度算出に用いるための改良を適用し、性能の比較を行った。改良方法としては、音声認識の未知語や誤認識に対処するために、1.Webなどから検索して得られた単語も文書の一部として類似度算出に用いるクエリ拡張法、2.音節単位の音声認識を用いた単語知識に依存しないインデックスの利用、がある。これらを適用したうえで、3つの基本手法を比較した結果、ベクトル空間モデルと比較して、クエリ尤度モデルおよび適合モデルは有意に性能がよく、かつ改良法を適用したことで音声ドキュメントに対しても頑健な類似度を算出でき、検索タスクで評価した結果、大きく性能向上することが確認できた。 楽曲検索を行うことを想定して、楽曲間の類似度を算出するための検討も行った。これまでに、人間が異なれば傾向も異なるという個人性の問題には対処できていなかった。そこで、今回は個々の人間があるテーマ(ロック、ポピュラー、車で聞きたい、など)といった分類で、どのような曲を同じグループに分類するか、という主観実験を実施した。現時点で、これが大きな個人差があることを示していることまでわかった。これを用いた個人性を考慮した評価値の算出法は今後の課題である。
|