研究課題/領域番号 |
23500209
|
研究機関 | 名古屋大学 |
研究代表者 |
北岡 教英 名古屋大学, 情報科学研究科, 准教授 (10333501)
|
研究分担者 |
武田 一哉 名古屋大学, 情報科学研究科, 教授 (20273295)
宮島 千代美 名古屋大学, 情報科学研究科, 助教 (90335092)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | 音声対話 / 情報検索 / 人間対人間 / 潜在意味 |
研究概要 |
音声言語や音楽などの概念を空間上で表現するための検討を行った。まず、音声言語については、単語認識により得られた結果を単語の頻度に基づいたベクトルとして表現することにより空間に配置する方法と、より音響的な情報を用いた音節認識結果に基づいて、その3連鎖の頻度に基づいたベクトルとして空間に配置する方法を併用することにより、音声認識誤りなどに強い音声言語の空間表現を提案した。そして、それらを入力された単語集合から検索するタスクによって評価することにより、空間上で意味的な近さを表現できていることを確認した。また、音楽については、主観的な類似と音響的な特徴との関係を調査するためにデータを収集し分析した。その結果、個人的な指向が大きく影響しているなどの結果が得られた。また、対話戦略については、空間内での探索問題としてユーザの意図にたどり着く方法をこれまでに提案しているが、そのうちのシステム応答文を選択するための評価尺度として、効率的な探索に加えてユーザにとって自然であることを評価することを提案した論文を投稿し、採録された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
検索対象となるメディアを音声言語と音楽と選択し、それぞれに対して事前知識をポテンシャルとして表現するための空間表現を実現することをができた。これを、これまでに提案している人間対人間の対話の音声認識に基づいた検索を拡張し、空間上での距離をポテンシャルへと変換することによって、計画している探索空間の事前知識とみなすことができると考えられ、それへ向けた進展があったと考える。また、対話における複数理解のスコアリングに関しては論文として相応の評価がなされた。この複数理解は、同様に空間上に配置することができ、その空間と、上記の検索対象を表現する空間とを対応付ける手法が開発できれば、複数の理解それぞれにポテンシャルをスコアに変換して与えることが可能になり、探索空間に事前知識を与えて効率化・高度化するという目的を達することができる。
|
今後の研究の推進方策 |
人間対人間対話の収録および情報検索タスクを遂行するための模擬対話を収録することにより、確率統計的手法に基づいたポテンシャル表現法や対話理解表現の研究試料とする。また、最近音声対話手法として非常によくつかわれるPOMDP(Partially Observable Markov Decision Process)法と提案している手法との関連を明確にする。そのため、実際に実現した音楽検索タスクにおける提案手法をPOMDPで表現する場合との比較を含めた論文を執筆し、それを明確にする。また、検索対象空間上でのポテンシャルの、事前情報としての確率的表現への変換方法を研究する。可能であれば実際の対話から統計処理によって変換法を得ることが望ましい。そのためにも上記のデータ収集を行う。さらに、これまでは対話の言語的情報にのみ着目してきたが、特に事前情報として場の雰囲気などを表現する能力の高い韻律などからパラ言語的情報を抽出することを考え、その基礎検討を開始する。
|
次年度の研究費の使用計画 |
主な繰り越し分の使用目的として、今年度の発売が期待された計算機の発売を待ち、早々に購入することがあげられる。本機の購入によりデータ収録・対話システムを構築する。また、対話評価に関する研究および音声言語情報の空間表現に関する研究の発表のため、数回の国内発表および2回程度の国際会議発表を計画している。
|