研究課題/領域番号 |
22240013
|
研究機関 | 京都大学 |
研究代表者 |
河原 達也 京都大学, 学術情報メディアセンター, 教授 (00234104)
|
研究分担者 |
森 信介 京都大学, 学術情報メディアセンター, 准教授 (90456773)
秋田 祐哉 京都大学, 学術情報メディアセンター, 助教 (90402742)
角 康之 公立はこだて未来大学, システム情報科学部, 教授 (30362578)
|
キーワード | 音声認識 / 自然言語解析 / 会話分析 / インタラクション / 話し言葉 / アーカイブ / エージェント |
研究概要 |
話し言葉の音声認識に関する研究を進めながら、ニュースのように動的なコンテンツから話題・情報を収集して会話を生成するシステムを設計・実装した。 話し言葉の音声認識では、言語モデルがドメインに関連する表現とフィラーや口語表現などの話し言葉特有の表現の両方をカバーすることが求められる。本研究では、単語・構文などの情報に基づくルールベースの話し言葉テキスト変換と、N-gramの統計的話し言葉変換を組み合わせて、書き言葉スタイルのテキストから話し言葉スタイルの言語モデルを構築する手法を検討した。学会講演音声を対象とした評価実験において、提案手法の効果の評価を行った。 日々更新されるWebニュースなどのテキストに対して、述語項構造に着目した情報抽出を行い、それに基づいて情報検索・推薦を行う音声対話システムを構築した。まず、ドメインごとに有用な述語項構造パターンの抽出を行う指標を検討し、Naive Bayes法に基づく抽出が有効であることを示した。また、抽出された述語項構造に完全に一致するものがない場合でも情報推薦ができるように、前述の指標に基づいて述語項の優先度を決定し、さらに、要素・用言に関して関連度を定義することによって述語項どうしの類似度を計算した。評価実験において、典型的な従来手法であるBag-Of-Words (BOW)モデルと比較して、本手法がより的確に応答生成を行えることが示された。これに加えて、ユーザからの情報要求・発話がなくなった場合に、対話履歴中の述語項との類似度を利用してプロアクティブに情報提示を行う手法を提案した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
音声認識、会話の分析・アノテーション、音声対話システム(会話エージェント)の各要素に関して、成果が出ており、論文発表も順調に行えている。
|
今後の研究の推進方策 |
各要素をさらに高度化していくとともに、それらの成果を統合したシステムの構築も進めていく予定である。
|