研究課題/領域番号 |
22240013
|
研究機関 | 京都大学 |
研究代表者 |
河原 達也 京都大学, 学術情報メディアセンター, 教授 (00234104)
|
研究分担者 |
角 康之 公立はこだて未来大学, システム情報科学部, 教授 (30362578)
秋田 祐哉 京都大学, 学術情報メディアセンター, 助教 (90402742)
森 信介 京都大学, 学術情報メディアセンター, 准教授 (90456773)
|
研究期間 (年度) |
2010-04-01 – 2014-03-31
|
キーワード | 画像、文章、音声等認識 / コンテンツ・アーカイブ / エージェント / マルチモーダルインターフェース / 音声会話 |
研究概要 |
話し言葉の音声認識に関する研究、音声会話の聞き手の反応に着目した分析を進めるとともに、音声対話エージェントの高度化も行った。 音声対話システムのための音声認識における言語モデル構築のために、Web上で収集される文から適切なものを選択する手法を研究した。従来手法では文表層のパープレキシティを用いた文選択が一般的であったが、提案手法では音声対話において利用される文書集合(=ドメイン)との意味的な類似度を定義し、これを文選択に用いる。具体的には、ドメイン固有の述語項構造パターンに着目し、統計的な尺度を定義する。この意味的な類似度と従来のパープレキシティに基づく手法を組み合わせることも検討する。2種類の異なるドメインにおける音声認識実験によって、提案する文選択手法が有効であることが示された。 また、ポスターセッションにおける会話(=「ポスター会話」)に焦点をおいて研究を進めている。ポスター会話は、講演と会議の中間的な形態と捉えることができる。すなわち、発表者が自身の研究内容について少人数の聴衆に説明する一方、聴衆の側も相槌や頷きなどでリアルタイムにフィードバックし、時折質問やコメントも行う。本研究では、視線・話者・発話区間などの検出に加えて、聴衆の理解・興味度の推定などを行っている。これらは会話アーカイブに対する新たなインデキシングの枠組みを提供することが期待される。さらに、将来自動でプレゼンテーションを行う知的な会話エージェントの基盤にもなる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
音声認識、会話の分析・アノテーション、音声対話システム(会話エージェント)の各要素に関して、成果が出ており、論文発表も順調に行えている。特に今年度は、国際会議での基調講演、国内会議でも多数の招待講演を行う機会があった。
|
今後の研究の推進方策 |
各要素をさらに高度化していくとともに、それらの成果を統合したシステムの構築も進めていく予定である。
|