研究課題
人が機械とコミュニケーションする場合、話題に関する共通の認識(コンテンツ・アウェアネス)を設定することが難しく、人の意図が伝わりにくい。本研究では、このコンテンツ・アウェアネスを取り入れ、人と機械のコミュニケーションを円滑に行う方法について研究した。平成28年度は、機械が知らないものを判定し学習する方法と、対象に関する共通知識を用いた音声対話の有効性の検証について研究を行った。実施した研究内容を以下に述べる。g)「認識・情報提供」では、物体画像を見せて関連する情報を収集することを目的としている。物体画像の認識では、SIFTなどの特徴をクラスタリングした後、プーリングしてビジュアルワードのヒストグラムを作成する。この時、最もよく似た特徴を複数個プーリングするが、同時に最もよく似ていない特徴も複数個プーリングすると、従来より、高い画像認識精度が得られることが分かった。h)「探索・処理操作」では、料理やテレビニュースを話題として、ユーザからの質問に回答する対話タスクを実施した。入力単語系列には、未知語も含まれているが、リカーレント型ニューラルネットワークに入力して、質問内容を固定長ベクトルで表現する。この質問内容が、事実に関する質問/定義に関する質問/理由を尋ねる質問/方法を尋ねる質問の4つのうちどれであるかを、深層学習により分類する方法について研究を行った。i)「機能認識・探索」では、「書くものを探して?」といったタスクにおいて、物体のパーツに焦点を当てることにより、機能の認識精度が向上することを明らかにした。具体的には、学習の段階で、特定機能を実現する物体全体と、物体のパーツ(車のタイヤなど)を分離し、別のニューラルネットワークの特徴として学習・統合することにより、未知物体であってもその機能認識の精度が向上することを確認した。
28年度が最終年度であるため、記入しない。
すべて 2017 2016
すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (4件) (うち国際学会 1件)
IEICE TRANSACTIONS on Information and Systems
巻: E99-D,No.5 ページ: 1375-1383
EURASIP Journal on Image and Video Processing
巻: 37 ページ: 1-13
10.1186/s13640-016-0140-7