2015 Fiscal Year Annual Research Report
コンテンツ・アウェアネスによる人と機械のコミュニケーション及び学習に関する研究
Project/Area Number |
26280059
|
Research Institution | Kobe University |
Principal Investigator |
有木 康雄 神戸大学, 都市安全研究センター, 教授 (10135519)
|
Co-Investigator(Kenkyū-buntansha) |
滝口 哲也 神戸大学, 都市安全研究センター, 准教授 (40397815)
榎並 直子 神戸大学, 自然科学系先端融合研究環重点研究部, 助教 (80628925)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 音声対話 / 物体認識 / コミュニケーション / アウェアネス / 特定物体認識 / 一般物体認識 / 機能認識 / 学習 |
Outline of Annual Research Achievements |
機械を相手にすると、話題に関する共通の認識(コンテンツ・アウェアネス)がとりにくく、人の意図が伝わりにくい。本研究では、このコンテンツ・アウェアネスを取り入れ、人と機械のコミュニケーションを円滑に行う方法について研究した。平成27年度は、認識結果を音声対話に組み込む方法と、対象に関する共通知識を用いた音声対話の有効性の検証について研究を行った。実施した研究内容を以下に述べる。 d)「認識・情報提供」においては、「赤いペンを取ってきて」とロボットに音声で指示すると、色と名称で指示された物体を特定する研究を行った。色属性の認識スコアーと名称に関する画像特徴の認識スコアー、及び音声認識のスコアーをロジスティック回帰で統合し、入力対象の中から音声で指示された色属性と名称属性を持つ対象を特定している。音声対話においては、POMDPを階層化する方法、および並列化する方法を研究し、発話者の意図推定時間の短縮を実現した。 e)「探索・処理操作」においては、ディープニューラルネットワークの一種であるConvolutional Neural Network (CNN)によって、一般物体認識を行った昨年度の研究成果を基に、音声認識と画像認識の結果を統合する前に、統合候補を絞り込む処理を導入した。これにより、音声と画像による一般物体の特定精度を向上させることができた。 f)「機能認識・探索」では、1000個の一般物体を識別することができる深層ネットワークの出力層に、新たに機能を識別するための深層ネットワークを付加して転移学習させた。画像特徴から識別できる機能としては、「水を入れることができる」、「動くことができる」、「書くことができる」に加えて「座ることができる」、「切ることができる」機能を付加して、5つの機能について認識を行った。この結果、73.8%の機能認識率を得た。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
人とロボットとの対話を想定し、話の対象に関して情報を求める「認識・情報提示」と、特定の対象を見つけて処理する「探索・処理操作」、特定の「機能」を持つ対象を見つける「機能認識・探索」をタスクとして実施し、新たな理論的展開と実験を行って研究成果を得ており、おおむね目的を達成している。
|
Strategy for Future Research Activity |
画像認識として、特定物体認識、一般物体認識、機能認識について研究を進めてきた。今後、これを基に、その物体が置かれているコンテキストを利用して、精度を向上させる研究が必要であると考えている。また、対話によってわかったことを基にさらに対話を継続することで、知りたい情報を切れ目なく聞き出すことができる対話戦略の研究が必要であると思われる。
|
Causes of Carryover |
研究の進捗に合わせて、物品の購入費用及び出張旅費を抑えたため、次年度使用額が生じた。
|
Expenditure Plan for Carryover Budget |
研究成果及び状況に合わせて、次年度に物品の購入及び出張旅費を増やす計画である。
|
Research Products
(15 results)