2015 年度実績報告書

コンテンツ・アウェアネスによる人と機械のコミュニケーション及び学習に関する研究

研究課題

研究課題/領域番号	26280059
研究機関	神戸大学
研究代表者	有木康雄神戸大学, 都市安全研究センター, 教授 (10135519)
研究分担者	滝口哲也神戸大学, 都市安全研究センター, 准教授 (40397815) 榎並直子神戸大学, 自然科学系先端融合研究環重点研究部, 助教 (80628925)
研究期間 (年度)	2014-04-01 – 2017-03-31
キーワード	音声対話 / 物体認識 / コミュニケーション / アウェアネス / 特定物体認識 / 一般物体認識 / 機能認識 / 学習
研究実績の概要	機械を相手にすると、話題に関する共通の認識（コンテンツ・アウェアネス）がとりにくく、人の意図が伝わりにくい。本研究では、このコンテンツ・アウェアネスを取り入れ、人と機械のコミュニケーションを円滑に行う方法について研究した。平成２７年度は、認識結果を音声対話に組み込む方法と、対象に関する共通知識を用いた音声対話の有効性の検証について研究を行った。実施した研究内容を以下に述べる。 d)「認識・情報提供」においては、「赤いペンを取ってきて」とロボットに音声で指示すると、色と名称で指示された物体を特定する研究を行った。色属性の認識スコアーと名称に関する画像特徴の認識スコアー、及び音声認識のスコアーをロジスティック回帰で統合し、入力対象の中から音声で指示された色属性と名称属性を持つ対象を特定している。音声対話においては、POMDPを階層化する方法、および並列化する方法を研究し、発話者の意図推定時間の短縮を実現した。 e)「探索・処理操作」においては、ディープニューラルネットワークの一種であるConvolutional Neural Network (CNN)によって、一般物体認識を行った昨年度の研究成果を基に、音声認識と画像認識の結果を統合する前に、統合候補を絞り込む処理を導入した。これにより、音声と画像による一般物体の特定精度を向上させることができた。 f)「機能認識・探索」では、１０００個の一般物体を識別することができる深層ネットワークの出力層に、新たに機能を識別するための深層ネットワークを付加して転移学習させた。画像特徴から識別できる機能としては、「水を入れることができる」、「動くことができる」、「書くことができる」に加えて「座ることができる」、「切ることができる」機能を付加して、５つの機能について認識を行った。この結果、73.8%の機能認識率を得た。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由人とロボットとの対話を想定し、話の対象に関して情報を求める「認識・情報提示」と、特定の対象を見つけて処理する「探索・処理操作」、特定の「機能」を持つ対象を見つける「機能認識・探索」をタスクとして実施し、新たな理論的展開と実験を行って研究成果を得ており、おおむね目的を達成している。
今後の研究の推進方策	画像認識として、特定物体認識、一般物体認識、機能認識について研究を進めてきた。今後、これを基に、その物体が置かれているコンテキストを利用して、精度を向上させる研究が必要であると考えている。また、対話によってわかったことを基にさらに対話を継続することで、知りたい情報を切れ目なく聞き出すことができる対話戦略の研究が必要であると思われる。
次年度使用額が生じた理由	研究の進捗に合わせて、物品の購入費用及び出張旅費を抑えたため、次年度使用額が生じた。
次年度使用額の使用計画	研究成果及び状況に合わせて、次年度に物品の購入及び出張旅費を増やす計画である。

研究成果
(15件)

すべて 2016 2015

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (12件) (うち国際学会 10件)

[雑誌論文] マルチモーダル情報を用いた色名称と物体名称に基づく物体特定2015
- 著者名/発表者名
  小篠裕子, 有木康雄
- 雑誌名
  
  画像電子学会誌
  
  巻: 45巻1号ページ: 105-111
- 査読あり
[雑誌論文] 一般物体認識に基づく音声で指示された物体の選択法2015
- 著者名/発表者名
  西村仁志, 小篠裕子, 有木康雄, 中野幹生
- 雑誌名
  
  電子情報通信学会論文誌D
  
  巻: Vol.J98-D，No.9 ページ: 1265-1276
- 査読あり
[雑誌論文] Audio-Visual Speech Recognition Using Convolutive Bottleneck Networks for a Person with Severe Hearing Loss2015
- 著者名/発表者名
  Yuki Takashima, Yasuhiro Kakihara, Ryo Aihara, Tetsuya Takiguchi, Yasuo Ariki, Nobuyuki Mitani, Kiyohiro Omori, Kaoru Nakazono
- 雑誌名
  
  IPSJ Transactions on Computer Vision and Applications
  
  巻: Vol. 7 ページ: 64-68
- 査読あり
[学会発表] MODELING DEEP BIDIRECTIONAL RELATIONSHIPS FOR IMAGE CLASSIFICATION AND GENERATION2016
- 著者名/発表者名
  Toru Nakashika, Tetsuya Takiguchi, Yasuo Ariki
- 学会等名
  ICASSP2016
- 発表場所
  上海（中国）
- 年月日
  2016-03-22 – 2016-03-25
- 国際学会
[学会発表] Estimation of Object Functions Using Convolutional Neural Network2016
- 著者名/発表者名
  Yosuke Kitano, Tetsuya Takiguchi, Yasuo Ariki
- 学会等名
  The 22st Korea-Japan joint Workshop on Frontiers of Computer Vision
- 発表場所
  ひだホテルプラザ（岐阜県・高山市）
- 年月日
  2016-02-17 – 2016-02-19
- 国際学会
[学会発表] Rotation-invariant Histograms of Oriented Gradients for Local Patch Robust Representation2015
- 著者名/発表者名
  Zhaojie Luo, Jinhui Chen, Tetsuya Takiguchi, and Yasuo Ariki
- 学会等名
  APSIPA Annual Summit and Conference 2015
- 発表場所
  香港（中国）
- 年月日
  2015-12-16 – 2015-12-19
- 国際学会
[学会発表] Detection of Facial Parts via Deformable Part Model Using Part Annotation2015
- 著者名/発表者名
  Kazuhiro Nishida, Naoko Enami and Yasuo Ariki
- 学会等名
  APSIPA Annual Summit and Conference 2015
- 発表場所
  香港（中国）
- 年月日
  2015-12-16 – 2015-12-19
- 国際学会
[学会発表] 状態空間の分割と状態遷移の学習に基づく Parallel POMDPの評価2015
- 著者名/発表者名
  山田燿司, 滝口哲也, 有木康雄
- 学会等名
  電子情報通信学会技術研究報告 (SP)
- 発表場所
  六甲ホール（兵庫県・神戸市）
- 年月日
  2015-10-15 – 2015-10-16
[学会発表] Multithreading AdaBoost Framework for Object Recognition2015
- 著者名/発表者名
  Jinhui Chen, Tetsuya Takiguchi, and Yasuo Ariki
- 学会等名
  The IEEE International Conference on Image Processing (ICIP) 2015
- 発表場所
  Québec City (Canada)
- 年月日
  2015-09-27 – 2015-09-30
- 国際学会
[学会発表] Facial Expression Recognition with Multithreaded Cascade of Rotation-invariant HOG2015
- 著者名/発表者名
  Jinhui Chen, Tetsuya Takiguchi, and Yasuo Ariki
- 学会等名
  The sixth International Conference on Affective Computing and Intelligent Interaction (ACII2015)
- 発表場所
  西安（中国）
- 年月日
  2015-09-21 – 2015-09-24
- 国際学会
[学会発表] SPOKEN DIALOGUE SYSTEM FOR PRODUCT RECOMMENDATION USING HIERARCHICAL POMDP2015
- 著者名/発表者名
  Yoji Yamada, Tetsuya Takiguchi, Yasuo Ariki
- 学会等名
  2015 First International Workshop on Machine Learning in Spoken Language Processing (MLSLP)
- 発表場所
  会津大学（会津市・福島県）
- 年月日
  2015-09-19 – 2015-09-20
- 国際学会
[学会発表] FEATURE EXTRACTION USING PRE-TRAINED CONVOLUTIVE BOTTLENECK NETS FOR DYSARTHRIC SPEECH RECOGNITION2015
- 著者名/発表者名
  Yuki Takashima, Toru Nakashika, Tetsuya Takiguchi, Yasuo Ariki
- 学会等名
  The 23rd European Signal Processing Conference (EUSIPCO)
- 発表場所
  Nice (France)
- 年月日
  2015-08-31 – 2015-09-04
- 国際学会
[学会発表] Word-Error Correction of Continuous Speech Recognition Based on Normalized Relevance Distance2015
- 著者名/発表者名
  Yohei Fusayasu, Katsuyuki Tanaka, Tetsuya Takiguchi, Yasuo Ariki
- 学会等名
  International Joint Conference on Artificial Intelligence 2016
- 発表場所
  Buenos Aires (Argentina)
- 年月日
  2015-07-25 – 2015-07-31
- 国際学会
[学会発表] Content-based Image Retrieval Using Rotation-invariant Histograms of Oriented Gradients2015
- 著者名/発表者名
  Jinhui Chen, Toru Nakashika, Tetsuya Takiguchi, and Yasuo Ariki
- 学会等名
  ACM ICMR 2015
- 発表場所
  上海（中国）
- 年月日
  2015-06-23 – 2015-06-24
- 国際学会
[学会発表] Deformable Part Modelを用いた顔部品検出2015
- 著者名/発表者名
  西田和博，榎並直子，有木康雄
- 学会等名
  電子情報通信学会技術研究報告 (PRMU)
- 発表場所
  新潟大学駅南キャンパス「ときめいと」（新潟県・新潟市）
- 年月日
  2015-06-18 – 2015-06-19

2015 年度 実績報告書

コンテンツ・アウェアネスによる人と機械のコミュニケーション及び学習に関する研究

研究代表者

有木 康雄 神戸大学, 都市安全研究センター, 教授 (10135519)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] マルチモーダル情報を用いた色名称と物体名称に基づく物体特定2015

著者名/発表者名

雑誌名

[雑誌論文] 一般物体認識に基づく音声で指示された物体の選択法2015

著者名/発表者名

雑誌名

[雑誌論文] Audio-Visual Speech Recognition Using Convolutive Bottleneck Networks for a Person with Severe Hearing Loss2015

著者名/発表者名

雑誌名

[学会発表] MODELING DEEP BIDIRECTIONAL RELATIONSHIPS FOR IMAGE CLASSIFICATION AND GENERATION2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Estimation of Object Functions Using Convolutional Neural Network2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Rotation-invariant Histograms of Oriented Gradients for Local Patch Robust Representation2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Detection of Facial Parts via Deformable Part Model Using Part Annotation2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 状態空間の分割と状態遷移の学習に基づく Parallel POMDPの評価2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Multithreading AdaBoost Framework for Object Recognition2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Facial Expression Recognition with Multithreaded Cascade of Rotation-invariant HOG2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] SPOKEN DIALOGUE SYSTEM FOR PRODUCT RECOMMENDATION USING HIERARCHICAL POMDP2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] FEATURE EXTRACTION USING PRE-TRAINED CONVOLUTIVE BOTTLENECK NETS FOR DYSARTHRIC SPEECH RECOGNITION2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Word-Error Correction of Continuous Speech Recognition Based on Normalized Relevance Distance2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Content-based Image Retrieval Using Rotation-invariant Histograms of Oriented Gradients2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Deformable Part Modelを用いた顔部品検出2015

著者名/発表者名

学会等名

発表場所

年月日

2015 年度実績報告書

有木康雄神戸大学, 都市安全研究センター, 教授 (10135519)