2017 年度実施状況報告書

知識グラフを組込んだニューラルネットワークによる物体認識―物体・意味写像の提案―

研究課題

研究課題/領域番号	17K00236
研究機関	神戸大学
研究代表者	有木康雄神戸大学, 都市安全研究センター, 名誉教授 (10135519)
研究期間 (年度)	2017-04-01 – 2020-03-31
キーワード	ゼロショット学習 / ImageNetデータセット / 見出し単語 / テキスト文書 / 知識グラフ / 意味表現
研究実績の概要	本研究では、物体の画像特徴だけでなく、物体に関する知識も同時に学習させることにより、既知物体の認識精度と未知物体の識別率の向上を目的としている。このような研究は、一般的にゼロショット学習と呼ばれている。ゼロショット学習では、既知の学習集合から学習した知識を、未知のテスト集合へ適用するために、画像特徴とその意味表現を用いる。平成29年度は、異なる意味表現によって、ゼロショット学習の精度がどのように変化するか、最も精度の高い意味表現はどのようなものであるかについて研究を行った。まず、一般物体のゼロショット学習に対して、標準的な評価ベンチマークとなっているImageNetをベンチマークとして用いた。 ImageNetの各クラスはWordnetの概念と対応しており、3つの要素で定義されている。それらは、見出し単語、見出し単語を自然言語で説明したテキスト文書、Wordnetの他ノードに述語を介してリンクしている知識グラフである。同じ意味表現でも、コンピュータで扱えるベクトル形式に変換する方法が種々提案されているので、異なる意味表現、異なる変換方法によって、ゼロショット学習の精度がどのような影響を受けるか調べた。その結果、次のような結果が得られた。第1に、単語表現は変換方法によって精度が同じではないことを発見した。従来のWord2vecの代わりにGloVeを用いると、ベースラインモデルの精度を2倍にすることができる。第2に、知識グラフは他の記述レベルより優れている。完全なwordnet知識グラフを用いるモデルでは、現在最も優れている方法より45%も精度を改善することができた。第3に、現在、最も研究が行われているテキスト文書は、ゼロショット学習のベンチマークでは、良い結果が得られなかった。これらの結果を用いて、機能推定や画像認識、対話の精度と意味表現の関係についても研究を進めた。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由平成29年度の計画として、下記4項目を予定していた。それぞれについて、以下の状況を達成している。（１）物体画像の学習データセットを決定する：物体画像データベースとして、ImageNetをゼロショット学習のベンチマークに決定した。（２）学習データセットの各物体画像を、知識グラフ内のノードに対応付ける：知識グラフとしては、Linked Open Data、特にBabelNetを用いて、ImageNetの画像とDBPediaの知識グラフを自動的に対応付けた。（３）CNNによる深層学習を用いて、物体画像から画像特徴ベクトルを自動学習する：物体画像のImageNetベンチマークを用いて、ゼロショット学習をend-to-endで行い、画像特徴ベクトルをCNNにより自動学習した。（４）知識グラフから物体の属性特徴ベクトルを自動学習する：知識グラフからベクトルに変換する方法を新たに提案し、従来手法より45%精度が向上することを確かめた。また、単語、テキスト文書、知識グラフという異なる意味メディアでは、従来良く研究されてきた単語や、現在主として研究されているテキスト文書に比べ、知識グラフを用いると最も精度が高くなることが分かった。
今後の研究の推進方策	平成29年度の成果を基に、平成30年度以降も予定通り研究を進める。（５）深層学習により、画像特徴ベクトルから属性特徴ベクトルへ写像する：ゼロショット学習により、既に当初予定の「画像からCNNによる深層学習を用いて抽出した画像特徴ベクトルと、知識グラフから抽出した属性特徴ベクトルの間で写像を実現する」ことは完了しているが、まだ精度が低いので精度向上を行う予定である。（６）特徴ベクトルの抽出過程と写像過程を統合する：深層学習を用いたゼロショット学習により、「画像から画像特徴ベクトルを抽出し、知識グラフの属性特徴ベクトルへ写像する方法」については、end-to-endで実現できている。次年度は精度向上を目指して、新しい方法を研究する予定である。（７）画像と知識の概念学習、未知物体のシンボルグラウンディングを検証する：既に実装が済んでいるゼロショット学習により、「未知物体を入力して得られる属性ベクトルが、どのような知識グラフを形成するか、また、新たな知識を獲得するシンボルグラウンディングが可能であるかどうか」について、研究を行う。（８）一般物体認識、機能認識を検証する：ゼロショット学習により、より実用的に近い「1000物体程度の多クラスに対して、知識グラフを組み込んだ一般物体認識が実現できるか」どうか調べる。また、本年度既に一部研究を行ったが、「機能推定の認識精度がどの程度向上するか」について検証を行う。
次年度使用額が生じた理由	初年度は、主として論文調査、プログラム開発を行った。次年度は今年度の研究成果を発表するための予算が必要となることから、繰り越しを行った。

研究成果
(16件)

すべて 2018 2017 その他

すべて学会発表 (15件) (うち国際学会 7件) 備考 (1件)

[学会発表] Zero-shot learning using dictionary definitions2018
- 著者名/発表者名
  Tristan Hascoet, Yasuo Ariki, Tetsuya Takiguchi
- 学会等名
  IWFCV-2018
- 国際学会
[学会発表] Satellite Image Semantic Segmentation Using Fully Convolutional Network2018
- 著者名/発表者名
  Atsushi Yoshihara, Tetsuya Takiguchi, Yasuo Ariki
- 学会等名
  IWFCV-2018
- 国際学会
[学会発表] Estimation of Object Function Using Visual Attention2018
- 著者名/発表者名
  Ryunosuke Azuma, Tetsuya Takiguchi, Yasuo Ariki
- 学会等名
  IWFCV-2018
- 国際学会
[学会発表] Debate Dialog for News Question Answering System “NetTv”: Debate Based on Claim and Reason Estimation2018
- 著者名/発表者名
  Rikito Marumoto, Katsuyuki Tanaka, Tetsuya Takiguchi, Yasuo Ariki
- 学会等名
  IWSDS2018
- 国際学会
[学会発表] Chat Response Generation Based on Semantic Prediction Using Distributed Representations of Words2018
- 著者名/発表者名
  Kazuaki Furumai, Tetsuya Takiguchi and Yasuo Ariki
- 学会等名
  IWSDS2018
- 国際学会
[学会発表] Visual grounding of word embeddings: application to zero-shot image classification2018
- 著者名/発表者名
  ハスコエトトリスタン, 有木康雄, 滝口哲也
- 学会等名
  情報処理学会、コンピュータビジョンとイメージメディア研究会（CVIM）
[学会発表] ニュース情報検索システム「NetTv」のための議論対話システムー賛否判定と根拠推定に基づく議論ー2018
- 著者名/発表者名
  丸本理貴人，田中克幸，滝口哲也，有木康雄
- 学会等名
  日本音響学会2018年春季研究発表会
[学会発表] 単語の分散表現を用いた意味予測に基づく雑談応答生成2018
- 著者名/発表者名
  古舞千暁，有木康雄，滝口哲也
- 学会等名
  日本音響学会2018年春季研究発表会講演論文集
[学会発表] Attention-based LSTMを用いた音声質問応答システムにおけるユーザーの質問意図理解2018
- 著者名/発表者名
  松好祐紀，滝口哲也，有木康雄
- 学会等名
  日本音響学会2018年春季研究発表会講演論文集
[学会発表] Semantic Web and Zero-Shot Learning of Large Scale Visual Classes2017
- 著者名/発表者名
  Tristan Hascoet, Yasuo Ariki, Tetsuya Takiguchi
- 学会等名
  First International Workshop on Symbolic-Neural Learning (SNL-2017)
- 国際学会
[学会発表] Investigation of the correlations between CNN visual features and word embeddings2017
- 著者名/発表者名
  Tristan Hascoet, Yasuo Ariki, Tetsuya Takiguchi
- 学会等名
  2nd Workshop on Closing the Loop Between Vision and Language, ICCV
- 国際学会
[学会発表] 災害応急対策支援を目的とした衛星画像の被覆分類精度向上について2017
- 著者名/発表者名
  吉原篤, 滝口哲也, 有木康雄
- 学会等名
  第20回画像の認識・理解シンポジウム
[学会発表] ニュース情報検索システム「NetTv」における議論対話システム実現のためのユーザ主張・根拠の推定2017
- 著者名/発表者名
  丸本理貴人，田中克幸, 滝口哲也, 有木康雄
- 学会等名
  人工知能学会言語・音声理解と対話処理研究会
[学会発表] ユーザー支援を目的とした音声質問応答システム2017
- 著者名/発表者名
  松好祐紀，滝口哲也，有木康雄
- 学会等名
  日本音響学会2017年秋季研究発表会講演論文集
[学会発表] 人の理解や習熟をサポートする音声質問応答システム2017
- 著者名/発表者名
  松好祐紀, 滝口哲也, 有木康雄
- 学会等名
  人工知能学会言語・音声理解と対話処理研究会
[備考] 神戸大学システム情報学研究科情報科学専攻メディア情報講座
- URL
  http://www.me.cs.scitec.kobe-u.ac.jp/~takigu/publications.html

2017 年度 実施状況報告書

知識グラフを組込んだニューラルネットワークによる物体認識―物体・意味写像の提案―

研究代表者

有木 康雄 神戸大学, 都市安全研究センター, 名誉教授 (10135519)

現在までの達成度 (区分)

理由

研究成果

[学会発表] Zero-shot learning using dictionary definitions2018

著者名/発表者名

学会等名

[学会発表] Satellite Image Semantic Segmentation Using Fully Convolutional Network2018

著者名/発表者名

学会等名

[学会発表] Estimation of Object Function Using Visual Attention2018

著者名/発表者名

学会等名

[学会発表] Debate Dialog for News Question Answering System “NetTv”: Debate Based on Claim and Reason Estimation2018

著者名/発表者名

学会等名

[学会発表] Chat Response Generation Based on Semantic Prediction Using Distributed Representations of Words2018

著者名/発表者名

学会等名

[学会発表] Visual grounding of word embeddings: application to zero-shot image classification2018

著者名/発表者名

学会等名

[学会発表] ニュース情報検索システム「NetTv」のための議論対話システムー賛否判定と根拠推定に基づく議論ー2018

著者名/発表者名

学会等名

[学会発表] 単語の分散表現を用いた意味予測に基づく雑談応答生成2018

著者名/発表者名

学会等名

[学会発表] Attention-based LSTMを用いた音声質問応答システムにおけるユーザーの質問意図理解2018

著者名/発表者名

学会等名

[学会発表] Semantic Web and Zero-Shot Learning of Large Scale Visual Classes2017

著者名/発表者名

学会等名

[学会発表] Investigation of the correlations between CNN visual features and word embeddings2017

著者名/発表者名

学会等名

[学会発表] 災害応急対策支援を目的とした衛星画像の被覆分類精度向上について2017

著者名/発表者名

学会等名

[学会発表] ニュース情報検索システム「NetTv」における議論対話システム実現のためのユーザ主張・根拠の推定2017

著者名/発表者名

学会等名

[学会発表] ユーザー支援を目的とした音声質問応答システム2017

著者名/発表者名

学会等名

[学会発表] 人の理解や習熟をサポートする音声質問応答システム2017

著者名/発表者名

学会等名

[備考] 神戸大学 システム情報学研究科 情報科学専攻 メディア情報講座

URL

2017 年度実施状況報告書

有木康雄神戸大学, 都市安全研究センター, 名誉教授 (10135519)

[備考] 神戸大学システム情報学研究科情報科学専攻メディア情報講座