2019 Fiscal Year Annual Research Report

Deep semantic annotation of video contents

Research Project

Project/Area Number	17H01831
Research Institution	Waseda University
Principal Investigator	林良彦早稲田大学, 理工学術院, 教授(任期付) (80379156)
Co-Investigator(Kenkyū-buntansha)	加藤恒昭東京大学, 大学院総合文化研究科, 教授 (60334299) 小川哲司早稲田大学, 理工学術院, 教授 (70386598) 植木一也明星大学, 情報学部, 准教授 (80580638)
Project Period (FY)	2017-04-01 – 2021-03-31
Keywords	情報資源の構築・管理 / 動画 / 意味的注釈 / シーングラフ生成 / キャプション生成 / 動詞意味論 / 語彙意味関係 / オントロジー
Outline of Annual Research Achievements	本研究課題の目的は，動画中の主体者の動作内容を表す意味注釈を付与する方式を実現することにある．3年目にあたる2019年度は，以下の項目について研究を実施したが，進捗状況は予定よりやや遅れている．(国際会議発表:5件，国内会議発表:11件) (1) シーングラフの効率的な生成: 動画のフレーム画像に描写されている物体 (主体者含む)，および，それらの間の関係をグラフ構造として抽出し，キーフレーム画像群に対する系列として整形・整列させることにより意味注釈を得ることを計画している．一般にフレーム画像には多くの物体が描写されるため，シーングラフ生成においては，効率的な計算方法の確立が不可欠である．本年度は，従来より検討しているCRFを用いた大局的な最適化に加え，物体間の階層関係を利用する局所関係解析の効率化の検討を開始したが，明確に有効性の確立には至らなかった． (2) 動画に対する動作記述生成: 動画から言語表現による動作記述を生成し，これをもとに意味注釈を抽出するアプローチの研究を推進している．特に，既存手法により生成する一般的なキャプションをコンパクトな動作記述へと書き換える手法の高度化を進めていたが，言語記述の内的評価の既存指標では本研究の目的には不十分であることが判明したため，評価基準の設定・評価を行い，動作記述に基づく動画検索システムにおける基本的な有効性を確認できた． (3) 動画アドホック検索への適用の試行: TRECVID AVSタスクを対象にクエリに基づく動画検索方式の研究を継続したが，上記の意味記述の適用は未実施である． (4) 言語の意味表現に関する基礎研究の推進: 語彙意味関係の認識の高度化を推進した．特に，辞書言語資源から得られる単語の意味定義に注目し，非明示的な単語間の語彙関係を識別する方式の有用性を確認できた．以上総じて，進捗状況はやや遅れている．
Current Status of Research Progress	Current Status of Research Progress 3: Progress in research has been slightly delayed. Reason シーングラフの効率的な生成において，物体間の階層関係を利用する局所関係解析の効率化の検討を開始したが，明確に有効性の確立には至らなかった．動画に対する動作記述生成においては，本タスクに特化した言語記述の内的評価の設定・評価を行い，動作記述に基づく動画検索システムにおける基本的な有効性を確認できた．動画アドホック検索への適用に関しては，TRECVID AVSタスクを対象にクエリに基づく動画検索方式の研究を継続したが，上記の意味記述の適用は未実施である．また，語彙意味関係の認識の高度化を推進し，非明示的な単語間の語彙関係を識別する方式の有用性を確認できた．
Strategy for Future Research Activity	(1) シーングラフの効率的かつ高精度な生成: 引き続き，シーングラフ生成の高度化をすすめる．特に，精度と効率的な計算を両立するという課題に取り組む．特に，シーンに描画されている物体間の階層的な関係 (例: 全体-部分) を利用する方式を確立する．さらに，我々を取り巻く世界における常識的な知識 (コモンセンス知識) を利用する可能性を探求する． (2) 動画に対する動作記述生成: 既存手法による一般キャプションからコンパクトな動作記述を生成する方式については，ほぼ見通しがついたため，これを構造化された意味注釈形式に変換する言語解析手法の検討を進める． (3) 動画アドホック検索への適用の試行: 継続して，TRECVID AVSタスクを対象に，クエリに基づく動画検索方式を推進し，評価と要素技術へのフィードバックを行う． (4) 言語の意味表現に関する基礎研究の推進: 特に動詞に関する意味表現について，基礎研究を継続する． (5) コモンセンス知識適用に関する検討の開始: シーングラフ生成や動作記述生成において，我々が有する常識的知識 (コモンセンス知識) を適用することの必要性が明らかになりつつある．そこで，コモンセンス知識資源についての調査を進め，上記の要素技術に活かす手段の検討を開始する．さらに，より広範な自然言語処理タスクへの適用についても検討を行う．

Research Products
(16 results)

All 2020 2019

All Presentation (16 results) (of which Int'l Joint Research: 5 results)

[Presentation] 感情推定における感情カテゴリに関する先験的知識の利用2020
- Author(s)
  田辺ひかり, 小川哲司, 小林哲則, 林良彦
- Organizer
  言語処理学会第26回年次大会 (NLP2020) (会議録有)
[Presentation] 答えを用いない対話型質問の生成2020
- Author(s)
  中西真央, 小林哲則, 林良彦
- Organizer
  言語処理学会第26回年次大会 (NLP2020) (会議録有)
[Presentation] 質問応答の強化学習による抽象型要約の精度向上2020
- Author(s)
  高塚雅人, 小林哲則, 林良彦
- Organizer
  言語処理学会第26回年次大会 (NLP2020) (会議録有)
[Presentation] 動画からの動作記述の生成とその評価2020
- Author(s)
  平川幸司, 小林哲則, 林良彦
- Organizer
  言語処理学会第26回年次大会 (NLP2020) (会議録有)
[Presentation] 所的依存構造をSelf-Attentionにより考慮する翻訳文生成2020
- Author(s)
  露木浩章, 小川哲司, 小林哲則, 林良彦
- Organizer
  言語処理学会第26回年次大会 (NLP2020) (会議録有)
[Presentation] Bridging the Defined and the Defining: Exploiting Implicit Lexical Semantic Relations in Definition Modeling2019
- Author(s)
  Koki Washio, Satoshi Sekine, and Tsuneaki Kato
- Organizer
  EMNLP2019 (査読有，会議録有)
- Int'l Joint Research
[Presentation] SemSeq: A Regime for Training Widely-Applicable Word-Sequence Encoders2019
- Author(s)
  Hiroaki Tsuyuki, Tetsuji Ogawa, Tetsunori Kobayashi, Yoshihiko Hayashi
- Organizer
  PACLING2019 (査読有，会議録有)
- Int'l Joint Research
[Presentation] Towards Answer-unaware Conversational Question Generation2019
- Author(s)
  Mao Nakanishi, Tetsunori Kobayashi, Yoshihiko Hayashi
- Organizer
  MRQA@EMNLP2019 (査読有，会議録有)
- Int'l Joint Research
[Presentation] Waseda_Meisei_SoftBank at TRECVID 2019: Ad-hoc Video Search2019
- Author(s)
  Kazuya Ueki, Takayuki Hori, and Tetsunori Kobayashi
- Organizer
  TRECVID2019 (会議録有)
- Int'l Joint Research
[Presentation] Zero-shot Video Retrieval using a Large-scale Video Database2019
- Author(s)
  Kazuya Ueki and Takayuki Hori
- Organizer
  MDACL@ICCV2019 (査読有，会議録有)
- Int'l Joint Research
[Presentation] クエリ文を用いた映像検索手法の比較検証2019
- Author(s)
  植木一也, 堀隆之, 小林哲則
- Organizer
  第22回画像の認識・理解シンポジウム (MIRU2019) (会議録有)
[Presentation] マルチタスク学習を用いた顔の複数属性推定2019
- Author(s)
  武藤良, 桑原明栄子, 植木一也
- Organizer
  第22回画像の認識・理解シンポジウム (MIRU2019) (会議録有)
[Presentation] 複数の人物属性を利用した大規模映像からの人物検索2019
- Author(s)
  セイエドネシャドロスタム，武藤良，堀隆之，植木一也
- Organizer
  第22回画像の認識・理解シンポジウム (MIRU2019) (会議録有)
[Presentation] 双方向時系列情報を利用した検出結果と正解情報付与による効率的なアノテーション手法2019
- Author(s)
  真殿航輝，中野鐵兵，小林哲則，小川哲司
- Organizer
  第22回画像の認識・理解シンポジウム (MIRU2019) (会議録有)
[Presentation] 動画像から得られる牛の身体情報に基づく分娩予兆検知システム2019
- Author(s)
  兵頭亮介，菅原一真，中野鐵兵，赤羽誠，小林哲則，小川哲司
- Organizer
  電子情報通信学会 PMRU2019-1 (会議録有)
[Presentation] 画像から得られる牛の身体情報に基づく分娩予兆検知2019
- Author(s)
  兵頭亮介，斎藤奨，中野鐵兵，赤羽誠，小林哲則，小川哲司
- Organizer
  2019年度人工知能学会全国大会 (会議録有)

2019 Fiscal Year Annual Research Report

Deep semantic annotation of video contents

Principal Investigator

林 良彦 早稲田大学, 理工学術院, 教授(任期付) (80379156)

Current Status of Research Progress

Reason

Research Products

[Presentation] 感情推定における感情カテゴリに関する先験的知識の利用2020

Author(s)

Organizer

[Presentation] 答えを用いない対話型質問の生成2020

Author(s)

Organizer

[Presentation] 質問応答の強化学習による抽象型要約の精度向上2020

Author(s)

Organizer

[Presentation] 動画からの動作記述の生成とその評価2020

Author(s)

Organizer

[Presentation] 所的依存構造をSelf-Attentionにより考慮する翻訳文生成2020

Author(s)

Organizer

[Presentation] Bridging the Defined and the Defining: Exploiting Implicit Lexical Semantic Relations in Definition Modeling2019

Author(s)

Organizer

[Presentation] SemSeq: A Regime for Training Widely-Applicable Word-Sequence Encoders2019

Author(s)

Organizer

[Presentation] Towards Answer-unaware Conversational Question Generation2019

Author(s)

Organizer

[Presentation] Waseda_Meisei_SoftBank at TRECVID 2019: Ad-hoc Video Search2019

Author(s)

Organizer

[Presentation] Zero-shot Video Retrieval using a Large-scale Video Database2019

Author(s)

Organizer

[Presentation] クエリ文を用いた映像検索手法の比較検証2019

Author(s)

Organizer

[Presentation] マルチタスク学習を用いた顔の複数属性推定2019

Author(s)

Organizer

[Presentation] 複数の人物属性を利用した大規模映像からの人物検索2019

Author(s)

Organizer

[Presentation] 双方向時系列情報を利用した検出結果と正解情報付与による効率的なアノテーション手法2019

Author(s)

Organizer

[Presentation] 動画像から得られる牛の身体情報に基づく分娩予兆検知システム2019

Author(s)

Organizer

[Presentation] 画像から得られる牛の身体情報に基づく分娩予兆検知2019

Author(s)

Organizer

林良彦早稲田大学, 理工学術院, 教授(任期付) (80379156)