2020 年度実績報告書

マルチタスク学習を行う深層学習器のアーキテクチャの開発

研究課題

研究課題/領域番号	18K11348
研究機関	東京工業大学
研究代表者	川上玲東京工業大学, 情報理工学院, 特任准教授 (90591305)
研究期間 (年度)	2018-04-01 – 2021-03-31
キーワード	マルチタスク学習 / ニューラルネットワーク / 物体検出 / 汎化性能 / 物体追跡
研究実績の概要	申請者は，本事業において，マルチタスク学習（MTL, Multitask Learning）を行う深層学習器のアーキテクチャ，特に，物体の検出と意味領域分割，及び，物体の追跡と検出を行うMTLの開発を行ってきた． 2018年度はタスクの組み合わせやデータセットの選定を行い，2019年度は，提案するCross-Unitの改善を行い，MTLによる汎化性能の向上について検証した．2020年度は， Cross-UnitのConvolutionをConvLSTMで代替した，時系列データを処理するネットワークの設計に取り組み，性能を評価する予定であった． 2020年度は実際にそのようなネットワークを設計し，時系列で追跡しつつその物体が何であるかを分類するマルチタスクの処理を学習させた．これを，申請者が平成28~29年度で作成した鳥の動画や，既存のドローンの飛行動画に適応し，他手法と性能を比較した．その結果，分類を学習した特徴抽出器が追跡にも効果的に働き，既存の一般的な追跡器よりも追跡精度が高く，かつ，単純な検出器，追跡器と分類器の組み合わせ，空間情報を棄却するLSTMと追跡器の組み合わせ，などよりも，提案手法が高い精度を示した．提案手法による性能改善は中程度のサイズの物体で顕著であった．これは，データと，学習と追跡のしやすさの兼ね合いによる．これらの結果は海外雑誌の特集号に投稿され，不採択だったもののarxiv版に投稿を完了させた．時系列の処理を発展させ，行動予測にも応用し，この結果が国際会議に採択された．また，MTLは一般に汎化性能を向上させることから，データの不足を補える可能性がある．このため，音声と動画のマルチタスク学習に着手し，複数のモダリティを学習するための基礎的な結果を得た．

研究成果
(8件)

すべて 2021 2020 その他

すべて国際共同研究 (1件) 雑誌論文 (1件) (うち国際共著 1件、オープンアクセス 1件) 学会発表 (5件) (うち国際学会 1件、招待講演 1件) 備考 (1件)

[国際共同研究] University of Amsterdam(オランダ)
- 国名
  オランダ
- 外国機関名
  University of Amsterdam
[雑誌論文] Finding a Needle in a Haystack: Tiny Flying Object Detection in 4K Videos using a Joint Detection-and-Tracking Approach2021
- 著者名/発表者名
  Ryota Yoshihashi, Rei Kawakami, Shaodi You, Tu Tuan Trinh, Makoto Iida, Takeshi Naemura
- 雑誌名
  
  arxiv
  
  巻: 05 ページ: 1-18
- オープンアクセス / 国際共著
[学会発表] RNN-based Motion Prediction in Competitive Fencing Considering Interaction between Players2020
- 著者名/発表者名
  Yutaro Honda, Rei Kawakami, Takeshi Naemura
- 学会等名
  British Machine Vision Conference
- 国際学会
[学会発表] 映像生成による時間順序の並べ替えで学習した時空間コンテキストに基づく異常検知2020
- 著者名/発表者名
  邵文, 川上玲, 苗村健
- 学会等名
  画像の認識・理解シンポジウム(MIRU2020)
[学会発表] フェンシングにおける選手間相互作用を考慮したRNNによる姿勢予測2020
- 著者名/発表者名
  本田悠太郎, 川上玲, 苗村健
- 学会等名
  統計関連学会連合大会
- 招待講演
[学会発表] フェンシングにおける選手間相互作用を考慮したRNNによる姿勢予測2020
- 著者名/発表者名
  本田悠太郎, 川上玲, 苗村健
- 学会等名
  画像の認識・理解シンポジウム(MIRU2020)
[学会発表] 画像と音声の特徴マッチングによる物体およびシーンを考慮した環境音の生成2020
- 著者名/発表者名
  Chanya Kukulprasong, 川上玲, 苗村健
- 学会等名
  画像の認識・理解シンポジウム(MIRU2020)
[備考] Rei Kawakami
- URL
  https://d-itlab.c.titech.ac.jp/~reikawa/research/research.html

2020 年度 実績報告書

マルチタスク学習を行う深層学習器のアーキテクチャの開発

研究代表者

川上 玲 東京工業大学, 情報理工学院, 特任准教授 (90591305)

研究成果

[国際共同研究] University of Amsterdam(オランダ)

国名

外国機関名

[雑誌論文] Finding a Needle in a Haystack: Tiny Flying Object Detection in 4K Videos using a Joint Detection-and-Tracking Approach2021

著者名/発表者名

雑誌名

[学会発表] RNN-based Motion Prediction in Competitive Fencing Considering Interaction between Players2020

著者名/発表者名

学会等名

[学会発表] 映像生成による時間順序の並べ替えで学習した時空間コンテキストに基づく異常検知2020

著者名/発表者名

学会等名

[学会発表] フェンシングにおける選手間相互作用を考慮したRNNによる姿勢予測2020

著者名/発表者名

学会等名

[学会発表] フェンシングにおける選手間相互作用を考慮したRNNによる姿勢予測2020

著者名/発表者名

学会等名

[学会発表] 画像と音声の特徴マッチングによる物体およびシーンを考慮した環境音の生成2020

著者名/発表者名

学会等名

[備考] Rei Kawakami

URL

2020 年度実績報告書

川上玲東京工業大学, 情報理工学院, 特任准教授 (90591305)