• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実施状況報告書

マルチタスク学習を行う深層学習器のアーキテクチャの開発

研究課題

研究課題/領域番号 18K11348
研究機関東京大学

研究代表者

川上 玲  東京大学, 大学院情報理工学系研究科, 特任講師 (90591305)

研究期間 (年度) 2018-04-01 – 2021-03-31
キーワードマルチタスク学習 / ニューラルネットワーク / 物体検出 / 汎化性能
研究実績の概要

平成30年度は,マルチタスク学習(MTL)を行うためのタスクの調査と選定を行う予定であった.対象をコンピュータビジョン分野に限れば,多クラス認識,領域分割と物体検出,物体追跡と検出,法線推定とエッジ分類,属性推定とクラス認識,人物の姿勢推定と行動認識,顔検出と姿勢・年齢・ランドマーク推定,画像分類と審美的品質推定,などでマルチタスク学習が有効であることが分かっていた.さらに,深度推定と意味領域分割,エッジ検出と深度,及び法線推定,顔認証と顔の属性推定などでも有効であることが分かった.

また,当該年度では,同じデータに異なるラベルがついたデータセットではなく,異なるデータに異種のラベルがついたタスクの組み合わせも考慮し,補足しあうかを調査する予定であったが,計画を変更し,平成31年度に行う予定であった,本プロジェクトで提案する交差接続(Cross-Unit)が,領域分割と物体検出のタスクの組合せにおいて有効であるかの検証を行った.物体検出には,Caltech Pedestrianという人検出のデータセットを使用し,領域分割にはCityscapesという50都市(主にドイツ,一部スイスの都市)を車載カメラで路上から撮影した画像に画素レベルでラベル付けがされたものを用いた.結果として,物体(人)検出は領域分割からの知識を流用し,性能が向上することを確認した.また,検出は汎化性能が向上することを確認した.この結果は現在国際会議に投稿中である.また,物体検出から派生した研究成果が英文論文誌,及び国内の学術会議などに採択された.派生研究でも英文雑誌に投稿中のものが一件ある.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

平成30年度の進捗は概ね順調であり,タスクの調査や選定は予定通り進んだ.また,異なるデータで異種のラベルがついたタスクの組み合わせまで調査が進まなかったものの,手法の開発は当初の予定よりも早く進んだ.特に,交差接続を領域分割と物体検出の組み合わせに適用できたことは大きい.物体検出は性能が向上することを確認し,また,汎化性能も向上する可能性があることを示せた.具体的には,シングルタスクで学習した検出器のモデルの性能が,画像一枚あたりの平均見落とし率で21.5%(低いほど良い)あり,他のベースラインの手法(たとえば,従来の下層を共有する手法)などでは,これに対する向上が全く見られなかったのに対し,提案する交差接続では,画像一枚あたりの平均見落とし率が19.4%と,性能の向上が確認できた.さらに,これらの学習モデルを全く別のデータセット(KITTIベンチマーク,カールスルーエの車載カメラ映像)に適用したところ,シングルタスクで55.3%の平均見落とし率であったのに対し,マルチタスク学習の手法は,51~52%とすべてシングルタスクを上回ったものの,提案する交差接続ではさらに48.61%の平均見落とし率を達成できた.すなわち,同じ学習データセットで,より有用な学習が行えていることが示せた.この成果は現在国際会議に投稿中であり,またいくつかの検出の派生研究の成果がそれぞれ英文論文誌や国内会議に採択され,次年度への基礎を築くことができた.

今後の研究の推進方策

今後は,交差接続を別のデータで検証し,性能向上を確認し,実証を継続することを計画している.データは,申請者が若手研究で作成していた,鳥検出のデータで,検出や領域分割を行う予定である.このデータは,近畿地方,及び北海道でそれぞれ作成されているため,どちらかのデータで学習させ,もう一方で汎化性能を評価することができる.ベースラインの手法も実装し,性能を比較する.また,今回,物体検出は性能向上を確認できたものの,領域分割の結果は性能向上が見られなかった.この原因を考察するとともに,可能であれば,データの多様性や複雑性,情報量を数値化することに取り組みたい.また,必要であれば,検証用のデータも作成する.

また,当初の計画通り,交差接続の畳込み層を畳込みLSTMで代替した,交差接続型時系列データ処理のネットワークの設計にも取り組む.次年度,および翌年度で,ネットワークの開発や最適化を行うとともに,動画のデータを整備し,評価に用いる.計画が進めば,不完全なデータからの学習にまで適用し,性能を評価する.

次年度使用額が生じた理由

実験では,公開されているベンチマークのデータを上手く利用できたため,データ作成のコストが想定よりも少なく済んだ.一方で多くの成果が実を結びつつあり,来年度は論文の出版件数が計画時の想定よりも増加する見込みであるため,未使用額は,これらの出版費用に充てる.

  • 研究成果

    (9件)

すべて 2018 その他

すべて 雑誌論文 (5件) (うち国際共著 2件、 査読あり 1件、 オープンアクセス 2件) 学会発表 (3件) 備考 (1件)

  • [雑誌論文] Pedestrian detection with motion features via two-stream ConvNets2018

    • 著者名/発表者名
      Yoshihashi Ryota、Trinh Tu Tuan、Kawakami Rei、You Shaodi、Iida Makoto、Naemura Takeshi
    • 雑誌名

      IPSJ Transactions on Computer Vision and Applications

      巻: 10 ページ: 1--13

    • DOI

      10.1186/s41074-018-0048-5

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Cross-connected Networks for Multi-task Learning of Detection and Segmentation2018

    • 著者名/発表者名
      Seiichiro Fukuda, Ryota Yoshihashi, Rei Kawakami, Shaodi You, Makoto Iida, Takeshi Naemura
    • 雑誌名

      arXiv:1805.05569v1

      巻: 5 ページ: 1--16

    • オープンアクセス / 国際共著
  • [雑誌論文] 5分で分かる!? 有名論文ナナメ読み Geoffrey E. Hinton, Simon Osindero and Yee-Whye Teh : A Fast Learning Algorithm for Deep Belief Nets2018

    • 著者名/発表者名
      川上玲
    • 雑誌名

      情報処理

      巻: 59 ページ: 946-948

  • [雑誌論文] 第98回 私の研究開発ツール マイクロソフトコグニティブサービス2018

    • 著者名/発表者名
      川上玲
    • 雑誌名

      映像情報メディア学会誌

      巻: 72 ページ: 423-426

  • [雑誌論文] CVPR 2018 参加報告2018

    • 著者名/発表者名
      谷合竜典, 川上玲
    • 雑誌名

      情報処理

      巻: 59 ページ: 1044-1046

  • [学会発表] 動き表現の深層学習に基づく小物体の検出と追跡2018

    • 著者名/発表者名
      吉橋 亮太,チン トゥアントゥー,川上 玲,尤 少迪,飯田 誠,苗村 健
    • 学会等名
      画像の認識・理解シンポジウム (MIRU2018)
  • [学会発表] 風車ブレードのドローンによる空撮画像における異常検知手法の検討2018

    • 著者名/発表者名
      王亦楠,吉橋亮太,川上玲,尤少迪,原野徹,伊藤昌彦,駒込桂,飯田誠,苗村健
    • 学会等名
      風力エネルギー利用シンポジウム
  • [学会発表] GANを用いた単一画像からのハイダイナミックレンジ画像の生成2018

    • 著者名/発表者名
      森脇健太, 吉橋 亮太, 川上 玲, ユウ シャオディ, 苗村 健
    • 学会等名
      情報処理学会CVIM研究会
  • [備考] Rei Kawakami

    • URL

      https://nae-lab.org/~rei/research/research.html

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi