2017 年度実施状況報告書

モダリティの転移によるデータドリブンな線画・漫画に対する自動彩色

研究課題

研究課題/領域番号	17K19963
研究機関	東京大学
研究代表者	相澤清晴東京大学, 大学院情報理工学系研究科, 教授 (20192453)
研究期間 (年度)	2017-06-30 – 2019-03-31
キーワード	漫画 / 着色 / 物体検出 / 画像検索 / GAN / 深層学習
研究実績の概要	漫画の彩色、および関連する周辺技術について、以下の取り組みを行った。（１）参照画像を用いたcGANに基づく着色：漫画の着色にあたり、cGAN (conditional Generative Adversarial Networks)に基づく手法を提案した。膨大な画像でトレーニングを行う通常のcGANとは異なり、提案手法では、大量の画像は使わずに、キャラクタの彩色のために、一枚の彩色されたその参照画像だけを用いることで妥当な彩色が可能であることを示した。cGANの利用に起因するボケに関しては、セグメンテーションと色補正も提案し、検証した。(arXiv掲載、MANPU2017に採択、発表) （２）Manga109データセットの作成：漫画画像処理で基幹的な役を果たすデータセットを構築してきた。そのアノテーションを作成中であり、データ公開への準備を進めた。（３）深層学習を用いた高精度検出：漫画の要素であるセリフ，キャラクタ（顔，全体），コマの検出を行った。各対象要素のバウンディングボックスが大きく重複することが問題となるが、これに対して、深層学習に基づくSSD (Single Shot multibox Detectot)のネットワークを発展させたSSD-forkを提案した。既存手法を大きく上回る精度の高い検出が実現できることを示した。（IEICE大会・研究会にて発表、arXivに掲載し、国際学術誌へ投稿）（４）深層特徴を用いたスケッチからの検索：深層特徴を用いたスケッチからの検索を提案した。漫画とその線画のそれぞれでトレーニングした二つのＣＮＮを利用し、スケッチからの漫画の検索、検索結果からの適合性フィードバックの両者に深層特徴を用いる検索となっている。エッジ特徴を用いる既存手法に比べて、はるかに高い検索精度を実現した。（JSAI大会にて発表, MANPU2017に採択、発表）
現在までの達成度 (区分)	現在までの達成度 (区分) 1: 当初の計画以上に進展している理由当初計画していた深層学習を用いた着色については、GANを用いた試みを進めることができた。写真、線画のペアからなる大量の画像での学習は、漫画の着色に関して必ずしも良い結果を生まないことを確認した。そこで、視点を全く変えて、１枚の画像ペアという極めて限定した学習が同一キャラクタの着色という条件に対しては、機能することを確認した。さらに、着色課題だけでなく、漫画画像処理の基盤となる検出、検索に対して、深層学習を取り入れた方式を提案するに至った。その他、広く漫画画像処理、認識、検索の技術研究に大きく影響するデータセットを整備し、公開に向けて大きく、前進した。
今後の研究の推進方策	着色に関して、計画とは異なるアプローチを試みている。ＧＡＮベースの自動着色は、その着色効果がぼけた水彩のようになり、所望の結果が得られないことが多い。そのため、インタラクティブな手法の検討を進めている。マニュアルでの着色は、精細な領域抜き出しが最も重い負担であるため、わずかな手間で漫画の着色領域の切り抜きができる手法について検討を進めている。一般の画像処理では、セグメンテーションと呼ばれる課題であるが、漫画の場合には、自然画像よりはるかに高い境界の精度が求められる。State-of-the-artの手法を含めて、検証を進めている。
次年度使用額が生じた理由	少量の残額を有効に使うために次年度に繰り越した。

研究成果
(10件)

すべて 2018 2017 その他

すべて雑誌論文 (4件) (うち国際共著 1件、オープンアクセス 2件、査読あり 2件) 学会発表 (4件) 備考 (1件) 産業財産権 (1件)

[雑誌論文] Object Detection for Comics using Manga109 Annotations2018
- 著者名/発表者名
  Toru Ogawa, Atsushi Otsubo, Rei Narita, Yusuke Matsui, Toshihiko Yamasaki, Kiyoharu Aizawa
- 雑誌名
  
  arXiv
  
  巻: 1803 ページ: 1,18
- DOI
  arXiv:1803.08670
- オープンアクセス
[雑誌論文] cGAN-based Manga Colorization Using a Single Training Image2017
- 著者名/発表者名
  Paulina Hensman, Kiyoharu Aizawa
- 雑誌名
  
  arXiv
  
  巻: 1706 ページ: 1,8
- DOI
  arXiv:1706.06918
- オープンアクセス
[雑誌論文] cGAN-Based Manga Colorization Using a Single Training Image2017
- 著者名/発表者名
  Paulina Hensman, Kiyoharu Aizawa
- 雑誌名
  
  IAPR ICDAR Workshop MANPU2017
  
  巻: 1 ページ: 72,77
- DOI
  10.1109/ICDAR.2017.295
- 査読あり / 国際共著
[雑誌論文] Sketch-based Manga Retrieval using Deep Features2017
- 著者名/発表者名
  Rei Narita, Koki Tsubota, Toshihiko Yamasaki, Kiyoharu Aizawa
- 雑誌名
  
  IAPR ICDAR Workshop MANPU2017
  
  巻: 1 ページ: 49,53
- DOI
  DOI: 10.1109/ICDAR.2017.291
- 査読あり
[学会発表] 並列化された検出器による高精度漫画物体検出2018
- 著者名/発表者名
  小川徹、山崎俊彦、相澤清晴
- 学会等名
  映像情メディア学会、メディア工学研究会
[学会発表] 深層特徴を用いた漫画検索システム2017
- 著者名/発表者名
  成田嶺, 坪田亘記, 山崎俊彦, 相澤清晴
- 学会等名
  画像の認識・理解シンポジウム（MIRU2017)
[学会発表] 漫画物体検出に向けた検出器の並列化2017
- 著者名/発表者名
  小川徹、山崎俊彦、相澤清晴
- 学会等名
  情報科学技術フォーラム、FIT2017
[学会発表] 深層特徴を用いたスケッチに基づく漫画検索2017
- 著者名/発表者名
  成田嶺, 小川徹，松井勇佑，山崎俊彦, 相澤清晴
- 学会等名
  人工知能学会全国大会
[備考] Manga109
- URL
  http://www.manga109.org
[産業財産権] 画像処理装置及びプログラム2017
- 発明者名
  相澤清晴，小川徹
- 権利者名
  相澤清晴，小川徹
- 産業財産権種類
  特許
- 産業財産権番号
  特願2017-169632

2017 年度 実施状況報告書

モダリティの転移によるデータドリブンな線画・漫画に対する自動彩色

研究代表者

相澤 清晴 東京大学, 大学院情報理工学系研究科, 教授 (20192453)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Object Detection for Comics using Manga109 Annotations2018

著者名/発表者名

雑誌名

DOI

[雑誌論文] cGAN-based Manga Colorization Using a Single Training Image2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] cGAN-Based Manga Colorization Using a Single Training Image2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] Sketch-based Manga Retrieval using Deep Features2017

著者名/発表者名

雑誌名

DOI

[学会発表] 並列化された検出器による高精度漫画物体検出2018

著者名/発表者名

学会等名

[学会発表] 深層特徴を用いた漫画検索システム2017

著者名/発表者名

学会等名

[学会発表] 漫画物体検出に向けた検出器の並列化2017

著者名/発表者名

学会等名

[学会発表] 深層特徴を用いたスケッチに基づく漫画検索2017

著者名/発表者名

学会等名

[備考] Manga109

URL

[産業財産権] 画像処理装置及びプログラム2017

発明者名

権利者名

産業財産権種類

産業財産権番号

2017 年度実施状況報告書

相澤清晴東京大学, 大学院情報理工学系研究科, 教授 (20192453)