2022 Fiscal Year Annual Research Report

Development of Technology for Realizing High-Compression of Video by Extracting Important Regions

Research Project

Project/Area Number	20H04201
Research Institution	Tohoku University
Principal Investigator	大町真一郎東北大学, 工学研究科, 教授 (30250856)
Co-Investigator(Kenkyū-buntansha)	宮崎智東北大学, 工学研究科, 助教 (10755101) 大町方子仙台高等専門学校, 総合工学科, 教授 (90316448)
Project Period (FY)	2020-04-01 – 2023-03-31
Keywords	映像符号化
Outline of Annual Research Achievements	本研究は、静止画像や映像から時空間上の重要領域を検出し、画像や映像としての価値や必要な情報を損なわずに高圧縮を実現する技術を開発することを目的としている。重要領域を検出することで保存または伝送すべきデータを判別し、その領域の情報を保持したまま高圧縮することで保存や伝送の効率化を実現する。画像データや映像データの冗長性を極限まで排除することでこれらのデータを有効活用する基盤技術を開発することを目指している。映像の意味を理解することにより重要領域を検出するために、前年度に引き続きイメージキャプショニングを利用する手法について検討した。すなわち、映像を説明する文章を生成し、文章の意味を解析することにより重要な領域や重要度を推定する。重要度を判断するために主語や目的語等文章中の重要な語を用いた。重要領域とそれ以外を分けて符号化する際にこれまではJPEG2000などの枠組みを用いていたが、機械学習を用いた手法に変更することで精度が向上することを確認した。また、これまでは主に静止画像を用いて検証してきたが、本年度は映像を対象とした実験を行った。検出される領域がフレームごとにばらつくなどの映像特有の問題に対応するための画像処理手法を導入し、精度を向上させることに成功した。また、データサイズを大幅に削減する手法として、画像生成を用いた画像符号化手法を引き続き検討した。敵対的生成ネットワークを用いた機械学習により、ビットレートを下げつつ主観的・客観的な画像品質を向上させることを目指した。特に、敵対的生成ネットワークにおけるGeneratorとDiscriminatorの役割を精査し、両者が拮抗して学習することで画質が向上することを示した。さらに、一般的なJPEGなどの画像符号化を用いた際にも高圧縮が可能となるよう、あらかじめ機械学習を用いて符号化に適した画像に変換する手法も開発した。
Research Progress Status	令和4年度が最終年度であるため、記入しない。
Strategy for Future Research Activity	令和4年度が最終年度であるため、記入しない。

Research Products
(10 results)

All 2023 2022

All Journal Article (2 results) (of which Peer Reviewed: 1 results, Open Access: 1 results) Presentation (7 results) (of which Int'l Joint Research: 2 results, Invited: 1 results) Book (1 results)

[Journal Article] 情景画像中の重要テキストの検出と伝送2023
- Author(s)
  大町真一郎, 宮崎智
- Journal Title
  
  画像ラボ
  
  Volume: 34 Pages: 17～22
[Journal Article] Important Region Estimation Using Image Captioning2022
- Author(s)
  Taku Suzuki, Daisuke Sato, Yoshihiro Sugaya, Tomo Miyazaki, Shinichiro Omachi
- Journal Title
  
  IEEE Access
  
  Volume: 10 Pages: 105546～105555
- DOI
  10.1109/ACCESS.2022.3211260
- Peer Reviewed / Open Access
[Presentation] Masked Image Modelingを利用した情景画像中のテキスト認識2023
- Author(s)
  三ツ井悠翔, 宮崎智, 大町真一郎
- Organizer
  言語処理学会第29回年次大会
[Presentation] Detecting Important Information from Scene Images via Texts2023
- Author(s)
  Shinichiro Omachi
- Organizer
  The 6th Tohoku Uni-NTU Symposium on Interdisciplinary AI and Human Studies
- Int'l Joint Research / Invited
[Presentation] Rethinking Degradation: Radiograph Super-Resolution via AID-SRGAN2022
- Author(s)
  Yongsong Huang, Qingzhong Wang, Shinichiro Omachi
- Organizer
  The 13th International Workshop on Machine Learning in Medical Imaging
- Int'l Joint Research
[Presentation] GANを使った画像符号化における識別器に関する検討2022
- Author(s)
  岩井翔真, 宮崎智, 大町真一郎
- Organizer
  画像の認識・理解シンポジウム2022
[Presentation] 物体のテクスチャに注目したGANによる熱赤外線画像着色手法の検討2022
- Author(s)
  宇川慧, 宮崎智, 大町真一郎
- Organizer
  画像の認識・理解シンポジウム2022
[Presentation] 編集距離に基づいた距離学習による情景画像文字認識結果の修正に関する検討2022
- Author(s)
  梶原颯希, 宮崎智, 大町真一郎
- Organizer
  画像の認識・理解シンポジウム2022
[Presentation] U-Netを用いた電子部品画像からの配線検出2022
- Author(s)
  谷本衡哉, 宮崎智, 大町真一郎
- Organizer
  画像の認識・理解シンポジウム2022
[Book] 機械学習の可能性2022
- Author(s)
  計測自動制御学会、浮田浩行、濱上知樹、藤吉弘亘、大町真一郎、戸田智基、岩崎敦、小林泰介、鈴木亮太、木村雄喜、橋本大樹、玉垣勇樹、水谷麻紀子、永田毅、木村光成、李晃伸、川嶋宏彰
- Total Pages
  240
- Publisher
  コロナ社
- ISBN
  978-4339033854

2022 Fiscal Year Annual Research Report

Development of Technology for Realizing High-Compression of Video by Extracting Important Regions

Principal Investigator

大町 真一郎 東北大学, 工学研究科, 教授 (30250856)

Research Products

[Journal Article] 情景画像中の重要テキストの検出と伝送2023

Author(s)

Journal Title

[Journal Article] Important Region Estimation Using Image Captioning2022

Author(s)

Journal Title

DOI

[Presentation] Masked Image Modelingを利用した情景画像中のテキスト認識2023

Author(s)

Organizer

[Presentation] Detecting Important Information from Scene Images via Texts2023

Author(s)

Organizer

[Presentation] Rethinking Degradation: Radiograph Super-Resolution via AID-SRGAN2022

Author(s)

Organizer

[Presentation] GANを使った画像符号化における識別器に関する検討2022

Author(s)

Organizer

[Presentation] 物体のテクスチャに注目したGANによる熱赤外線画像着色手法の検討2022

Author(s)

Organizer

[Presentation] 編集距離に基づいた距離学習による情景画像文字認識結果の修正に関する検討2022

Author(s)

Organizer

[Presentation] U-Netを用いた電子部品画像からの配線検出2022

Author(s)

Organizer

[Book] 機械学習の可能性2022

Author(s)

Total Pages

Publisher

ISBN

大町真一郎東北大学, 工学研究科, 教授 (30250856)