• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

Development of Technology for Realizing High-Compression of Video by Extracting Important Regions

Research Project

Project/Area Number 20H04201
Research InstitutionTohoku University

Principal Investigator

大町 真一郎  東北大学, 工学研究科, 教授 (30250856)

Co-Investigator(Kenkyū-buntansha) 宮崎 智  東北大学, 工学研究科, 助教 (10755101)
大町 方子  仙台高等専門学校, 総合工学科, 教授 (90316448)
Project Period (FY) 2020-04-01 – 2023-03-31
Keywords映像符号化
Outline of Annual Research Achievements

本研究は、静止画像や映像から時空間上の重要領域を検出し、画像や映像としての価値や必要な情報を損なわずに高圧縮を実現する技術を開発することを目的としている。重要領域を検出することで保存または伝送すべきデータを判別し、その領域の情報を保持したまま高圧縮することで保存や伝送の効率化を実現する。画像データや映像データの冗長性を極限まで排除することでこれらのデータを有効活用する基盤技術を開発することを目指している。
映像の意味を理解することにより重要領域を検出するために、前年度に引き続きイメージキャプショニングを利用する手法について検討した。すなわち、映像を説明する文章を生成し、文章の意味を解析することにより重要な領域や重要度を推定する。重要度を判断するために主語や目的語等文章中の重要な語を用いた。重要領域とそれ以外を分けて符号化する際にこれまではJPEG2000などの枠組みを用いていたが、機械学習を用いた手法に変更することで精度が向上することを確認した。また、これまでは主に静止画像を用いて検証してきたが、本年度は映像を対象とした実験を行った。検出される領域がフレームごとにばらつくなどの映像特有の問題に対応するための画像処理手法を導入し、精度を向上させることに成功した。
また、データサイズを大幅に削減する手法として、画像生成を用いた画像符号化手法を引き続き検討した。敵対的生成ネットワークを用いた機械学習により、ビットレートを下げつつ主観的・客観的な画像品質を向上させることを目指した。特に、敵対的生成ネットワークにおけるGeneratorとDiscriminatorの役割を精査し、両者が拮抗して学習することで画質が向上することを示した。さらに、一般的なJPEGなどの画像符号化を用いた際にも高圧縮が可能となるよう、あらかじめ機械学習を用いて符号化に適した画像に変換する手法も開発した。

Research Progress Status

令和4年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

令和4年度が最終年度であるため、記入しない。

  • Research Products

    (10 results)

All 2023 2022

All Journal Article (2 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (7 results) (of which Int'l Joint Research: 2 results,  Invited: 1 results) Book (1 results)

  • [Journal Article] 情景画像中の重要テキストの検出と伝送2023

    • Author(s)
      大町真一郎, 宮崎 智
    • Journal Title

      画像ラボ

      Volume: 34 Pages: 17~22

  • [Journal Article] Important Region Estimation Using Image Captioning2022

    • Author(s)
      Taku Suzuki, Daisuke Sato, Yoshihiro Sugaya, Tomo Miyazaki, Shinichiro Omachi
    • Journal Title

      IEEE Access

      Volume: 10 Pages: 105546~105555

    • DOI

      10.1109/ACCESS.2022.3211260

    • Peer Reviewed / Open Access
  • [Presentation] Masked Image Modelingを利用した情景画像中のテキスト認識2023

    • Author(s)
      三ツ井悠翔, 宮崎智, 大町真一郎
    • Organizer
      言語処理学会第29回年次大会
  • [Presentation] Detecting Important Information from Scene Images via Texts2023

    • Author(s)
      Shinichiro Omachi
    • Organizer
      The 6th Tohoku Uni-NTU Symposium on Interdisciplinary AI and Human Studies
    • Int'l Joint Research / Invited
  • [Presentation] Rethinking Degradation: Radiograph Super-Resolution via AID-SRGAN2022

    • Author(s)
      Yongsong Huang, Qingzhong Wang, Shinichiro Omachi
    • Organizer
      The 13th International Workshop on Machine Learning in Medical Imaging
    • Int'l Joint Research
  • [Presentation] GANを使った画像符号化における識別器に関する検討2022

    • Author(s)
      岩井翔真, 宮崎智, 大町真一郎
    • Organizer
      画像の認識・理解シンポジウム2022
  • [Presentation] 物体のテクスチャに注目したGANによる熱赤外線画像着色手法の検討2022

    • Author(s)
      宇川慧, 宮崎智, 大町真一郎
    • Organizer
      画像の認識・理解シンポジウム2022
  • [Presentation] 編集距離に基づいた距離学習による情景画像文字認識結果の修正に関する検討2022

    • Author(s)
      梶原颯希, 宮崎智, 大町真一郎
    • Organizer
      画像の認識・理解シンポジウム2022
  • [Presentation] U-Netを用いた電子部品画像からの配線検出2022

    • Author(s)
      谷本衡哉, 宮崎智, 大町真一郎
    • Organizer
      画像の認識・理解シンポジウム2022
  • [Book] 機械学習の可能性2022

    • Author(s)
      計測自動制御学会、浮田 浩行、濱上 知樹、藤吉 弘亘、大町 真一郎、戸田 智基、岩崎 敦、小林 泰介、鈴木 亮太、木村 雄喜、橋本 大樹、玉垣 勇樹、水谷 麻紀子、永田 毅、木村 光成、李 晃伸、川嶋 宏彰
    • Total Pages
      240
    • Publisher
      コロナ社
    • ISBN
      978-4339033854

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi