• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Research-status Report

低演算量・低容量畳み込みスパース表現技術の構築

Research Project

Project/Area Number 18K11367
Research InstitutionHokkaido University

Principal Investigator

小川 貴弘  北海道大学, 情報科学研究科, 准教授 (20524028)

Co-Investigator(Kenkyū-buntansha) 長谷山 美紀  北海道大学, 情報科学研究科, 教授 (00218463)
Project Period (FY) 2018-04-01 – 2022-03-31
Keywordsスパース表現 / 低演算 / 低容量 / 畳み込み
Outline of Annual Research Achievements

本研究では、低演算量・低容量畳み込みスパース表現技術の構築を目指す。具体的に、表現係数をバイナリとすることで、「最近傍基底探索に基づくスパース近似」と「単純な加算のみの辞書学習」を可能とし、画質評価指標に一切依存しない低演算量の畳み込みスパース表現を実現するものである。平成30年度は、「バイナリスパース表現に関する基礎理論の実現」に関する研究開発を実施した。スパース表現の表現係数をバイナリ化することにより、表現係数の推定と辞書学習に関する演算量を削減した。具体的に、表現係数を0または1の値に制限することで、その推定問題を最小の近似誤差を与える基底の探索に置き換えた。これにより、近年活発に研究が行われている高速最近傍探索手法の導入が可能となり、表現係数の推定に関する演算量の削減が実現された。また、表現係数をバイナリ化することで、基底の更新を単純な加算処理に置き換え可能とし、辞書学習に関わる演算量を削減した。本年度では、最終的な目標として最新の高速辞書学習法を超える演算量の削減を目指しており、その実現が可能となった。
以上の研究の実現により、スパース表現における表現係数の推定および辞書学習の演算量が大きく、符号化や復元、超解像等のアプリケーションで必要となる演算コストが極めて高かった問題の解決が可能となった。また、基底を含む辞書を画像毎に求めて蓄積する必要があるため、符号化等のアプリケーションにおいて、その容量が大きな問題となっていた問題を解決可能となった。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

研究実績の概要の概要で述べた通り、平成30年度は、スパース表現の表現係数をバイナリ化することにより、表現係数の推定と辞書学習に関する演算量を削減可能とするバイナリスパース表現の実現を行っており、本年度に掲げた目標を達成している。具体的に、「表現係数の推定」と「辞書学習」をそれぞれ、「最近傍基底の探索」と「単純な加算による基底の更新」に置き換え、演算量を大きく削減することを可能とし、スパース表現の実応用が可能なレベルにまで達している。
以上に加えて、平成30年度は、令和2年度に実施予定の「自己組織化辞書学習の導入による低容量化の実現」に関する理論の一部を構築しており、当初の計画以上に研究が進捗している。

Strategy for Future Research Activity

今後は、以下のフェーズをそれぞれ実施する予定である。
【フェーズ2】畳み込みバイナリスパース表現の実現: 本フェーズでは、フェーズ1で実現されたバイナリスパース表現に関する理論に、畳み込みスパース表現手法を導入することで、表現能力の向上とさらなる演算量の削減を目指す。畳み込みスパース表現を用いることにより、対象画像をよりスパースな表現係数で高精度に近似可能となるため、バイナリスパース表現における最近傍基底の探索回数・辞書学習における加算回数の削減による低演算量化と近似性能の向上を同時に実現する。
【フェーズ3】自己組織化辞書学習の導入による低容量化の実現: 本フェーズでは、フェーズ2までに実現される畳み込みバイナリスパース表現に対し、自己組織化辞書学習を導入することで、画像と同時に辞書の再構成を可能とする。具体的に、反復縮小写像系の原理に基づいて、辞書に含まれる基底を画像から切り出される局所領域の縮小写像により導出することで、画像から基底を、基底から画像を反復して再構成可能とする。これにより、蓄積すべき情報はバイナリの表現係数のみとなることから、辞書のサイズに関わらず低容量化が可能になる。
【フェーズ4】ユーザの主観に合致した画質評価指標の導入による近似性能の向上: 本フェーズでは、以上のフェーズで実現される低演算量・低容量畳み込みスパース表現に対し、ユーザの主観評価に合致した画像の近似を可能とする。その結果、最新の深層学習等で求められる定式化できない指標であっても導入が可能となり、ユーザの主観に合致した画像の近似が期待できる。また、本フェーズでは以上で実現される技術を、符号化・復元・超解像等へ応用することで、ユーザの主観評価が高くなるような再構成画像の取得を可能にする。

Causes of Carryover

本研究では、バイナリスパース表現の実現において高速最近傍探索の導入による低演算化を実現することから、その最大性能を評価するためのワークステーションやグラフィックカードが必要であったが、次年度においてより性能の高いモデルの入手が可能であったことから、次年度使用とし、自主財源で既に保持している機器の利用を行った。また、成果発表に関わる費用についても自主財源で対応をしており、次年度の成果発表に関する目標を上方修正するため、これらに支出予定である。

  • Research Products

    (17 results)

All 2019 2018 Other

All Int'l Joint Research (1 results) Journal Article (4 results) (of which Peer Reviewed: 4 results) Presentation (10 results) (of which Int'l Joint Research: 4 results,  Invited: 1 results) Remarks (1 results) Patent(Industrial Property Rights) (1 results)

  • [Int'l Joint Research] 浙江大学(中国)

    • Country Name
      CHINA
    • Counterpart Institution
      浙江大学
  • [Journal Article] Multi-classifier Decision: Integration of Multiple Brain Activity-based Classifications2019

    • Author(s)
      Takahiro Ogawa, Kento Sugata, Ren Togo, Miki Haseyama
    • Journal Title

      ITE Transactions on Media Technology and Applications

      Volume: 7 Pages: 36-44

    • DOI

      10.3169/mta.7.36

    • Peer Reviewed
  • [Journal Article] Human-centered image classification via a neural network considering visual and biological features2019

    • Author(s)
      Kazaha Horii, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Journal Title

      Multimedia Tools and Applications

      Volume: 印刷中 Pages: 印刷中

    • DOI

      10.1007/s11042-019-7222-3

    • Peer Reviewed
  • [Journal Article] Estimating the Quality of Fractal Compressed Images Using Lacunarity2018

    • Author(s)
      Megumi Takezawa, Hirofumi Sanada, Takahiro Ogawa, Miki Haseyama
    • Journal Title

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      Volume: E101-A Pages: 900-903

    • DOI

      10.1587/transfun.E101.A.900

    • Peer Reviewed
  • [Journal Article] Binary Sparse Representation Based on Arbitrary Quality Metrics and Its Applications2018

    • Author(s)
      Takahiro Ogawa , Sho Takahashi, Naofumi Wada, Akira Tanaka , Miki Haseyama
    • Journal Title

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      Volume: E101-A Pages: 1776-1785

    • DOI

      10.1587/transfun.E101.A.1776

    • Peer Reviewed
  • [Presentation] Estimation of users' interest levels using tensor completion with SemiCCA2019

    • Author(s)
      Tetsuya Kushima, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    • Organizer
      2019 IEEE 1st Global Conference on Life Sciences and Technologies
    • Int'l Joint Research
  • [Presentation] OpenPoseに基づくユーザの動作を用いた映像の関心度推定に関する検討2019

    • Author(s)
      九島 哲哉,高橋 翔,小川 貴弘,長谷山 美紀
    • Organizer
      映像情報メディア学会技術報告
  • [Presentation] Missing Image Data Estimation via Iterative Convolutional Sparse Coding2018

    • Author(s)
      Masanao Matsumoto, Naoki Saito, Takahiro Ogawa, Miki Haseyama
    • Organizer
      2018 IEEE 7th Global Conference on Consumer Electronics
    • Int'l Joint Research
  • [Presentation] A Human-Centered Neural Network Model with Discriminative Locality Preserving Canonical Correlation Analysis for Image Classification2018

    • Author(s)
      Kazaha Horii, Keisuke Maeda, Takahiro Ogawa, Miki Haseyam
    • Organizer
      25th IEEE International Conference on Image Processing
    • Int'l Joint Research
  • [Presentation] Interest Level Estimation of Items via Matrix Completion Based on Adaptive User Matrix Construction2018

    • Author(s)
      Tetsuya Kushima, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE International Conference on Multimedia and Expo
    • Int'l Joint Research
  • [Presentation] 【依頼講演】低次元画像近似に基づいたインペインティングとその工学的応用2018

    • Author(s)
      小川 貴弘, 長谷山 美紀
    • Organizer
      電子情報通信学会技術研究報告
    • Invited
  • [Presentation] 反復型のMulti-channel Convolutional Sparse Codingを用いた欠損した画素値の推定に関する検討2018

    • Author(s)
      松本真直,斉藤直輝,小川貴弘,長谷山美紀
    • Organizer
      平成30年度 電気・情報関係学会北海道支部連合大会
  • [Presentation] テンソル補完に基づいたユーザの動作からの関心度推定に関する検討2018

    • Author(s)
      九島 哲哉,高橋 翔,小川 貴弘,長谷山 美紀
    • Organizer
      平成30年度 電気・情報関係学会北海道支部連合大会
  • [Presentation] Convolutional Sparse Codingを導入した深層学習に基づく変状分類手法の構築2018

    • Author(s)
      前田 圭介 高橋 翔 小川 貴弘 長谷山 美紀
    • Organizer
      第21回 画像の認識・理解シンポジウム (MIRU2018)
  • [Presentation] ユーザの動作を用いた行列補完に基づく関心度の推定に関する検討 -特徴選択の導入による高精度化2018

    • Author(s)
      九島 哲哉,高橋 翔,小川 貴弘,長谷山 美紀
    • Organizer
      第21回 画像の認識・理解シンポジウム (MIRU2018)
  • [Remarks] 北海道大学メディアダイナミクス研究室

    • URL

      https://www-lmd.ist.hokudai.ac.jp/member/takahiro-ogawa/

  • [Patent(Industrial Property Rights)] 画像検索装置、画像検索方法及び画像検索用プログラム2018

    • Inventor(s)
      長谷山美紀、小川貴弘
    • Industrial Property Rights Holder
      長谷山美紀、小川貴弘
    • Industrial Property Rights Type
      特許
    • Industrial Property Number
      特願2018-188661

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi