• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

異種メディア融合に基づく対話型マルチメディア検索技術の構築

Research Project

Project/Area Number 22KJ0010
Allocation TypeMulti-year Fund
Research InstitutionHokkaido University

Principal Investigator

柳 凜太郎  北海道大学, 情報科学院, 特別研究員(DC1)

Project Period (FY) 2023-03-08 – 2024-03-31
Keywords画像検索 / 映像検索 / 深層学習 / 再検索 / 質問応答
Outline of Annual Research Achievements

本年度には,技術の実用化を目的として,申請者が一年目,二年目で構築した画像・映像再検索技術の高度化およびエッジコンピューティングデバイス上での実現を目指した手法の効率化について検討を行った. 具体的には,画像とテキストの関係性を学習することが可能な深層学習モデルにおいて,画像とテキストの対応関係を一対一の関係性ではなく多対多の包括的な関係性で学習することが可能な枠組みについて検討することで,高精度化を実現した.また,深層学習モデルに入力する際の情報を工夫することで,深層学習モデルのサイズを大幅に縮小することに成功した.さらに,構築した検索・再検索手法を観光地推薦のタスクに応用し,デモンストレーションシステムを構築することで,エッジコンピューティングデバイス上で動作する画像・映像検索手法を実現した.
本年度には,深層学習モデルの構築に関してまとめることで,1つの国際会議(IEEE International Conference on Consumer Electronics-Taiwan)および2つの論文誌(IEEE Access, International Journal of Multimedia Information Retrieval)に採択されている.さらに,構築したシステムを国際会議にてデモンストレーション発表している(ACM International Conference on Multimedia).

  • Research Products

    (4 results)

All 2024 2023

All Journal Article (2 results) Presentation (2 results) (of which Int'l Joint Research: 2 results)

  • [Journal Article] Parameter-efficient tuning of cross-modal retrieval for a specific database via trainable textual and visual prompts2024

    • Author(s)
      Zhang Huaying、Yanagi Rintaro、Togo Ren、Ogawa Takahiro、Haseyama Miki
    • Journal Title

      International Journal of Multimedia Information Retrieval

      Volume: 13 Pages: 1-14

    • DOI

      10.1007/s13735-024-00322-y

  • [Journal Article] Cross-Modal Image Retrieval Considering Semantic Relationships With Many-to-Many Correspondence Loss2023

    • Author(s)
      Zhang Huaying、Yanagi Rintaro、Togo Ren、Ogawa Takahiro、Haseyama Miki
    • Journal Title

      IEEE Access

      Volume: 11 Pages: 10675~10686

    • DOI

      10.1109/ACCESS.2023.3239858

  • [Presentation] Parameter-efficient Tuning of a Pre-trained Model via Prompt Learning in Cross-modal Retrieval2023

    • Author(s)
      Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE International Conference on Consumer Electronics-Taiwan
    • Int'l Joint Research
  • [Presentation] Yuya Moroto, Rintaro Yanagi, Naoki Ogawa, Kyohei Kamikawa, Keigo Sakurai, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama2023

    • Author(s)
      Personalized Content Recommender System via Non-verbal Interaction Using Face Mesh and Facial Expression
    • Organizer
      ACM International Conference on Multimedia
    • Int'l Joint Research

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi