• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

異種メディア融合に基づく対話型マルチメディア検索技術の構築

研究課題

研究課題/領域番号 22KJ0010
補助金の研究課題番号 21J20307 (2021-2022)
研究種目

特別研究員奨励費

配分区分基金 (2023)
補助金 (2021-2022)
応募区分国内
審査区分 小区分61010:知覚情報処理関連
研究機関北海道大学

研究代表者

柳 凜太郎  北海道大学, 情報科学院, 特別研究員(DC1)

研究期間 (年度) 2023-03-08 – 2024-03-31
研究課題ステータス 完了 (2023年度)
配分額 *注記
2,200千円 (直接経費: 2,200千円)
2023年度: 700千円 (直接経費: 700千円)
2022年度: 700千円 (直接経費: 700千円)
2021年度: 800千円 (直接経費: 800千円)
キーワード画像検索 / 映像検索 / 深層学習 / 再検索 / 質問応答
研究開始時の研究の概要

本研究では, ユーザとの質問応答を行うことで,検索順位を改善することが可能な技術の実現を目指す. 本研究では,まず,画像・映像認識手法を用いることで検索候補から情報を抽出する.続いて,抽出された情報およびクエリに関連した情報を含む検索候補の出現頻度から,検索候補の効率的な絞り込みに最適な情報を探索し,その情報からユーザに提示すべき質問文を質問文生成器に基づいて生成する.最後に,質問文に対するユーザの回答に関連する画像・映像が上位となるように検索順位を再決定する.以上のように構築された画像・映像再検索手法により,対話型のアプローチに基づく検索順位の改善が可能になることを明らかにする.

研究実績の概要

本年度には,技術の実用化を目的として,申請者が一年目,二年目で構築した画像・映像再検索技術の高度化およびエッジコンピューティングデバイス上での実現を目指した手法の効率化について検討を行った. 具体的には,画像とテキストの関係性を学習することが可能な深層学習モデルにおいて,画像とテキストの対応関係を一対一の関係性ではなく多対多の包括的な関係性で学習することが可能な枠組みについて検討することで,高精度化を実現した.また,深層学習モデルに入力する際の情報を工夫することで,深層学習モデルのサイズを大幅に縮小することに成功した.さらに,構築した検索・再検索手法を観光地推薦のタスクに応用し,デモンストレーションシステムを構築することで,エッジコンピューティングデバイス上で動作する画像・映像検索手法を実現した.
本年度には,深層学習モデルの構築に関してまとめることで,1つの国際会議(IEEE International Conference on Consumer Electronics-Taiwan)および2つの論文誌(IEEE Access, International Journal of Multimedia Information Retrieval)に採択されている.さらに,構築したシステムを国際会議にてデモンストレーション発表している(ACM International Conference on Multimedia).

報告書

(3件)
  • 2023 実績報告書
  • 2022 実績報告書
  • 2021 実績報告書
  • 研究成果

    (12件)

すべて 2024 2023 2022 2021

すべて 雑誌論文 (5件) (うち査読あり 5件、 オープンアクセス 4件) 学会発表 (7件) (うち国際学会 5件)

  • [雑誌論文] Parameter-efficient tuning of cross-modal retrieval for a specific database via trainable textual and visual prompts2024

    • 著者名/発表者名
      Zhang Huaying、Yanagi Rintaro、Togo Ren、Ogawa Takahiro、Haseyama Miki
    • 雑誌名

      International Journal of Multimedia Information Retrieval

      巻: 13 号: 1 ページ: 1-14

    • DOI

      10.1007/s13735-024-00322-y

    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [雑誌論文] Cross-Modal Image Retrieval Considering Semantic Relationships With Many-to-Many Correspondence Loss2023

    • 著者名/発表者名
      Zhang Huaying、Yanagi Rintaro、Togo Ren、Ogawa Takahiro、Haseyama Miki
    • 雑誌名

      IEEE Access

      巻: 11 ページ: 10675-10686

    • DOI

      10.1109/access.2023.3239858

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Recallable Question Answering-Based Re-Ranking Considering Semantic Region for Cross-Modal Retrieval2023

    • 著者名/発表者名
      Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    • 雑誌名

      IEEE Open Journal of Signal Processing

      巻: 4 ページ: 1-11

    • DOI

      10.1109/ojsp.2023.3238280

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Interactive Re-ranking via Object Entropy-Guided Question Answering for Cross-Modal Image Retrieval2022

    • 著者名/発表者名
      Yanagi Rintaro、Togo Ren、Ogawa Takahiro、Haseyama Miki
    • 雑誌名

      ACM Transactions on Multimedia Computing, Communications, and Applications

      巻: 18 号: 3 ページ: 1-17

    • DOI

      10.1145/3485042

    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Domain Adaptive Cross-Modal Image Retrieval via Modality and Domain Translations2021

    • 著者名/発表者名
      YANAGI Rintaro、TOGO Ren、OGAWA Takahiro、HASEYAMA Miki
    • 雑誌名

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      巻: E104.A 号: 6 ページ: 866-875

    • DOI

      10.1587/transfun.2020IMP0011

    • NAID

      130008046413

    • ISSN
      0916-8508, 1745-1337
    • 年月日
      2021-06-01
    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [学会発表] Parameter-efficient Tuning of a Pre-trained Model via Prompt Learning in Cross-modal Retrieval2023

    • 著者名/発表者名
      Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    • 学会等名
      IEEE International Conference on Consumer Electronics-Taiwan
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] Yuya Moroto, Rintaro Yanagi, Naoki Ogawa, Kyohei Kamikawa, Keigo Sakurai, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama2023

    • 著者名/発表者名
      Personalized Content Recommender System via Non-verbal Interaction Using Face Mesh and Facial Expression
    • 学会等名
      ACM International Conference on Multimedia
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] Cross-modal image retrieval considering semantic relationships with object information2022

    • 著者名/発表者名
      Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    • 学会等名
      IEEE Global Conference on Consumer Electronics
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] Database-adaptive transfer learning for question answering-based re-ranking in cross-modal retrieval2022

    • 著者名/発表者名
      Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    • 学会等名
      第25回 画像の認識・理解シンポジウム (MIRU 2022)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] ゴム材料開発のための generative adversarial network に基づく配合量および物性からの電子顕微鏡画像の生成に関する一検討2022

    • 著者名/発表者名
      柳 凜太郎, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀
    • 学会等名
      映像情報メディア学会技術報告
    • 関連する報告書
      2021 実績報告書
  • [学会発表] Database-adaptive re-ranking for enhancing cross-modal image retrieval2021

    • 著者名/発表者名
      Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    • 学会等名
      ACM International Conference on Multimedia
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] IR Questioner: QA-based interactive retrieval system2021

    • 著者名/発表者名
      Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    • 学会等名
      ACM International Conference on Multimedia Retrieval
    • 関連する報告書
      2021 実績報告書
    • 国際学会

URL: 

公開日: 2021-05-27   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi