異種メディア融合に基づく対話型マルチメディア検索技術の構築

研究課題

研究課題/領域番号	22KJ0010
補助金の研究課題番号	21J20307 (2021-2022)
研究種目	特別研究員奨励費
配分区分	基金 (2023) 補助金 (2021-2022)
応募区分	国内
審査区分	小区分61010:知覚情報処理関連
研究機関	北海道大学
研究代表者	柳凜太郎北海道大学, 情報科学院, 特別研究員(DC1)
研究期間 (年度)	2023-03-08 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	2,200千円 (直接経費: 2,200千円) 2023年度: 700千円 (直接経費: 700千円) 2022年度: 700千円 (直接経費: 700千円) 2021年度: 800千円 (直接経費: 800千円)
キーワード	画像検索 / 映像検索 / 深層学習 / 再検索 / 質問応答
研究開始時の研究の概要	本研究では, ユーザとの質問応答を行うことで,検索順位を改善することが可能な技術の実現を目指す. 本研究では,まず,画像・映像認識手法を用いることで検索候補から情報を抽出する.続いて,抽出された情報およびクエリに関連した情報を含む検索候補の出現頻度から,検索候補の効率的な絞り込みに最適な情報を探索し,その情報からユーザに提示すべき質問文を質問文生成器に基づいて生成する.最後に,質問文に対するユーザの回答に関連する画像・映像が上位となるように検索順位を再決定する.以上のように構築された画像・映像再検索手法により,対話型のアプローチに基づく検索順位の改善が可能になることを明らかにする.
研究実績の概要	本年度には，技術の実用化を目的として,申請者が一年目,二年目で構築した画像・映像再検索技術の高度化およびエッジコンピューティングデバイス上での実現を目指した手法の効率化について検討を行った.　具体的には，画像とテキストの関係性を学習することが可能な深層学習モデルにおいて，画像とテキストの対応関係を一対一の関係性ではなく多対多の包括的な関係性で学習することが可能な枠組みについて検討することで，高精度化を実現した．また，深層学習モデルに入力する際の情報を工夫することで，深層学習モデルのサイズを大幅に縮小することに成功した．さらに，構築した検索・再検索手法を観光地推薦のタスクに応用し，デモンストレーションシステムを構築することで，エッジコンピューティングデバイス上で動作する画像・映像検索手法を実現した．本年度には，深層学習モデルの構築に関してまとめることで，1つの国際会議(IEEE International Conference on Consumer Electronics-Taiwan)および2つの論文誌(IEEE Access, International Journal of Multimedia Information Retrieval)に採択されている．さらに，構築したシステムを国際会議にてデモンストレーション発表している(ACM International Conference on Multimedia)．

報告書

(3件)

研究成果
(12件)

すべて 2024 2023 2022 2021

すべて雑誌論文 (5件) (うち査読あり 5件、オープンアクセス 4件) 学会発表 (7件) (うち国際学会 5件)

[雑誌論文] Parameter-efficient tuning of cross-modal retrieval for a specific database via trainable textual and visual prompts2024
- 著者名/発表者名
  Zhang Huaying、Yanagi Rintaro、Togo Ren、Ogawa Takahiro、Haseyama Miki
- 雑誌名
  
  International Journal of Multimedia Information Retrieval
  
  巻: 13 号: 1 ページ: 1-14
- DOI
  10.1007/s13735-024-00322-y
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Cross-Modal Image Retrieval Considering Semantic Relationships With Many-to-Many Correspondence Loss2023
- 著者名/発表者名
  Zhang Huaying、Yanagi Rintaro、Togo Ren、Ogawa Takahiro、Haseyama Miki
- 雑誌名
  
  IEEE Access
  
  巻: 11 ページ: 10675-10686
- DOI
  10.1109/access.2023.3239858
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Recallable Question Answering-Based Re-Ranking Considering Semantic Region for Cross-Modal Retrieval2023
- 著者名/発表者名
  Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
- 雑誌名
  
  IEEE Open Journal of Signal Processing
  
  巻: 4 ページ: 1-11
- DOI
  10.1109/ojsp.2023.3238280
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Interactive Re-ranking via Object Entropy-Guided Question Answering for Cross-Modal Image Retrieval2022
- 著者名/発表者名
  Yanagi Rintaro、Togo Ren、Ogawa Takahiro、Haseyama Miki
- 雑誌名
  
  ACM Transactions on Multimedia Computing, Communications, and Applications
  
  巻: 18 号: 3 ページ: 1-17
- DOI
  10.1145/3485042
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Domain Adaptive Cross-Modal Image Retrieval via Modality and Domain Translations2021
- 著者名/発表者名
  YANAGI Rintaro、TOGO Ren、OGAWA Takahiro、HASEYAMA Miki
- 雑誌名
  
  IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences
  
  巻: E104.A 号: 6 ページ: 866-875
- DOI
  10.1587/transfun.2020IMP0011
- NAID
  130008046413
- ISSN
  0916-8508, 1745-1337
- 年月日
  2021-06-01
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[学会発表] Parameter-efficient Tuning of a Pre-trained Model via Prompt Learning in Cross-modal Retrieval2023
- 著者名/発表者名
  Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
- 学会等名
  IEEE International Conference on Consumer Electronics-Taiwan
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Yuya Moroto, Rintaro Yanagi, Naoki Ogawa, Kyohei Kamikawa, Keigo Sakurai, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama2023
- 著者名/発表者名
  Personalized Content Recommender System via Non-verbal Interaction Using Face Mesh and Facial Expression
- 学会等名
  ACM International Conference on Multimedia
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Cross-modal image retrieval considering semantic relationships with object information2022
- 著者名/発表者名
  Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
- 学会等名
  IEEE Global Conference on Consumer Electronics
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Database-adaptive transfer learning for question answering-based re-ranking in cross-modal retrieval2022
- 著者名/発表者名
  Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
- 学会等名
  第25回画像の認識・理解シンポジウム (MIRU 2022)
- 関連する報告書
  2022 実績報告書
[学会発表] ゴム材料開発のための generative adversarial network に基づく配合量および物性からの電子顕微鏡画像の生成に関する一検討2022
- 著者名/発表者名
  柳凜太郎, 藤後廉, 前田圭介, 小川貴弘, 長谷山美紀
- 学会等名
  映像情報メディア学会技術報告
- 関連する報告書
  2021 実績報告書
[学会発表] Database-adaptive re-ranking for enhancing cross-modal image retrieval2021
- 著者名/発表者名
  Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
- 学会等名
  ACM International Conference on Multimedia
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] IR Questioner: QA-based interactive retrieval system2021
- 著者名/発表者名
  Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
- 学会等名
  ACM International Conference on Multimedia Retrieval
- 関連する報告書
  2021 実績報告書
- 国際学会

異種メディア融合に基づく対話型マルチメディア検索技術の構築

研究代表者

柳 凜太郎 北海道大学, 情報科学院, 特別研究員(DC1)

2,200千円 (直接経費: 2,200千円)

報告書

研究成果

[雑誌論文] Parameter-efficient tuning of cross-modal retrieval for a specific database via trainable textual and visual prompts2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Cross-Modal Image Retrieval Considering Semantic Relationships With Many-to-Many Correspondence Loss2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Recallable Question Answering-Based Re-Ranking Considering Semantic Region for Cross-Modal Retrieval2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Interactive Re-ranking via Object Entropy-Guided Question Answering for Cross-Modal Image Retrieval2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Domain Adaptive Cross-Modal Image Retrieval via Modality and Domain Translations2021

著者名/発表者名

雑誌名

DOI

NAID

ISSN

年月日

関連する報告書

[学会発表] Parameter-efficient Tuning of a Pre-trained Model via Prompt Learning in Cross-modal Retrieval2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Yuya Moroto, Rintaro Yanagi, Naoki Ogawa, Kyohei Kamikawa, Keigo Sakurai, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Cross-modal image retrieval considering semantic relationships with object information2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Database-adaptive transfer learning for question answering-based re-ranking in cross-modal retrieval2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] ゴム材料開発のための generative adversarial network に基づく配合量および物性からの電子顕微鏡画像の生成に関する一検討2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Database-adaptive re-ranking for enhancing cross-modal image retrieval2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] IR Questioner: QA-based interactive retrieval system2021

著者名/発表者名

学会等名

関連する報告書

柳凜太郎北海道大学, 情報科学院, 特別研究員(DC1)