言語情報がもつ視覚的性質の分析とそのマルチメディア統合処理への応用

研究課題

研究課題/領域番号	23K24868
補助金の研究課題番号	22H03612 (2022-2023)
研究種目	基盤研究(B)
配分区分	基金 (2024) 補助金 (2022-2023)
応募区分	一般
審査区分	小区分61010:知覚情報処理関連
研究機関	名古屋大学
研究代表者	井手一郎名古屋大学, 情報学研究科, 教授 (10332157)
研究分担者	平山高嗣人間環境大学, 環境科学部, 教授 (10423021) 駒水孝裕名古屋大学, 数理・データ科学教育研究センター, 准教授 (30756367) 川西康友国立研究開発法人理化学研究所, 情報統合本部, チームリーダー (50755147) 道満恵介中京大学, 工学部, 准教授 (90645748) KASTNER MarcAurel 広島市立大学, 情報科学研究科, 助教 (30966700)
研究期間 (年度)	2022-04-01 – 2026-03-31
研究課題ステータス	交付 (2024年度)
配分額 *注記	17,290千円 (直接経費: 13,300千円、間接経費: 3,990千円) 2025年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円) 2024年度: 3,900千円 (直接経費: 3,000千円、間接経費: 900千円) 2023年度: 4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円) 2022年度: 4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
キーワード	言語情報 / 視覚情報 / マルチメディア / 統合処理 / 印象
研究開始時の研究の概要	いわゆる「セマンティックギャップ」を越えて言語情報と視覚情報を関連付けるための方法論を提案する．従来，視覚情報から言語情報を表現する特徴を抽出する方法論，いわば「視覚情報がもつ言語的性質」の解明について取り組まれてきたのと逆に，「言語情報がもつ視覚的性質」の解明に取り組む．これは従来，高コストの主観評価実験によって定量化されてきたが，画像生成技術を用いたデータ駆動型手法で，これを低コストで定量化する．また，印象の程度に応じて挙動が変化する応用事例を通じて，視覚情報の言語的性質及び言語情報の視覚的性質の両者に基づいてセマンティックギャップを縮小したうえで，マルチメディア統合処理の効果を実証する．
研究実績の概要	本研究課題では，言語情報がもつ様々な視覚的性質として，事象に内在する静的印象と，事象の動きに関する動的印象に分けて分析し，与えられた言語情報がそれらをどの程度もっているか定量化する手法を提案する．さらに，それらの印象の程度に基づいて挙動が変化するマルチメディア統合処理による応用事例を提案する．具体的には，言語情報がもつ視覚的性質を明らかにするために，【課題1】名詞に注目した，事象に内在する静的印象の定量化，【課題2】動詞に注目した，事象の動きに関する動的印象の定量化，という2つの課題に取り組む．また，印象の程度に応じて挙動が変化するマルチメディア統合処理による応用事例において，提案する方法論の有効性を実証的に明らかにする．令和5年度は，【課題1】について，令和4年度に引き続き，単語に対する静的印象の推定手法を実現する第一段階として，未知語の印象を反映した画像生成手法について検討した．また，【課題2】について，動的印象を推定するモデルを直接構築せずに，生成されるキャプションの動的印象をパラメトリックに制御した画像キャプショニング手法を開発した．また，これらの研究を進める過程で，言語の発音が印象に与える影響について注目するようになり，複数の応用事例においてその効果を検証すべく初期検討を行った．さらに，これらのキャプショニング技術の応用事例として，複数画像のキャプショニング手法について検討した．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由【課題1】【課題2】ともに概ね当初の計画通り進展しているが，研究を進める過程で，言語の発音が印象に与える影響について新たに注目するようになり，その効果を検証すべく初期検討を行っている．
今後の研究の推進方策	当初の計画にはなかった着目点として，言語の発音が印象に与える影響について新たに注目するようになったため，応用事例においてその効果を検証する．

報告書

(2件)

2023 実績報告書
2022 実績報告書

研究成果
(25件)

すべて 2024 2023 2022 その他

すべて国際共同研究 (2件) 雑誌論文 (5件) (うち国際共著 2件、査読あり 5件、オープンアクセス 4件) 学会発表 (18件) (うち国際学会 8件、招待講演 3件)

[国際共同研究] アムステルダム大学(オランダ)
- 関連する報告書
  2023 実績報告書
[国際共同研究] North Carolina State University(米国)
- 関連する報告書
  2022 実績報告書
[雑誌論文] Image-Collection Summarization Using Scene-Graph Generation With External Knowledge2024
- 著者名/発表者名
  Phueaksri Itthisak、Kastner Marc A.、Kawanishi Yasutomo、Komamizu Takahiro、Ide Ichiro
- 雑誌名
  
  IEEE Access
  
  巻: 12 ページ: 17499-17512
- DOI
  10.1109/access.2024.3360113
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Computational measurement of perceived pointiness from pronunciation2024
- 著者名/発表者名
  Chihaya Matsuhira, Marc Aurel Kastner, Takahiro Komamizu, Ichiro Ide, Takatsugu Hirayama, Yasutomo Kawanishi, Keisuke Doman, Daisuke Deguchi
- 雑誌名
  
  Multimedia Tools and Applications
  
  巻: 83 号: 9 ページ: 26183-26210
- DOI
  10.1007/s11042-023-15732-z
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Interpolating the text-to-image correspondence based on phonetic and phonological similarities for nonword-to-image generation2024
- 著者名/発表者名
  Chihaya Matsuhira, Marc Aurel Kastner, Takahiro Komamizu, Takatsugu Hirayama, Keisuke Doman, Yasutomo Kawanishi, Ichiro Ide
- 雑誌名
  
  IEEE Access
  
  巻: 12 ページ: 41299-41316
- DOI
  10.1109/access.2024.3378095
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] An Approach to Generate a Caption for an Image Collection Using Scene Graph Generation2023
- 著者名/発表者名
  Phueaksri Itthisak、Kastner Marc A.、Kawanishi Yasutomo、Komamizu Takahiro、Ide Ichiro
- 雑誌名
  
  IEEE Access
  
  巻: 11 ページ: 128245-128260
- DOI
  10.1109/access.2023.3332098
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Towards Captioning an Image Collection from a Combined Scene Graph Representation Approach2023
- 著者名/発表者名
  Phueaksri Itthisak、Kastner Marc A.、Kawanishi Yasutomo、Komamizu Takahiro、Ide Ichiro
- 雑誌名
  
  Lecture Notes in Computer Science book series
  
  巻: 13833 ページ: 178-190
- DOI
  10.1007/978-3-031-27077-2_14
- ISBN
  9783031270765, 9783031270772
- 関連する報告書
  2022 実績報告書
- 査読あり
[学会発表] 歌詞の自動翻訳のための発音を考慮した訳語選択に関する研究2024
- 著者名/発表者名
  池田昂太郎，松平茅隼，加藤大貴，平山高嗣，駒水孝裕，井手一郎
- 学会等名
  電子情報通信学会メディアエクスペリエンス・バーチャル環境基礎研究会
- 関連する報告書
  2023 実績報告書
[学会発表] Image impression estimation by clustering people with similar tastes2023
- 著者名/発表者名
  Banri Kojima, Takahiro Komamizu, Yasutomo Kawanishi, Keisuke Doman, Ichiro Ide
- 学会等名
  Proc. 18th Int. Conf. on Machine Vision Applications (MVA2023)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Toward scene graph summarization enhancing relation predictor with external knowledge2023
- 著者名/発表者名
  Itthisak Phueaksri, Marc Aurel Kastner, Yasutomo Kawanishi, Takahiro Komamizu, Ichiro Ide
- 学会等名
  画像の認識・理解シンポジウム（MIRU）2023
- 関連する報告書
  2023 実績報告書
[学会発表] Leverage semantic alignment of object relations for image captioning2023
- 著者名/発表者名
  Da Huo, Marc Aurel Kastner, Takatsugu Hirayama, Takahiro Komamizu, Ichiro Ide
- 学会等名
  画像の認識・理解シンポジウム（MIRU）2023
- 関連する報告書
  2023 実績報告書
[学会発表] 類音語の連想性を考慮した未知語の発音に対する画像生成2023
- 著者名/発表者名
  松平茅隼，カストナーマークアウレル，駒水孝裕，平山高嗣，道満恵介，井手一郎
- 学会等名
  画像の認識・理解シンポジウム（MIRU）2023
- 関連する報告書
  2023 実績報告書
[学会発表] Nonword-to-image generation considering perceptual association of phonetically similar words2023
- 著者名/発表者名
  Chihaya Matsuhira, Marc Aurel Kastner, Takahiro Komamizu, Takatsugu Hirayama, Keisuke Doman, Ichiro Ide
- 学会等名
  1st Int. Workshop on Multimedia Content Generation and Practice (McGE'23) in conjunction with ACM MM2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Discovering phonesthemic clusters in readings of Kanji characters toward exploring phonestheme in Japanese2023
- 著者名/発表者名
  Akira Yoshida, Chihaya Matsuhira, Hirotaka Kato, Takatsugu Hirayama, Takahiro Komamizu, Ichiro Ide
- 学会等名
  37th Pacific Asia Conf. on Language, Information and Computation (PACLIC 37)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Towards captioning an image collection from a combined scene graph representation approach2023
- 著者名/発表者名
  Itthisak Phueaksri, Marc Aurel Kastner, Yasutomo Kawanishi, Takahiro Komamizu, Ichiro Ide
- 学会等名
  29th Int Conf on Multimedia Modeling (MMM2023)
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] 発話の交換を考慮した対話システムにおけるユーザ感情推定手法の検討2023
- 著者名/発表者名
  宮川由衣，加藤大貴，松平茅隼，平山高嗣，駒水孝裕，井手一郎
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] 漢字の音読みにおける象徴素のデータ駆動的探索の試み2023
- 著者名/発表者名
  吉田　晶，松平茅隼，加藤大貴，平山高嗣，駒水孝裕，井手一郎
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] Evoked emotion distribution learning through analysis of temporal user comments in social media videos2023
- 著者名/発表者名
  Yiming Wang, Marc A. Kastner, Da Huo, Takahiro Komamizu, Takatsugu Hirayama, Ichiro Ide
- 学会等名
  電子情報通信学会メディアエクスペリエンス・バーチャル環境基礎研究会
- 関連する報告書
  2022 実績報告書
[学会発表] Tailoring applications to users through multi-modal understanding2022
- 著者名/発表者名
  Ichiro Ide
- 学会等名
  1st Int. Workshop on Multimodal Understanding for the Web and Social Media (MUWS2022) in conjunction with ACM TheWebConf2022
- 関連する報告書
  2022 実績報告書
- 国際学会 / 招待講演
[学会発表] Challenges on bridging the gap between Vision and Language (V&L) information2022
- 著者名/発表者名
  Ichiro Ide
- 学会等名
  28th Int. Conf. on MultiMedia Modeling (MMM2022)
- 関連する報告書
  2022 実績報告書
- 国際学会 / 招待講演
[学会発表] Towards captioning an image collection using scene graph2022
- 著者名/発表者名
  Itthisak Phueaksri, Marc Aurel Kastner, Yasutomo Kawanishi, Takahiro Komamizu, Ichiro Ide
- 学会等名
  第25回画像の認識・理解シンポジウム（MIRU2022）
- 関連する報告書
  2022 実績報告書
[学会発表] 画像生成を介した語感から受ける印象の可視化の検討2022
- 著者名/発表者名
  松平茅隼，カストナーマークアウレル，駒水孝裕，平山高嗣，道満恵介，川西康友，井手一郎
- 学会等名
  第25回画像の認識・理解シンポジウム（MIRU2022）
- 関連する報告書
  2022 実績報告書
[学会発表] On estimating evoked emotions of social media videos through user comments analysis2022
- 著者名/発表者名
  Yiming Wang, Marc Aurel Kastner, Takahiro Komamizu, Yasutomo Kawanishi, Takatsugu Hirayama, Ichiro Ide
- 学会等名
  第25回画像の認識・理解シンポジウム（MIRU2022）
- 関連する報告書
  2022 実績報告書
[学会発表] Action semantic alignment for image captioning2022
- 著者名/発表者名
  Da Huo, Marc A. Kastner, Takahiro Komamizu, Ichiro Ide
- 学会等名
  5th IEEE Int. Conf. on Multimedia Information Processing and Retrieval (MIPR2022)
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Intuitive gait modeling using mimetic-words for gait description and generation2022
- 著者名/発表者名
  Hirotaka Kato, Takatsugu Hirayama, Keisuke Doman, Ichiro Ide, Yasutomo Kawanishi, Takahiro Komamizu, Daisuke Deguchi, Hiroshi Murase
- 学会等名
  5th IEEE Int. Conf. on Multimedia Information Processing and Retrieval (MIPR2022)
- 関連する報告書
  2022 実績報告書
- 国際学会 / 招待講演

言語情報がもつ視覚的性質の分析とそのマルチメディア統合処理への応用

研究代表者

井手 一郎 名古屋大学, 情報学研究科, 教授 (10332157)

17,290千円 (直接経費: 13,300千円、間接経費: 3,990千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[国際共同研究] アムステルダム大学(オランダ)

関連する報告書

[国際共同研究] North Carolina State University(米国)

関連する報告書

[雑誌論文] Image-Collection Summarization Using Scene-Graph Generation With External Knowledge2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Computational measurement of perceived pointiness from pronunciation2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Interpolating the text-to-image correspondence based on phonetic and phonological similarities for nonword-to-image generation2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] An Approach to Generate a Caption for an Image Collection Using Scene Graph Generation2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Towards Captioning an Image Collection from a Combined Scene Graph Representation Approach2023

著者名/発表者名

雑誌名

DOI

ISBN

関連する報告書

[学会発表] 歌詞の自動翻訳のための発音を考慮した訳語選択に関する研究2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Image impression estimation by clustering people with similar tastes2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Toward scene graph summarization enhancing relation predictor with external knowledge2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Leverage semantic alignment of object relations for image captioning2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 類音語の連想性を考慮した未知語の発音に対する画像生成2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Nonword-to-image generation considering perceptual association of phonetically similar words2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Discovering phonesthemic clusters in readings of Kanji characters toward exploring phonestheme in Japanese2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Towards captioning an image collection from a combined scene graph representation approach2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 発話の交換を考慮した対話システムにおけるユーザ感情推定手法の検討2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 漢字の音読みにおける象徴素のデータ駆動的探索の試み2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Evoked emotion distribution learning through analysis of temporal user comments in social media videos2023

著者名/発表者名

井手一郎名古屋大学, 情報学研究科, 教授 (10332157)