• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 実績報告書

言語情報がもつ視覚的性質の分析とそのマルチメディア統合処理への応用

研究課題

研究課題/領域番号 22H03612
配分区分補助金
研究機関名古屋大学

研究代表者

井手 一郎  名古屋大学, 情報学研究科, 教授 (10332157)

研究分担者 平山 高嗣  人間環境大学, 環境科学部, 教授 (10423021)
駒水 孝裕  名古屋大学, 数理・データ科学教育研究センター, 准教授 (30756367)
川西 康友  国立研究開発法人理化学研究所, 情報統合本部, チームリーダー (50755147)
道満 恵介  中京大学, 工学部, 准教授 (90645748)
研究期間 (年度) 2022-04-01 – 2026-03-31
キーワード言語情報 / 視覚情報 / マルチメディア / 統合処理 / 印象
研究実績の概要

本研究課題では,言語情報がもつ様々な視覚的性質として,事象に内在する静的印象と,事象の動きに関する動的印象に分けて分析し,与えられた言語情報がそれらをどの程度もっているか定量化する手法を提案する.さらに,それらの印象の程度に基づいて挙動が変化するマルチメディア統合処理による応用事例を提案する.具体的には,言語情報がもつ視覚的性質を明らかにするために,【課題1】 名詞に注目した,事象に内在する静的印象の定量化,【課題2】 動詞に注目した,事象の動きに関する動的印象の定量化,という2つの課題に取り組む.また,印象の程度に応じて挙動が変化するマルチメディア統合処理による応用事例において,提案する方法論の有効性を実証的に明らかにする.

令和5年度は,【課題1】について,令和4年度に引き続き,単語に対する静的印象の推定手法を実現する第一段階として,未知語の印象を反映した画像生成手法について検討した.また,【課題2】について,動的印象を推定するモデルを直接構築せずに,生成されるキャプションの動的印象をパラメトリックに制御した画像キャプショニング手法を開発した.
また,これらの研究を進める過程で,言語の発音が印象に与える影響について注目するようになり,複数の応用事例においてその効果を検証すべく初期検討を行った.
さらに,これらのキャプショニング技術の応用事例として,複数画像のキャプショニング手法について検討した.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

【課題1】【課題2】ともに概ね当初の計画通り進展しているが,研究を進める過程で,言語の発音が印象に与える影響について新たに注目するようになり,その効果を検証すべく初期検討を行っている.

今後の研究の推進方策

当初の計画にはなかった着目点として,言語の発音が印象に与える影響について新たに注目するようになったため,応用事例においてその効果を検証する.

  • 研究成果

    (12件)

すべて 2024 2023 その他

すべて 国際共同研究 (1件) 雑誌論文 (4件) (うち査読あり 4件、 オープンアクセス 4件) 学会発表 (7件) (うち国際学会 3件)

  • [国際共同研究] アムステルダム大学(オランダ)

    • 国名
      オランダ
    • 外国機関名
      アムステルダム大学
  • [雑誌論文] Image-collection summarization using scene-graph generation with external knowledge2024

    • 著者名/発表者名
      Itthisak Phueaksri, Marc A. Kastner, Yasutomo Kawanishi, Takahiro Komamizu, Ichiro Ide
    • 雑誌名

      IEEE Access

      巻: 12 ページ: 17499-17512

    • DOI

      10.1109/ACCESS.2024.3360113

    • 査読あり / オープンアクセス
  • [雑誌論文] Computational measurement of perceived pointiness from pronunciation2024

    • 著者名/発表者名
      Chihaya Matsuhira, Marc Aurel Kastner, Takahiro Komamizu, Ichiro Ide, Takatsugu Hirayama, Yasutomo Kawanishi, Keisuke Doman, Daisuke Deguchi
    • 雑誌名

      Multimedia Tools and Applications

      巻: 83 ページ: 26183-26210

    • DOI

      10.1007/s11042-023-15732-z

    • 査読あり / オープンアクセス
  • [雑誌論文] Interpolating the text-to-image correspondence based on phonetic and phonological similarities for nonword-to-image generation2024

    • 著者名/発表者名
      Chihaya Matsuhira, Marc Aurel Kastner, Takahiro Komamizu, Takatsugu Hirayama, Keisuke Doman, Yasutomo Kawanishi, Ichiro Ide
    • 雑誌名

      IEEE Access

      巻: 12 ページ: 41299-41316

    • DOI

      10.1109/ACCESS.2024.3378095

    • 査読あり / オープンアクセス
  • [雑誌論文] An approach to generate a caption for an image collection using scene graph generation2023

    • 著者名/発表者名
      Itthisak Phueaksri, Marc A. Kastner, Yasutomo Kawanishi, Takahiro Komamizu, Ichiro Ide
    • 雑誌名

      IEEE Access

      巻: 11 ページ: 128245-128260

    • DOI

      10.1109/ACCESS.2023.3332098

    • 査読あり / オープンアクセス
  • [学会発表] 歌詞の自動翻訳のための発音を考慮した訳語選択に関する研究2024

    • 著者名/発表者名
      池田昂太郎,松平茅隼,加藤大貴,平山高嗣,駒水孝裕,井手一郎
    • 学会等名
      電子情報通信学会メディアエクスペリエンス・バーチャル環境基礎研究会
  • [学会発表] Image impression estimation by clustering people with similar tastes2023

    • 著者名/発表者名
      Banri Kojima, Takahiro Komamizu, Yasutomo Kawanishi, Keisuke Doman, Ichiro Ide
    • 学会等名
      Proc. 18th Int. Conf. on Machine Vision Applications (MVA2023)
    • 国際学会
  • [学会発表] Toward scene graph summarization enhancing relation predictor with external knowledge2023

    • 著者名/発表者名
      Itthisak Phueaksri, Marc Aurel Kastner, Yasutomo Kawanishi, Takahiro Komamizu, Ichiro Ide
    • 学会等名
      画像の認識・理解シンポジウム(MIRU)2023
  • [学会発表] Leverage semantic alignment of object relations for image captioning2023

    • 著者名/発表者名
      Da Huo, Marc Aurel Kastner, Takatsugu Hirayama, Takahiro Komamizu, Ichiro Ide
    • 学会等名
      画像の認識・理解シンポジウム(MIRU)2023
  • [学会発表] 類音語の連想性を考慮した未知語の発音に対する画像生成2023

    • 著者名/発表者名
      松平茅隼,カストナーマークアウレル,駒水孝裕,平山高嗣,道満恵介,井手一郎
    • 学会等名
      画像の認識・理解シンポジウム(MIRU)2023
  • [学会発表] Nonword-to-image generation considering perceptual association of phonetically similar words2023

    • 著者名/発表者名
      Chihaya Matsuhira, Marc Aurel Kastner, Takahiro Komamizu, Takatsugu Hirayama, Keisuke Doman, Ichiro Ide
    • 学会等名
      1st Int. Workshop on Multimedia Content Generation and Practice (McGE'23) in conjunction with ACM MM2023
    • 国際学会
  • [学会発表] Discovering phonesthemic clusters in readings of Kanji characters toward exploring phonestheme in Japanese2023

    • 著者名/発表者名
      Akira Yoshida, Chihaya Matsuhira, Hirotaka Kato, Takatsugu Hirayama, Takahiro Komamizu, Ichiro Ide
    • 学会等名
      37th Pacific Asia Conf. on Language, Information and Computation (PACLIC 37)
    • 国際学会

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi