Cross-modal Deep Learning of Sizzle Representation for Social Media Data

Research Project

Project/Area Number	23K11340
Research Category	Grant-in-Aid for Scientific Research (C)
Allocation Type	Multi-year Fund
Section	一般
Review Section	Basic Section 62020:Web informatics and service informatics-related
Research Institution	Hiroshima City University
Principal Investigator	田村慶一広島市立大学, 情報科学研究科, 教授 (80347616)
Project Period (FY)	2023-04-01 – 2027-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000) Fiscal Year 2026: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000) Fiscal Year 2025: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000) Fiscal Year 2024: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000) Fiscal Year 2023: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Keywords	シズル表現 / クロスモーダル深層学習 / ソーシャルメディアデータ
Outline of Research at the Start	人の飲食物に対する食欲や購買意欲を高める感覚をシズル感といい，シズル感を含む表現をシズル表現と呼ぶ．本研究ではソーシャルメディア上に投稿されるデータ（ソーシャルメディアデータ）を対象に，シズル表現を含むテキストデータと画像データに対するクロスモーダル深層学習の基盤技術の開発に取り組む．ソーシャルメディア上には一般の人が投稿した飲食物に対する感想や意見（テキストデータ）と写真（画像データ）が同時に投稿されており，テキストデータと画像データのモダリティ間における関係性を明らかにすることができれば，感性の集合知としてソーシャルメディアデータの利活用を加速することができる．
Outline of Annual Research Achievements	本研究はソーシャルメディア上に投稿されるデータ（ソーシャルメディアデータ）を対象としたシズル表現を含むテキストデータと画像データに対するクロスモーダル深層学習に関する基盤技術の確立を目的とする．具体的には，シズル表現を含むマルチモーダルデータを対象とした表現学習，ノイズを多く含むデータに頑強な学習モデル，また，表現学習で獲得したクロスモーダル特徴量空間を用いたモダリティ変換技術とスタイル変換技術の研究開発を行う．また，シズル表現のクロスモーダル深層学習の基盤技術を確立することで，言語と視覚が持つシズル表現の関係性も明らかにする． 2023年（令和5年）度は「サブテーマ（A）：シズル表現と対象物の自動抽出手法」，「サブテーマ（B）：シズル表現のクロスモーダル表現学習」の2つのサブテーマに取り組んだ．ブログ等に投稿される食レビューを対象として，シズルワードを基準としてソーシャルメディアデータからシズル表現を含むテキストデータ，その対象物と画像データを特定する抽出器を構築した．シズルワードを含むテキストデータと画像データの増強方法を工夫することで精度を向上させることができた．シズル表現を含むテキストデータ，その対象物と画像データを特定する抽出器については，ブログデータに含まれるシズル感を含むテキストデータと画像データの整合を行う問題を仮定してその整合方法について開発を行った．また，シズル表現を含むテキストデータと画像データを共通の特徴量空間へ写像する表現学習に関する研究開発に着手した．2023年（令和5年）度は主に，既存のモデルを対象としてノイズを多く含むデータに頑強な表現学習モデルの開発を行った．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 全研究期間中に研究目的を達成するために，「サブテーマ（A）：シズル表現と対象物の自動抽出手法」，「サブテーマ（B）：シズル表現のクロスモーダル表現学習」，「サブテーマ（C）：モダリティ変換とスタイル変換技術」，「サブテーマ（D）：複合的なシズル表現に関する知識」の体系化の4つのサブテーマに取り組むこととしている．2023年（令和5）度はサブテーマ（A）とサブテーマ（B）に取り組む予定としており，実際にこの２つのテーマについてその内容を着実に実施することができた．
Strategy for Future Research Activity	2024年（令和6年）度は，2023年（令和5）度の研究成果を踏まえて，サブテーマ（A）とサブテーマ（B）を完成させるとともに，「サブテーマ（C）：モダリティ変換とスタイル変換技術」について取り組む．「サブテーマ（A）：シズル表現と対象物の自動抽出手法について」はその精度について課題が残っているので，多様なデータセットを使って検証を行い，その精度向上を引き続き行っていく．「サブテーマ（B）：シズル表現のクロスモーダル表現学習」については2023年（令和5年）度に着手を行ったところであるが，シズル表現を含むテキストデータと画像データを共通の特徴量空間へ写像する表現学習に関する研究開発を行う．また，サブテーマ（A）と（B）の進捗に合わせて「サブテーマ（C）：モダリティ変換とスタイル変換技術」にも着手する．モダリティ変換では当初予定していたスタイル変換系深層学習モデルのみならずマルチモーダルLLMなど最新の深層学習モデルの応用も視野に入れながら研究を進めていく．開発を行った手法を実際に実装し，テスト・評価も行う予定である．研究をスムーズに実施するために研究協力者として学部生・大学院生2名にデータの加工やプログラム作成の補助を行ってもらう．

Report

(1 results)

2023 Research-status Report

Research Products
(7 results)

All 2024 2023

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (6 results)

[Journal Article] Modified MC-MHLF Model using Multi-Channel Input for Time Series Classification2023
- Author(s)
  Keiichi Tamura and Yoshiki Nakagawa
- Journal Title
  
  Proceedings of 2023 IEEE 13th International Workshop on Computational Intelligence and Applications (IWCIA)
  
  Pages: 71-78
- DOI
  10.1109/iwcia59471.2023.10335821
- Related Report
  2023 Research-status Report
- Peer Reviewed
[Presentation] 対照学習を導入したNoisy Studentに基づく画像分類2024
- Author(s)
  久留米慶士，田村慶一
- Organizer
  情報処理学会第86回全国大会
- Related Report
  2023 Research-status Report
[Presentation] 食レビュー記事におけるシズル感を含む画像とテキストのマッチング2024
- Author(s)
  亀谷優駿，田村慶一
- Organizer
  電子情報通信学会2024年総合大会ISS特別企画「ジュニア＆学生ポスターセッション」
- Related Report
  2023 Research-status Report
[Presentation] データフリーモデル蒸留に基づく分散型連合学習2023
- Author(s)
  阿比留　祥太，田村慶一
- Organizer
  2023 IEEE SMC Hiroshima Chapter若手研究会
- Related Report
  2023 Research-status Report
[Presentation] 時系列データ分類問題を対象とした公開データを用いたモデル蒸留2023
- Author(s)
  宮本　颯矢，玄行　朱里，田村慶一
- Organizer
  2023 IEEE SMC Hiroshima Chapter若手研究会
- Related Report
  2023 Research-status Report
[Presentation] 畳み込みニューラルネットワークを用いたシズルワードを含むツイートの分類2023
- Author(s)
  劉津来，田村慶一
- Organizer
  2023 IEEE SMC Hiroshima Chapter若手研究会
- Related Report
  2023 Research-status Report
[Presentation] 畳み込みニューラルネットワークを用いたシズルワードを含むツイート分類におけるデータ拡張2023
- Author(s)
  劉津来，田村慶一
- Organizer
  第25回 IEEE広島支部学生シンポジウム（HISS2023）
- Related Report
  2023 Research-status Report

Cross-modal Deep Learning of Sizzle Representation for Social Media Data

Principal Investigator

田村 慶一 広島市立大学, 情報科学研究科, 教授 (80347616)

¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)

Current Status of Research Progress

Reason

Report

Research Products

[Journal Article] Modified MC-MHLF Model using Multi-Channel Input for Time Series Classification2023

Author(s)

Journal Title

DOI

Related Report

[Presentation] 対照学習を導入したNoisy Studentに基づく画像分類2024

Author(s)

Organizer

Related Report

[Presentation] 食レビュー記事におけるシズル感を含む画像とテキストのマッチング2024

Author(s)

Organizer

Related Report

[Presentation] データフリーモデル蒸留に基づく分散型連合学習2023

Author(s)

Organizer

Related Report

[Presentation] 時系列データ分類問題を対象とした公開データを用いたモデル蒸留2023

Author(s)

Organizer

Related Report

[Presentation] 畳み込みニューラルネットワークを用いたシズルワードを含むツイートの分類2023

Author(s)

Organizer

Related Report

[Presentation] 畳み込みニューラルネットワークを用いたシズルワードを含むツイート分類におけるデータ拡張2023

Author(s)

Organizer

Related Report

田村慶一広島市立大学, 情報科学研究科, 教授 (80347616)