2023 Fiscal Year Annual Research Report

Acquisition, Retrieval and Synthesis of Information Semantics by Machine Learning

Research Project

Project/Area Number	22H03905
Allocation Type	Single-year Grants
Research Institution	The University of Fukuchiyama
Principal Investigator	田中克己福知山公立大学, 情報学部, 教授 (00127375)
Co-Investigator(Kenkyū-buntansha)	加藤誠筑波大学, 図書館情報メディア系, 准教授 (00646911) 莊司慶行静岡大学, 情報学部, 講師 (30783039) 山本祐輔名古屋市立大学, データサイエンス学部, 准教授 (50625431) 角谷和俊関西学院大学, 総合政策学部, 教授 (60314499) 山本岳洋兵庫県立大学, 情報科学研究科, 准教授 (70717636) 大島裕明兵庫県立大学, 情報科学研究科, 准教授 (90452317)
Project Period (FY)	2022-04-01 – 2025-03-31
Keywords	機械学習 / 情報検索 / 地物 / 映像 / テキスト / 意味 / 自動生成
Outline of Annual Research Achievements	本研究では、短文テキスト、地図、画像・映像からの「意味」の抽出と、抽出された「意味」と類似する意味をもつ情報の検索・生成を行う仕組みについて研究を行った。短文テキストとしては、俳句・短歌やキャッチコピー（惹句）を対象とし、地図情報としては地物の集合体である地形図・略地図などを対象とする。さらに、画像・映像としては、映画データを対象として意味抽出や意味類似情報の検索・生成を行う。「意味」の抽出には、機械学習分野でよく知られた知見（語の意味分散表現法やBERT機械学習）を利用しつつこれらを発展させる。本研究では、次の3テーマに分けて研究を実施した。 ①機械学習による短文テキストの意味類似検索と生成の研究：詩歌・俳句・短歌、惹句（キャッチコピー）などの短文テキストを対象として、機械学習による短文の意味の分散表現を求め、意味類似する情報の検索手法を開発した。 ②機械学習による地物（地図）の意味類似検索・生成の研究：地図における情報の基本単位が「地物」であることを意識して、「地物」の意味を求める手法を開発した。「地物」の意味はその地物の周辺の2次元領域にある地物群から求められると考え、従来のWord2Vecを2次元的に拡張したGeoObject2Vecという機械学習法を開発した。 ③機械学習による画像・映像の意味類似検索と生成の研究：映画映像を機械学習して映像に含まれる映画文法を求める研究を行なった。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason ①機械学習による短文テキストの意味類似検索と生成の研究：詩歌・俳句・短歌、惹句（キャッチコピー）などの短文テキストを対象として、機械学習による短文の意味の分散表現を求め、意味類似する情報の検索手法を開発した。惹句の分析にはBERT機械学習を用いたが、一方、俳句・短歌の分析にはWord2Vecを用いるとともに、俳句・短歌の「絵画性」を分析するプログラムも開発した。 ②機械学習による地物（地図）の意味類似検索・生成の研究：地図における情報の基本単位が「地物」であることを考慮して、「地物」の意味を求める機械学習法を新たに開発した。具体的には、「地物」の意味はその地物の周辺の2次元領域にある地物群から求められると考え、従来のWord2Vecを2次元的に拡張したGeoObject2Vecという機械学習法を開発した。日本全国の地物データをOSMから獲得し、GeoObject2Vecで学習することによって、地物の「意味」類似検索が可能となった。 ③機械学習による画像・映像の意味類似検索と生成の研究：映画映像を機械学習して映像に含まれる映画文法を求める研究を行なった。実際の映画映像を対象として、機械学習によって、映画文法を求めるプログラムを開発し、実験を行うことができた。
Strategy for Future Research Activity	これまでに得られた提案手法・成果の論文発表、および、改良を行っていく。 ①機械学習による短文テキストの意味類似検索と生成の研究：BERT機械学習による惹句の分析・生成、および、Word2Vecによる俳句・短歌の意味分析と絵画性分析 ②機械学習による地物（地図）の意味類似検索・生成の研究：従来のWord2Vecを2次元的に拡張したGeoObject2Vecという機械学習法、および、日本全国の地物データをOSMから獲得し、GeoObject2Vecで学習することによって、地物の「意味」類似検索が可能となったことを成果発表・改良していく。 ③機械学習による画像・映像の意味類似検索と生成の研究：映画映像を機械学習して映像に含まれる映画文法を求める研究を行なった。実際の映画映像を対象として、機械学習によって、映画文法を求めるプログラムを開発し、実験を行うことができた。この成果を論文発表していく予定である。

Research Products
(18 results)

All 2024 2023

All Journal Article (10 results) (of which Peer Reviewed: 10 results) Presentation (8 results)

[Journal Article] Generating Experiential Descriptions and Estimating Evidence Using Generative Language Model and User Products Reviews2024
- Author(s)
  Shen Chenfu, Yoshiyuki Shoji, Takehiro Yamamoto, Katsumi Tanaka, Martin J. Durst
- Journal Title
  
  Proc. of 2024 IEEE International Conference on Big Data and Smart Computing (BigComp), pp. 254-261, Bangkok, Thailand, Feb. 18-21 2024
  
  Volume: 1 Pages: 254-261
- DOI
  10.1109/BigComp60711.2024.00047
- Peer Reviewed
[Journal Article] BERT-Based Movie Keyword Search Leveraging User-Generated Movie Rankings and Reviews2024
- Author(s)
  Tensho Miyashita, Yoshiyuki Shoji, Sumio Fujita, Martin J. Durst
- Journal Title
  
  Proc. of 2024 IEEE International Conference on Big Data and Smart Computing (BigComp), pp. 246-256, Bangkok, Thailand, Feb. 18-21 2024
  
  Volume: 1 Pages: 246-256
- DOI
  10.1109/BigComp60711.2024.00046
- Peer Reviewed
[Journal Article] Inference-based No-Learning Approach on Pre-trained BERT Model Retrieval2024
- Author(s)
  Huu-Long Pham, Ryota Mibayashi, Takehiro Yamamoto, Makoto P. Kato, Yusuke Yamamoto, Yoshiyuki Shoji, Hiroaki Ohshima
- Journal Title
  
  Proceedings of the IEEE 2024 International Conference on Big Data and Smart Computing (BigComp 2024), ISBN: 979-8-3503-7002-7, pp.234-241, February 18-21, 2024
  
  Volume: 1 Pages: 234-241
- DOI
  10.1109/BigComp60711.2024.00044
- Peer Reviewed
[Journal Article] Theoretical Analysis on the Efficiency of Interleaved Comparisons2023
- Author(s)
  Kojiro Iizuka, Hajime Morita, Makoto P. Kato
- Journal Title
  
  Proc. of 45th European Conference on Information Retrieval, ECIR 2023, Dublin, Ireland, Springer LNCS vol.13980, April , 2023
  
  Volume: 13980 Pages: 459-473
- DOI
  10.48550/arXiv.2306.10023
- Peer Reviewed
[Journal Article] User Latent Interest Estimation in Real Space: A Comparative Analysis of Time-Series and Non-Time-Series Processing Algorithms2023
- Author(s)
  T. Omura, D. Li, P. Siriaraya, K. Tanaka, Y. Kawai and S. Nakajima
- Journal Title
  
  Proc. of 2023 IEEE International Conference on Big Data (BigData), Sorrento, Italy, 2023
  
  Volume: 1 Pages: 2131-2138
- DOI
  10.1109/BigData59044.2023.10386563
- Peer Reviewed
[Journal Article] Development of an Online Marathon System using Acoustic AR2023
- Author(s)
  Yuki Konishi, Panote Siriaraya, Da Li, Katsumi Tanaka, Yukiko Kawai, Shinsuke Nakajima
- Journal Title
  
  Proceedings of the 31st ACM International Conference on Multimedia, October 27, 2023
  
  Volume: 1 Pages: 9388-9389
- DOI
  10.1145/3581783.3612672
- Peer Reviewed
[Journal Article] Analyzing Web Search Queries of Before and After Purchase on e-Commerce Site2023
- Author(s)
  Yuka Kawada, Takehiro Yamamoto, Hiroaki Ohshima, Yuki Yanagida, Makoto P. Kato, Sumio Fujita
- Journal Title
  
  Proc. of the 25th International Conference on Asia-Pacific Digital Libraries (ICADL 2023), Taipei, Taiwan, Springer LNCS vol.14457, pp.181-187, December 4 - 7, 2023
  
  Volume: 14457 Pages: 181-187
- DOI
  10.1007/978-981-99-8085-7
- Peer Reviewed
[Journal Article] Generating Fine-Grained Aspect Names from Movie Review Sentences Using Generative Language Model2023
- Author(s)
  Tomohiro Ishii, Yoshiyuki Shoji, Takehiro Yamamoto, Hiroaki Ohshima, Sumio Fujita, Martin J. Durst
- Journal Title
  
  Proc. of iiWAS2023, Springer LNCS vol.14416, pp.217-232, December 4-6, 2023
  
  Volume: 14416 Pages: 217-232
- DOI
  10.1007/978-3-031-48316-5
- Peer Reviewed
[Journal Article] Digital Index Card Creation and Management for Memorizing What You See on the Web2023
- Author(s)
  Yuna Saka, Yoshiyuki Shoji, Hiroaki Ohshima, Kouzou Ohara
- Journal Title
  
  Proc. of iiWAS2023, Springer LNCS vol.14416, pp.541-546, December 4-6, 2023
  
  Volume: 14416 Pages: 541-546
- DOI
  10.1007/978-3-031-48316-5
- Peer Reviewed
[Journal Article] What Web Search Behaviors Lead to Online Purchase Satisfaction?2023
- Author(s)
  Yuki Yanagida, Makoto P. Kato, Yuka Kawada, Takehiro Yamamoto, Hiroaki Ohshima, Sumio Fujita
- Journal Title
  
  Proc. of the 15th ACM Web Science Conference 2023 (WebSci 2023), pp.324-334, April 30th-May 1st, 2023
  
  Volume: 1 Pages: 324-334
- DOI
  10.1145/3578503.3583615
- Peer Reviewed
[Presentation] 機械学習と地理情報検索に基づく地物の意味発見2024
- Author(s)
  羽田野唯人, 渡邊二葉, 田中克己
- Organizer
  一般社団法人日本データベース学会, 第16回データ工学と情報マネジメントに関するフォーラム論文集, T5-B-9-02
[Presentation] 俳句・短歌を対象とした短文の意味分析2024
- Author(s)
  杉田祥太郎, 田中克己
- Organizer
  一般社団法人日本データベース学会, 第16回データ工学と情報マネジメントに関するフォーラム論文集, T1-B-2-01
[Presentation] 地理オブジェクトに関する事前学習を利用した地域特性推定2024
- Author(s)
  福地湧, 牛尼剛聡, 田中克己, 角谷和俊
- Organizer
  一般社団法人日本データベース学会, 第16回データ工学と情報マネジメントに関するフォーラム論文集, T5-B-9-04
[Presentation] 大規模言語モデルによる商品レビュー文のキャッチコピーへの変換2024
- Author(s)
  沈辰夫, 莊司慶行, 山本岳洋, 大原剛三, 田中克己
- Organizer
  一般社団法人日本データベース学会, 第16回データ工学と情報マネジメントに関するフォーラム論文集, T1-B-6-03
[Presentation] 機械学習と地域度・多様性分析を用いたニュース記事の自動分類2024
- Author(s)
  藤崎日和, 田中克己
- Organizer
  一般社団法人日本データベース学会, 第16回データ工学と情報マネジメントに関するフォーラム論文集, T1-A-8-01
[Presentation] 対話型生成AIによる情報検索の品質分析2024
- Author(s)
  遠藤颯, 花谷優, 田中克己
- Organizer
  一般社団法人日本データベース学会, 第16回データ工学と情報マネジメントに関するフォーラム論文集, T1-B-9-02
[Presentation] 音響型ARオンラインマラソンシステムにおける空間認識率向上に向けた取り組み2024
- Author(s)
  小西侑樹, Siriaraya Panote, 栗達, 田中克己, 河合由起子, 中島伸介
- Organizer
  一般社団法人日本データベース学会, 第16回データ工学と情報マネジメントに関するフォーラム論文集, T5-A-9-05
[Presentation] 地域特性推定のための地物カテゴリを利用した自己教師あり学習2023
- Author(s)
  福地湧, 牛尼剛聡, 田中克己, 角谷和俊
- Organizer
  NII IDRユーザフォーラム2023, P10, 2023年12月11日（DBSJ特別賞受賞

2023 Fiscal Year Annual Research Report

Acquisition, Retrieval and Synthesis of Information Semantics by Machine Learning

Principal Investigator

田中 克己 福知山公立大学, 情報学部, 教授 (00127375)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Generating Experiential Descriptions and Estimating Evidence Using Generative Language Model and User Products Reviews2024

Author(s)

Journal Title

DOI

[Journal Article] BERT-Based Movie Keyword Search Leveraging User-Generated Movie Rankings and Reviews2024

Author(s)

Journal Title

DOI

[Journal Article] Inference-based No-Learning Approach on Pre-trained BERT Model Retrieval2024

Author(s)

Journal Title

DOI

[Journal Article] Theoretical Analysis on the Efficiency of Interleaved Comparisons2023

Author(s)

Journal Title

DOI

[Journal Article] User Latent Interest Estimation in Real Space: A Comparative Analysis of Time-Series and Non-Time-Series Processing Algorithms2023

Author(s)

Journal Title

DOI

[Journal Article] Development of an Online Marathon System using Acoustic AR2023

Author(s)

Journal Title

DOI

[Journal Article] Analyzing Web Search Queries of Before and After Purchase on e-Commerce Site2023

Author(s)

Journal Title

DOI

[Journal Article] Generating Fine-Grained Aspect Names from Movie Review Sentences Using Generative Language Model2023

Author(s)

Journal Title

DOI

[Journal Article] Digital Index Card Creation and Management for Memorizing What You See on the Web2023

Author(s)

Journal Title

DOI

[Journal Article] What Web Search Behaviors Lead to Online Purchase Satisfaction?2023

Author(s)

Journal Title

DOI

[Presentation] 機械学習と地理情報検索に基づく地物の意味発見2024

Author(s)

Organizer

[Presentation] 俳句・短歌を対象とした短文の意味分析2024

Author(s)

Organizer

[Presentation] 地理オブジェクトに関する事前学習を利用した地域特性推定2024

Author(s)

Organizer

[Presentation] 大規模言語モデルによる商品レビュー文のキャッチコピーへの変換2024

Author(s)

Organizer

[Presentation] 機械学習と地域度・多様性分析を用いたニュース記事の自動分類2024

Author(s)

Organizer

[Presentation] 対話型生成AIによる情報検索の品質分析2024

Author(s)

Organizer

[Presentation] 音響型ARオンラインマラソンシステムにおける空間認識率向上に向けた取り組み2024

Author(s)

Organizer

[Presentation] 地域特性推定のための地物カテゴリを利用した自己教師あり学習2023

Author(s)

Organizer

田中克己福知山公立大学, 情報学部, 教授 (00127375)