2023 Fiscal Year Annual Research Report
Acquisition, Retrieval and Synthesis of Information Semantics by Machine Learning
Project/Area Number |
22H03905
|
Allocation Type | Single-year Grants |
Research Institution | The University of Fukuchiyama |
Principal Investigator |
田中 克己 福知山公立大学, 情報学部, 教授 (00127375)
|
Co-Investigator(Kenkyū-buntansha) |
加藤 誠 筑波大学, 図書館情報メディア系, 准教授 (00646911)
莊司 慶行 静岡大学, 情報学部, 講師 (30783039)
山本 祐輔 名古屋市立大学, データサイエンス学部, 准教授 (50625431)
角谷 和俊 関西学院大学, 総合政策学部, 教授 (60314499)
山本 岳洋 兵庫県立大学, 情報科学研究科, 准教授 (70717636)
大島 裕明 兵庫県立大学, 情報科学研究科, 准教授 (90452317)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 機械学習 / 情報検索 / 地物 / 映像 / テキスト / 意味 / 自動生成 |
Outline of Annual Research Achievements |
本研究では、短文テキスト、地図、画像・映像からの「意味」の抽出と、抽出された「意味」と類似する意味をもつ情報の検索・生成を行う仕組みについて研究を行った。短文テキストとしては、俳句・短歌やキャッチコピー(惹句)を対象とし、地図情報としては地物の集合体である地形図・略地図などを対象とする。さらに、画像・映像としては、映画データを対象として意味抽出や意味類似情報の検索・生成を行う。「意味」の抽出には、機械学習分野でよく知られた知見(語の意味分散表現法やBERT機械学習)を利用しつつこれらを発展させる。本研究では、次の3テーマに分けて研究を実施した。 ①機械学習による短文テキストの意味類似検索と生成の研究:詩歌・俳句・短歌、惹句(キャッチコピー)などの短文テキ ストを対象として、機械学習による短文の意味の分散表現を求め、意味類似する情報の検索手法を開発した。 ②機械学習による地物(地図)の意味類似検索・生成の研究:地図における情報の基本単位が「地物」であることを意識して、「地物」の意味を求める手法を開発した。「地物」の意味はその地物の周辺の2次元領域にある地物群から求められると考え、従来のWord2Vecを2次元的に拡張したGeoObject2Vecという機械学習法を開発した。 ③機械学習による画像・映像の意味類似検索と生成の研究:映画映像を機械学習して映像に含まれる映画文法を求める研究を行なった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
①機械学習による短文テキストの意味類似検索と生成の研究:詩歌・俳句・短歌、惹句(キャッチコピー)などの短文テキ ストを対象として、機械学習による短文の意味の分散表現を求め、意味類似する情報の検索手法を開発した。惹句の分析にはBERT機械学習を用いたが、一方、俳句・短歌の分析にはWord2Vecを用いるとともに、俳句・短歌の「絵画性」を分析するプログラムも開発した。 ②機械学習による地物(地図)の意味類似検索・生成の研究:地図における情報の基本単位が「地物」であることを考慮して、「地物」の意味を求める機械学習法を新たに開発した。具体的には、「地物」の意味はその地物の周辺の2次元領域にある地物群から求められると考え、従来のWord2Vecを2次元的に拡張したGeoObject2Vecという機械学習法を開発した。日本全国の地物データをOSMから獲得し、GeoObject2Vecで学習することによって、地物の「意味」類似検索が可能となった。 ③機械学習による画像・映像の意味類似検索と生成の研究:映画映像を機械学習して映像に含まれる映画文法を求める研究を 行なった。実際の映画映像を対象として、機械学習によって、映画文法を求めるプログラムを開発し、実験を行うことができた。
|
Strategy for Future Research Activity |
これまでに得られた提案手法・成果の論文発表、および、改良を行っていく。 ①機械学習による短文テキストの意味類似検索と生成の研究:BERT機械学習による惹句の分析・生成、および、Word2Vecによる俳句・短歌の意味分析と絵画性分析 ②機械学習による地物(地図)の意味類似検索・生成の研究:従来のWord2Vecを2次元的に拡張したGeoObject2Vecという機械学習法、および、日本全国の地物データをOSMから獲得し、GeoObject2Vecで学習することによって、地物の「意味」類似検索が可能となったことを成果発表・改良していく。 ③機械学習による画像・映像の意味類似検索と生成の研究:映画映像を機械学習して映像に含まれる映画文法を求める研究を 行なった。実際の映画映像を対象として、機械学習によって、映画文法を求めるプログラムを開発し、実験を行うことができた。この成果を論文発表していく予定である。
|
Research Products
(18 results)
-
-
-
[Journal Article] Inference-based No-Learning Approach on Pre-trained BERT Model Retrieval2024
Author(s)
Huu-Long Pham, Ryota Mibayashi, Takehiro Yamamoto, Makoto P. Kato, Yusuke Yamamoto, Yoshiyuki Shoji, Hiroaki Ohshima
-
Journal Title
Proceedings of the IEEE 2024 International Conference on Big Data and Smart Computing (BigComp 2024), ISBN: 979-8-3503-7002-7, pp.234-241, February 18-21, 2024
Volume: 1
Pages: 234-241
DOI
Peer Reviewed
-
-
-
-
[Journal Article] Analyzing Web Search Queries of Before and After Purchase on e-Commerce Site2023
Author(s)
Yuka Kawada, Takehiro Yamamoto, Hiroaki Ohshima, Yuki Yanagida, Makoto P. Kato, Sumio Fujita
-
Journal Title
Proc. of the 25th International Conference on Asia-Pacific Digital Libraries (ICADL 2023), Taipei, Taiwan, Springer LNCS vol.14457, pp.181-187, December 4 - 7, 2023
Volume: 14457
Pages: 181-187
DOI
Peer Reviewed
-
-
-
-
-
-
-
-
-
-
-