Project/Area Number |
23K25159
|
Project/Area Number (Other) |
22H03905 (2022-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
Section | 一般 |
Review Section |
Basic Section 90020:Library and information science, humanistic and social informatics-related
|
Research Institution | Kwansei Gakuin University (2024) The University of Fukuchiyama (2022-2023) |
Principal Investigator |
田中 克己 関西学院大学, 特定プロジェクト研究センター, 客員研究員 (00127375)
|
Co-Investigator(Kenkyū-buntansha) |
加藤 誠 筑波大学, 図書館情報メディア系, 准教授 (00646911)
莊司 慶行 静岡大学, 情報学部, 講師 (30783039)
山本 祐輔 名古屋市立大学, データサイエンス学部, 准教授 (50625431)
角谷 和俊 関西学院大学, 総合政策学部, 教授 (60314499)
大島 裕明 兵庫県立大学, 情報科学研究科, 准教授 (90452317)
山本 岳洋 兵庫県立大学, 情報科学研究科, 准教授 (70717636)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥17,420,000 (Direct Cost: ¥13,400,000、Indirect Cost: ¥4,020,000)
Fiscal Year 2024: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
Fiscal Year 2023: ¥6,890,000 (Direct Cost: ¥5,300,000、Indirect Cost: ¥1,590,000)
Fiscal Year 2022: ¥8,320,000 (Direct Cost: ¥6,400,000、Indirect Cost: ¥1,920,000)
|
Keywords | 機械学習 / 情報検索 / 意味 / 自動生成 / 地物 / 映像 / テキスト / 意味分析 / テキスト・画像処理 / 地理情報処理 / 短文の意味分析 / 地図の意味分析 / 画像・映像の意味分析 / 惹句 / 俳句 / 分散表現 / 映像文法 / テキストマイニング / 地図情報処理 |
Outline of Research at the Start |
本研究では、短文テキスト、地図、画像・映像からの「意味」の抽出と、抽出された「意味」と類似する意味をもつ情報の検索・生成を行う仕組みについて研究を行う。短文テキストとしては、俳句・短歌やキャッチコピー(惹句)を対象とし、地図情報としては地物の集合体である地形図・略地図などを対象とする。さらに、画像・映像としては、映画データを対象として意味抽出や意味類似情報の検索・生成を行う。「意味」の抽出には、機械学習分野でよく知られた知見(語の意味分散表現法やBERT機械学習)を利用しつつこれらを発展させる。
|
Outline of Annual Research Achievements |
本研究では、短文テキスト、地図、画像・映像からの「意味」の抽出と、抽出された「意味」と類似する意味をもつ情報の検索・生成を行う仕組みについて研究を行った。短文テキストとしては、俳句・短歌やキャッチコピー(惹句)を対象とし、地図情報としては地物の集合体である地形図・略地図などを対象とする。さらに、画像・映像としては、映画データを対象として意味抽出や意味類似情報の検索・生成を行う。「意味」の抽出には、機械学習分野でよく知られた知見(語の意味分散表現法やBERT機械学習)を利用しつつこれらを発展させる。本研究では、次の3テーマに分けて研究を実施した。 ①機械学習による短文テキストの意味類似検索と生成の研究:詩歌・俳句・短歌、惹句(キャッチコピー)などの短文テキ ストを対象として、機械学習による短文の意味の分散表現を求め、意味類似する情報の検索手法を開発した。 ②機械学習による地物(地図)の意味類似検索・生成の研究:地図における情報の基本単位が「地物」であることを意識して、「地物」の意味を求める手法を開発した。「地物」の意味はその地物の周辺の2次元領域にある地物群から求められると考え、従来のWord2Vecを2次元的に拡張したGeoObject2Vecという機械学習法を開発した。 ③機械学習による画像・映像の意味類似検索と生成の研究:映画映像を機械学習して映像に含まれる映画文法を求める研究を行なった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
①機械学習による短文テキストの意味類似検索と生成の研究:詩歌・俳句・短歌、惹句(キャッチコピー)などの短文テキ ストを対象として、機械学習による短文の意味の分散表現を求め、意味類似する情報の検索手法を開発した。惹句の分析にはBERT機械学習を用いたが、一方、俳句・短歌の分析にはWord2Vecを用いるとともに、俳句・短歌の「絵画性」を分析するプログラムも開発した。 ②機械学習による地物(地図)の意味類似検索・生成の研究:地図における情報の基本単位が「地物」であることを考慮して、「地物」の意味を求める機械学習法を新たに開発した。具体的には、「地物」の意味はその地物の周辺の2次元領域にある地物群から求められると考え、従来のWord2Vecを2次元的に拡張したGeoObject2Vecという機械学習法を開発した。日本全国の地物データをOSMから獲得し、GeoObject2Vecで学習することによって、地物の「意味」類似検索が可能となった。 ③機械学習による画像・映像の意味類似検索と生成の研究:映画映像を機械学習して映像に含まれる映画文法を求める研究を 行なった。実際の映画映像を対象として、機械学習によって、映画文法を求めるプログラムを開発し、実験を行うことができた。
|
Strategy for Future Research Activity |
これまでに得られた提案手法・成果の論文発表、および、改良を行っていく。 ①機械学習による短文テキストの意味類似検索と生成の研究:BERT機械学習による惹句の分析・生成、および、Word2Vecによる俳句・短歌の意味分析と絵画性分析 ②機械学習による地物(地図)の意味類似検索・生成の研究:従来のWord2Vecを2次元的に拡張したGeoObject2Vecという機械学習法、および、日本全国の地物データをOSMから獲得し、GeoObject2Vecで学習することによって、地物の「意味」類似検索が可能となったことを成果発表・改良していく。 ③機械学習による画像・映像の意味類似検索と生成の研究:映画映像を機械学習して映像に含まれる映画文法を求める研究を 行なった。実際の映画映像を対象として、機械学習によって、映画文法を求めるプログラムを開発し、実験を行うことができた。この成果を論文発表していく予定である。
|