Acquisition, Retrieval and Generation of Meaning Information by Machine Learning
Project/Area Number |
23K25159
|
Project/Area Number (Other) |
22H03905 (2022-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
Section | 一般 |
Review Section |
Basic Section 90020:Library and information science, humanistic and social informatics-related
|
Research Institution | Kwansei Gakuin University (2024) The University of Fukuchiyama (2022-2023) |
Principal Investigator |
田中 克己 関西学院大学, 特定プロジェクト研究センター, 客員研究員 (00127375)
|
Co-Investigator(Kenkyū-buntansha) |
加藤 誠 筑波大学, 図書館情報メディア系, 准教授 (00646911)
莊司 慶行 静岡大学, 情報学部, 講師 (30783039)
山本 祐輔 名古屋市立大学, データサイエンス学部, 准教授 (50625431)
角谷 和俊 関西学院大学, 総合政策学部, 教授 (60314499)
大島 裕明 兵庫県立大学, 情報科学研究科, 准教授 (90452317)
山本 岳洋 兵庫県立大学, 情報科学研究科, 准教授 (70717636)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥17,420,000 (Direct Cost: ¥13,400,000、Indirect Cost: ¥4,020,000)
Fiscal Year 2024: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
Fiscal Year 2023: ¥6,890,000 (Direct Cost: ¥5,300,000、Indirect Cost: ¥1,590,000)
Fiscal Year 2022: ¥8,320,000 (Direct Cost: ¥6,400,000、Indirect Cost: ¥1,920,000)
|
Keywords | 機械学習 / 情報検索 / 意味 / 自動生成 / 意味分析 / テキスト・画像処理 / 地理情報処理 / 短文の意味分析 / 地図の意味分析 / 画像・映像の意味分析 / 惹句 / 俳句 / 分散表現 / 映像文法 / テキストマイニング / 地図情報処理 |
Outline of Research at the Start |
本研究では、短文テキスト、地図、画像・映像からの「意味」の抽出と、抽出された「意味」と類似する意味をもつ情報の検索・生成を行う仕組みについて研究を行う。短文テキストとしては、俳句・短歌やキャッチコピー(惹句)を対象とし、地図情報としては地物の集合体である地形図・略地図などを対象とする。さらに、画像・映像としては、映画データを対象として意味抽出や意味類似情報の検索・生成を行う。「意味」の抽出には、機械学習分野でよく知られた知見(語の意味分散表現法やBERT機械学習)を利用しつつこれらを発展させる。
|
Outline of Annual Research Achievements |
本研究は,短文テキスト,地図,画像・映像からの「意味」の抽出と,抽出された「意味」と類似する意味をもつ情報の検索・生成を行う仕組みについて研究を行うものである.初年度の2022年度では,短文テキストとして俳句,短歌,惹句(キャッチコピー),地図データとしてOpenStreetMapデータや一般の地図・略地図データ,画像・映像データとして絵画画像および映画データを対象として,これらのデータを機械学習して,「意味」を獲得できるような機械学習法の開発に取り組んだ.さらに,獲得された情報の意味を用いて,意味類似する情報を検索したり新規生成できるような仕組みの開発に着手した. (1) 機械学習による短文テキストの意味類似検索と生成の研究を行った.俳句・短歌,キャッチコピー(惹句)といった短文テキストを対象として,機械学習にもとづく「文」の意味の計算法を開発した.この意味の計算法に基づき,類似の意味を有する文の検索が可能となった. (2) 機械学習による地物の意味類似検索と生成の研究を行った.地図における情報の基本単位は,建物,道路,河川,街区などの「地物」であり,地物の「意味」はその地物本体の性質とともに,その地物の周辺にある地物集合から規定されることに留意して,地物の意味の分散表現法を新たに開発した.さらに,地物の意味の分散表現を言語化する方式も新たに開発した. (3) 機械学習による画像・映像の意味類似検索と生成の研究を行った.敵対的生成ネットワーク(GAN)を用いて,制作時期の異なる絵画画像群を訓練データとして機械学習し,制作時期の異なる絵画画像を予測・自動生成できる機能を開発した.さらに,機械学習にもとづく映画の映像文法の自動獲得の研究を行い成果を得た.研究成果を国内学会にて発表した論文に対して学生プレゼンテーション賞などを受賞した.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
(1) 機械学習にもとづく「文」の意味の計算法を開発し評価実験を行った結果が予想以上に良好であった. (2) 機械学習による地物の意味の分散表現法を新たに開発できたこと,および,地物の意味の分散表現を言語化する方式も開発できた. (3) 機械学習にもとづく映画の映像文法の自動獲得の研究を行い初期的ではあるが良好な成果を得た.国内学会での発表論文に対し学生プレゼンテーション賞などを受賞した.
|
Strategy for Future Research Activity |
(1) 機械学習にもとづく「文」の意味の計算法を開発し評価実験を行った結果が予想以上に良好であった.今後は,機械学習すべきデータの収集方法,本格的なデータに基づく「文」の意味計算法の確立が重要と考えられる. (2) 初年度に開発した,機械学習による地物の意味の分散表現法,地物の意味の分散表現を言語化する方式の実装と評価を行うことが重要と考えられる. (3) 機械学習にもとづく画像・映像の意味の自動獲得の研究を行い初期的ではあるが良好な成果を得た.今後は,提案手法の改善と大規模データを用いた評価が重要と考えられる.
|
Report
(1 results)
Research Products
(13 results)