研究課題/領域番号 |
19H04172
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 大阪学院大学 (2020-2022) 神戸大学 (2019) |
研究代表者 |
上原 邦昭 大阪学院大学, 経営学部, 教授 (60160206)
|
研究分担者 |
白浜 公章 近畿大学, 情報学部, 准教授 (30467675)
松原 崇 大阪大学, 大学院基礎工学研究科, 准教授 (70756197)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | 深層学習 / マルチモーダルデータ / epistemic uncertainty / aleatoric uncertainty / マルチモーダル検索 |
研究成果の概要 |
本研究では,画像とテキストを意味的に対応づける埋め込みという技術に焦点を当て,人間や生物が持つ認知システムの特性に基づいて,複雑な意味を構成要素となる概念に分解したり,各概念の性質や概念間の関係性を分析するアプローチを探求した.具体的には,不確実性を考慮して意味空間に概念を埋め込むことで,情報の重要性を自動的に評価する手法と検索結果の信頼性を評価する手法を開発した.また,注意機構に基づくテキスト中の単語・句と画像中の領域を逐次的に対応づける手法を開発した.そして,大規模ベンチマークデータの使用や国際競争型ワークショップ(TRECVID)への参加を通して,開発手法の有効性を確認した.
|
自由記述の分野 |
人工知能、特に機械学習
|
研究成果の学術的意義や社会的意義 |
深層学習の発達や大規模データの整備によって,物体やシーンといった単純な意味に関する画像分類ならば性能は人間を上回っている.しかし,従来手法では,複数の概念間の関係性が重要である複合概念を分解したり,分解した個々の概念のマッチングが行えない.そこで,本研究では,埋め込みに基づく画像とテキストの相互検索を題材として,概念の重要度や信頼性を評価する手法や,下位の概念から上位の概念の意味を動的に導出し,画像とテキストに含まれる概念を逐次的に対応づける手法を開発した.これらの手法は,例えば動画とテキスト,音楽と感情など,様々なマルチモーダルデータの意味的なマッチングに汎用的に応用可能である.
|