研究課題
本研究課題は,当初3年間の予定であったが,2017年度 1年間の延長をお認めいただいた.本年度は,それまでに研究を進めてきた,想起の強さ,語義・概念レベルの分散表現,画像から得られる知覚特徴量の利用をさらに推進した.また,これに加え,ソーシャルメディアにおけるタグ情報から得られる情報をもとにに意味表現を構成し,これを意味的類似度・関連度の予測に用いる手法についての研究を進めた.(国内招待論文 1件,国際会議論文 3件,国内発表 4件)ソーシャルタグからの単語の分散表現の構成: Flickr と呼ばれる大規模な画像ソーシャルメディアにおいて,画像コンテンツに対して付与されたタグ情報に注目し,これらのタグ間の共起行列を次元圧縮することにより,タグとして利用された単語から想起される意味を表す分散表現を構成した.標準的なベンチマークデータを用いた意味的類似度・関連度の評価タスクにおいて,テキストコーパスから構成した分散表現と同等の総合性能を示した.また,反義語の検出において,テキストコーパスから分布仮説に基づいて抽出した分散表現とは異なる,注目すべき特性を示すことが分かった.これは,投稿された画像から想起される意味をタグとして具現化された情報を集合的に用いることにより,意味情報を抽出できることを意味する.また,テキストコーパスから抽出した分散表現との相互補完により,さらに頑健な意味的類似性を捉えることができる可能性を示した.
すべて 2018 2017
すべて 雑誌論文 (1件) 学会発表 (7件) (うち国際学会 3件) 図書 (2件)
人工知能学会誌
巻: 32 ページ: 384--393