研究課題
基盤研究(C)
何ができていれば言葉の「意味」が分かっていると言えるか。実世界のネコを指差して「これが猫だ」と指摘できればよいという指示的意味論の考え方がある。画像とテキストを対応させる画像キャプションの機械学習AIは、こうした視覚的グラウンディングとしての「意味」を計算論的に実現する試みと捉えられる。ここでは全ての言葉を視覚的に表現することが原理上求められるが、「否定」はそれへのチャレンジングタスクである。我々は「存在否定」と「非一時的性質」をターゲットにして、画像からどのように理解されうるか、視覚的グラウンディングとしての意味理解はいかに可能か、人間と機械学習モデルのパフォーマンス比較を通して分析する。