研究実績の概要 |
本研究の目的は, 現在のニューラルネットワークに導入され性能の向上に貢献している注意のメカニズムと人間の注意の特性との比較を行い説明可能性と相同性を検討することであった。ニューラル脚注生成は空間情報をCNNによって抽象化し, 時系列情報をRNNに処理させることで実現されている。このとき画像のどの位置のどこに着目して言語化しているのかについての注意に誘導された処理が前提とされる。注意は大脳生理学, 実験心理学の分野で検討されてきた経緯もある。そこで本研究では, 人間の注意機構の解明と人工知能の精度向上とを同時に見据えた意義を持っている。本研究では, (1)人間の生理心理実験から得られたアイトラッキングデータとコンピュータが画像認識用ニューラルネットワークに注意を組み込んだモデルが示す注意の遷移データとを比較し, (2)人間の被験者が自然言語で書かれた文章を黙読する際の視線の動きと, リカレントニューラルネットワークに注意機構を組み込んだモデルが示す注意のヒートマップ情報を比較することで, 人間の注意機構と人工知能の注意機構との差異を明確にすることを研究目的とした。このような注意のメカニズムと注意を実現する人工知能の技術が人間の認識特性を説明するために十分な能力を有しているか否かを問うことは, 分野を越えた重要な課題であると考えられる。本研究では上記の研究目的を達成するために, 生理実験, 心理実験で得られた視線追跡データとニューラルネットワークモデルによる注意のヒートマップとの比較を行い人間の視線追跡データを近似するためにモデルから推定されたパラメータを用いて, 人工知能に画像認識, 文章理解, 画像からの文章生成を行わせた場合に精度の向上が得られるかを検討した。現状ではシミュレーション研究で人間の視線移動データを追従するために必要なパラメータの調整の心理学的な意味の解釈に問題が残っている。注意機構の役割を明確にするという意味では更なる研究が必要となるだろう。
|