2021 Fiscal Year Annual Research Report
Exploring the role and cognitive mechanism of language for representing and processing abstract concepts: A computational modeling approach
Project/Area Number |
20H04488
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
内海 彰 電気通信大学, 大学院情報理工学研究科, 教授 (30251664)
|
Co-Investigator(Kenkyū-buntansha) |
猪原 敬介 北里大学, 一般教育部, 講師 (10733967)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 抽象概念 / 記号接地 / 単語ベクトル / 言語 / ニューラル言語処理 |
Outline of Annual Research Achievements |
2021年度は、以下の研究を実施した。 (1) 単語ベクトル(言語経験)と画像ベクトル(身体経験)を用いた抽象概念の間接的接地の計算モデルの有効性を、英単語属性データを予測する実験を行った。前年度の結果を踏まえて、他のモデルとの比較や実験結果の詳細な分析を行い、その結果を学術論文としてまとめ、英文誌に投稿した。(現在、査読中。) (2) 上記と並行して、抽象概念の間接的接地の妥当性をさらに検証するために、ヒトを対象とした心理実験を行った。心理実験では、直接的接地と間接的接地に対応する画像をプライム刺激、抽象概念を表す抽象語をターゲット刺激としたプライミング実験を行い、間接的接地に対応するプライムを提示したときに、ターゲットの語彙判断において(特に、抽象度の高い単語では)有意なプライミング効果が得られることを示した。この実験結果をまとめた論文を執筆中であり、次年度に投稿予定である。 (3) 日本語に対する計算モデルによる実験を行うためのデータセットを開発するための検討を行い、小規模な日本語単語属性データ(105単語x40属性)をインターネット調査を通じて収集した。上記の(1)で用いた英単語属性データとの比較を通じて、収集したデータが妥当であることを確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
日本語のデータセットを収集する上で、当初に予定していた方法では予算面で難しいことがわかったため、データの収集が予定よりも小規模になったのが反省点である。それ以外の研究については順調に進展している。
|
Strategy for Future Research Activity |
次年度以降は、以下の課題を推進していきたい。 (1) Transformer (BERT) などの最新のニューラルネットワークモデルを用いて学習した単語ベクトルに内在する情報を解明するという課題については、前年度に研究代表者が Cognitive Science 誌に発表した論文を契機に、関係する研究が他研究者によって進められ、いくつかの成果が学術論文として発表されている。したがって、それらの成果を十分に検討した上で、本研究課題を発展させていきたい。 (2) 間接的接地を通じて理解されるべき単語(概念)を、その抽象度の評定だけで選定する方法はいくつかの問題があるため、そのような単語を計算論的に決定する方法を検討するとともに、それに基づいて間接的接地の計算モデルを精緻化していきたい。また、抽象概念を理解する上で感情が重要であると多くの研究者が指摘しているため、この情報を取り込んだ計算モデルを考えることも必要である。 (3) 日本語データセットの構築についても、収集手法を検討しつつ、引き続き行っていきたい。
|