本研究は、言葉の獲得における「学習事例の分かりやすさ」の特徴・性質を明らかにすることを目的としている。近年の母語獲得研究では、子どもは多くの事例から言葉と意味の関係を学習するのではなく、起こるのは稀だがわかりやすい事例から言葉の学習を行うことが提案されている。しかし、この「わかりやすい学習事例」についての明確な数理モデルは存在しない。そこで本研究は、言語情報と非言語情報の特徴を定量的に抽出し、この「わかりやすい学習事例」を形式化/予測し、これにより、言葉の獲得に有用な学習事例の特徴や性質を明らかにすることを目指す。
2017年度は、言葉の学習に用いる言語情報とそれに対応した非言語情報を定量的にとらえるための言語資源の設計と構築を行った。日本語のミリオンセラーの絵本を選定し書き起こしを行い、書き起こされたテキストに対して述語項構造タグや視覚情報の有無のタグ(絵に出ているか)を付与した。2018年3月末時点で、85冊の絵本の書き起こしと、このうち39冊の絵本に対するアノテーション作業が行われた。アノテーション作業者間一致は概ね妥当な結果となり、研究に耐えうる言語資源であることを示した。絵本テキストに対してこのようなアノテーションを行なった言語資源はこれまでに例がなく、今後様々な言語獲得研究に応用できる可能性がある。この絵本述語項構造コーパスについては2018年度言語処理学会年次大会にて口頭発表を行った。今後はこのコーパスを用いた分析や学習シミュレーションを進める。
|