2006 Fiscal Year Annual Research Report
語彙獲得のニューラルネットワークモデルの構築と背景メカニズムの推定
Project/Area Number |
04J01081
|
Research Institution | Kyoto University |
Principal Investigator |
森藤 大地 京都大学, 情報学研究科, 特別研究員(DC1)
|
Keywords | ニューラルネット / 言語発達 / 統語学習 / 意味獲得 / 自己組織化 / 統計的学習 |
Research Abstract |
統語知識の中でも特に,複文構造の獲得に焦点を当てシミュレーションを行った.英語において,複文には4種類の構造が存在する.これらの構造は,関係節によって修飾される名詞が,「主節内」および「関係節内」で主格または目的格のどちらの役割を果たすかという2つの要因によって生成される.複文の4つの構造に対する成人の理解度は異なっており,右分岐文の理解が中心埋め込み文に比べて容易であることが示されている.この理解の困難さの違いは,複文自身が持つ構造的な複雑さ,および言語環境における複文構造の典型性の2点から説明されている.また,最近の幼児における複文理解を調べた研究からも,複文それぞれの理解度は構造の典型性や頻度など言語刺激のもつ統計的な性質を反映していることが示唆されている. もし,この示唆が正しいものであるならば,統計的な性質を反映した統語獲得を行う能力を有するニューラルネットワークモデルに対して幼児が経験する言語刺激として尤もらしいコーパスで学習を行えば,人の示す複文理解を再現できると考えられる.尤もらしいコーパスとは,複文だけを含むのではなく,単文や等位接続文,分裂分や関係節修飾名詞句など多くの文構造を含むコーパスである.シミュレーションには,私達が提案した自己組織化マップを含む再帰的ニューラルネットワークを用いた.シミュレーションの結果,複文だけで学習したネットワークに比べ,単文や等位接続文を含む尤もらしいコーパスで学習したネットワークは,人の複文理解をよく再現し,構造による理解の困難さの違いを示した.この結果から,先行研究で示唆されているように,人の統語学習,特に複文学習は言語刺激の統計的性質を反映した形でなされること示した.
|