研究課題/領域番号 |
23K11786
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分90030:認知科学関連
|
研究機関 | 京都大学 |
研究代表者 |
阪上 雅昭 京都大学, 人間・環境学研究科, 名誉教授 (70202083)
|
研究分担者 |
深田 智 京都工芸繊維大学, 基盤科学系, 教授 (70340891)
萩原 広道 大阪大学, 大学院人間科学研究科, 助教 (00907735)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2025年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2024年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2023年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | 語彙発達 / 乳幼児 / 機械学習 / CDI / CHIDS / CHILDS |
研究開始時の研究の概要 |
本研究では乳幼児のことばの発達,とりわけ発達における語の意味分化・確立を研究対象とする.機械学習や非線形物理の概念や手法を用い,その結果と言語学の知見を融合させて,ことばの発達を統一的に研究することが本研究の特徴である.
非線形物理の視点からことばの意味分化をアトラクター形成と捉えると,動詞が優位な〈行為〉アトラクターの存在が示唆される.その存在を実証することが本研究の目的である.さらにこの目的のために機械学習の手法を駆使して開発さらに発展させる成果・手法が「実際の子どもの語彙発達あるいは獲得語彙同士の相互関係の表示と言えるのか」を問い,言語発達理論に対して検証可能な仮説を提示することを試みる.
|
研究実績の概要 |
本研究では乳幼児のことばの発達,とりわけ発達における語の意味分化・確立を研究対象とする.機械学習や非線形物理の概念や手法を用い,その結果と言語学の知見を融合させて,ことばの発達を統一的に研究することが本研究の特徴である.本研究の準備段階で,CDI データをもとに,すでに機械学習のいくつかの手法を駆使し,語の発達と個々の子どものことばの発達それぞれを可視化し,発達過程の生成もできるようになっていた.これらの結果が,「実際の子どもの語彙発達あるいは獲得語彙同士の相互関係の表示と言えるのか」を研究した.具体的な実績としては, (a) 個体の発達表示:縦断データのケーススタディ: 英語CDIデータでは4 回以上調査を実施している乳幼児が111 名存在する.これらのデータの潜在空間の擬一次元構造内での動きを検討した.その上で,その経路を変更したときの表出語彙の変化をdecorder で計算し,擬一次元構造の外側-内側(Outer-Inner) など位置の違いの意味を明らかにした.この研究に続き,中国語CDIデータの同様の解析を実施した.その過程で潜在空間を3次元に上げる必要性が生じたので3次元VAEモデルの構築を英語CDI,中国語CDI両方について実施し,分析した. (b) 語の発達表示:語の役割の理解と多言語比較: 語の発達表示については研究計画の段階ではPCAを用いて各語の表出時期の違いなどを議論していた.本年度の研究の中でVAEの潜在空間やdecoderを活用することで,各語についてPCAよりも多様な特徴量を計算できることが分かった. (c) 各語の特徴量の理解とCHILDES コーパスの活用:(b)で求めた各語の特徴量と従来から言語心理学で知られていた語の指標の関連を探った.その過程で養育者が発話する頻度などについてはCHILDコーパスを利用して定量的評価を実施した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
今年度の研究では個体の発達表示,語の発達表示それぞれにおいて計画以上に大きな進展が得られた.それは以下のように要約することができる. (a)個体の発達表示:3次元VAEモデル 英語CDIデータのVAEによる解析において潜在空間に出現する擬一次元構造の理解が進んだので,同じ手法を中国語CDIデータに適用した.その過程でVAEモデルの潜在空間を2次元から3次元に上げる必要性があることが分かった.そこで英語,中国語両方について潜在空間が3次元のVAEモデルを構築し,各個体の発達を分析した.3次元モデルでも表出語彙の発達を表現する多様体構造が出現することが確認できた.さらにこの多様体のLeft-Right が動詞優位-名詞優位を区別,Outer-Inner がみんなが話す易しい語をより選択的に表出するpopularityを表していることが分かった.このように潜在空間の次元を上げることで,発達を特徴付ける指標を増やすことができた.それと同時に,英語,中国語の発達を比較して分析することが可能になった. (b)語の発達表示:3次元VAEモデルでの語の特徴量の算出 研究計画段階では語の特徴量はPCAを用いて算出することにしていた.しかし,今年度の研究実施の過程でVAEを利用することで,各語についてより多様な特徴量を計算できることが分かった.さらに潜在空間を3次元に上げることでその表現能力はさらに大きくなった,これらが,計画以上に本年度の研究が進展した核心部分である.
|
今後の研究の推進方策 |
現在までの進捗状況で述べたように,3次元VAEモデルを使うことで個体の発達表示,語の発達表示の双方で大きな進展があった.今後はこれらをさらに進化させるために以下のような研究を行う. (a)個体の発達表示:英語と中国語の多様体構造の比較 3次元VAEモデルでは潜在空間の Left-Right軸方向の位置が動詞優位-名詞優位を表し,Outer-Inner軸方向の位置がpopularity を表していること,さらにこれらの軸の解釈は英語と中国語で共通であるという知見が得られている.このように多様体構造の軸の意味は共通であるが,その形状は英語と中国語で大きく異なっている.具体的には英語の場合は細長い3次元構造であるが,中国語の場合はOuter-Inner軸方向がとても薄い構造になっている.これらの3次元構造の違いが英語・中国語のどのような特徴を反映しているのか明らかにする.また,これらの解析を日本語CDIなど他の言語に広げていく. (b)語の発達表示:算出された語の特徴量の理解と英語・中国語の比較 3次元VAEモデルを用いることで,従来よりも多様な語の特徴量が計算できるようになってきている.得られた語の特徴量のうち Outer-Inner に対応する特徴量は言語心理学で知られている concreteness すなわち語の意味の具体性と密接に関連していることが分かってきた.しかし,それ以外の特徴量については理解が進んでいない.CHILDS コーパスを活用して,養育者の表出頻度である frequency, 文の中でいろいろな語との共起しやすさを表す contextual diversity などを算出しVAEで得られた語の特徴量との関連を探ることを計画している.
|