研究課題/領域番号 |
23K25320
|
補助金の研究課題番号 |
23H00623 (2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2023) |
応募区分 | 一般 |
審査区分 |
小区分02060:言語学関連
小区分02080:英語学関連
合同審査対象区分:小区分02060:言語学関連、小区分02080:英語学関連
|
研究機関 | 電気通信大学 |
研究代表者 |
南 泰浩 電気通信大学, 大学院情報理工学研究科, 教授 (70396208)
|
研究分担者 |
小林 哲生 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 上席特別研究員 (30418545)
|
研究期間 (年度) |
2023-04-01 – 2027-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
15,600千円 (直接経費: 12,000千円、間接経費: 3,600千円)
2026年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2025年度: 3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2024年度: 3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
2023年度: 3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
|
キーワード | 幼児語彙発達 / 語彙チェックリスト / 言語獲得 / 幼児語彙獲得 / ゆらぎ / 非定型児 |
研究開始時の研究の概要 |
本研究の最終的なゴールは幼児の言語獲得機構の解明であり,幼児の発達状況を的確に把握できる理論の構築とそれを用いた発達過程把握手法の開発を行う.ここでは,①語彙数に基づく統一的な語彙獲得過程の分析と個人差の分析による語彙発達理論の構築,②非定型児データによる理論の補強および非定型児の語彙発達過程の分析,③提案する語彙発達理論を用いた幼児の語彙発達度合を検査する手法の開発の三点で研究を行う.この目的のため,同じ語彙数を持つ幼児の大規模なデータを収集し,そのデータとこれまで収集した大規模な横断データを用い,様々な工学的手法により,語彙獲得機構の分析を行い語彙獲得の新しい理論を提案する.
|
研究実績の概要 |
幼児の語彙獲得機構を解明するため,機械学習を用いたモデル化を行った.このモデルでは,母子間の相互行為や心理学的要因についてTomasello の「幼児が持つ認知的スキルである『共同注視』,『意図の理解』などの母子間の相互行為によって語彙獲得における語の意味の可能性に制限が与えられる」という主張に従い, 深層強化学習を用いて事前知識のない状態から語彙を獲得する. この研究では,従来の恣意的な特徴量ではなく, Martin らの研究から判明した49 次元の特徴量を用い, 幼児の持つ内発的な好奇心についてNGUを基にした内部報酬を設計し, 母子の相互作用を組み合わせた語彙獲得を行った. この結果,従来の幼児の幼児語彙獲得モデルでは探索が困難な少ない情報量の特徴量空間上でも好奇心による探索を行い, 語彙獲得に成功した. また, 物体を同定する特徴量の選択が,学習するにつれて木構造として最適な形になっていき, 語彙獲得を通して幼児自身が自律的に制約を獲得する仕組みを再現することができた.この成果を,Architectures and Mechanisms for Language Processing2023国際会議において発表を行った.またデータ収集に関しては次の活動を行った.翌年からの幼児の語彙データの収集に向けた予備調査として,調布市子ども家庭支援センター すこやかにおいて,12月から0歳6カ月~3歳8カ月のお子さん12人の語彙データを収集した.このデータを用いて,簡易語彙テストの評価を行い,簡易語彙テストの妥当性を検証した.また,2才の年齢を対象として.500名のデータを収集した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度は,研究計画の準備期間としており,幼児言語獲得の研究を促進するため,これまで,幼児語彙獲得の実験を行っていなかった学生のチーム構成を行い.Slackによる連絡体制を構築した.事務系職員を週14時間採用し,データ収集方法や実験参加者への連絡方法を指導した.調布市や調布市の外郭団体である調布市子ども家庭支援センターすこやかとのデータ収録に関する説明を行い施設でのデータ収録の許可を取った.すこやかにおいて,幼児語彙獲得データの収集実験を行い,上記の事務系職員とともに実験の実務を担う学生に実験参加者募集のためのポスターつくりから実験終了時の報酬の提供,データ整理までの一連の流れを覚えてもらった.これらの試行により,次年度以降の実験がスムーズに施行できる体制を構築した.また,この実験を通して,簡易語彙システムを完成させた.東京都福祉局の職員にも幼児語彙獲得実験の概要を説明し,今後の進め方について議論した.以上のように,次年度に向けた実験体制づくりに本年度は注力し,その体制の構築が達成できた. 幼児語彙獲得の工学的なモデルを構築するため,メトロポリス・ヘイスティングス名付けゲームやVariational AutoEncoderを調査し,モデル化の可能性を検証した. 以上のように,初年度は,実験担当者の実験体制の整備と,各担当者のスキルの向上に多くの時間を割き,次年度以降の実験準備を行った.当初予定通りに進捗している.
|
今後の研究の推進方策 |
初年度において,実験環境の整備と実験担当者のスキル向上を行ったので,次年度以降は,計画に従い,以下の語彙データを収集していく.1.日本全国からWebによる1000人程度の語彙獲得データ収集.2.定型児縦断語彙獲得データ50人分をひと月おきに10カ月間収集. 3.非定型児10人分の語彙データをひと月おきに24カ月間収集. 4.非定型児100人分の横断語彙獲得データの収集. 1.に関しては,NTTが主体となり,各年度で,Webを使って収集していく.2.に関しては,調布市のすこやかでリクルートした実験参加者か電通大の職員で子供を持っている方を対象に,データを収録していく.毎年3人程度を長期にわたり収録する.3.4.に関しては,センシティブな実験参加者を対象にするので,再度,倫理審査を申請する.非定型児に関しては,調布市 発達支援センターでのリクルートを行うが,調布市の担当者が移動になったため,事前に,調布市の担当者と面談し信頼関係を構築する.また,その後に発達支援センターの担当者とも信頼関係を構築する.十分な実験参加者の人数が確保できない場合には,三鷹市の発達支援センター,狛江市の発達支援センターへと対象を広げていく.獲得したデータに基づく分析においては,語彙獲得に最も影響を与える説明変数が月齢ではなく語彙数であることを統計的に検証し,従来の説明のように,参照型(referential style)と表出型(expressive style)といった複数の典型的な語彙発達タイプが存在しないことを示し,新しい語彙発達の理論を構築する.また,同語彙数の大量のデータの分析により,品詞の獲得割合が語彙数の増加によってゆらぐ現象が普遍的なものであるかを検証する.またこのゆらぎがが,個々の幼児でも起きるのかも2のデータから検証する.さらに,個人差の統計情報も分析する.
|