2017 Fiscal Year Annual Research Report
大規模データ処理による網羅的データを用いた言語発達機構の解明とその応用
Project/Area Number |
17H02190
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
南 泰浩 電気通信大学, 大学院情報理工学研究科, 教授 (70396208)
|
Co-Investigator(Kenkyū-buntansha) |
小林 哲生 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 主幹研究員 (30418545)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 幼児語彙獲得 / 語彙テスト / DQRN |
Outline of Annual Research Achievements |
本研究の目的は,心理学的知見に基づき語彙獲得に関するデータを網羅的に収集し,これまで心理学では行われていない工学分野でのビックデータ分析により,幼児の語彙獲得規則の解明およびモデル化を行うことであり,さらに,解明した結果から,語彙テスト,語彙訓練システムを作成し,医療現場などの実務者へ提供することである。具体的には①定型児・非定型児の横断・縦断データの収集,地域差,非定型児と定型児の語彙発達過程の差の分析②Word2Vecを利用した語彙獲得規則の解明③以上の過程で得られた知見を,語彙テスト開発,言語聴覚士の言語訓練をサポートする手法に結び付けることを目的としている。この目的に対して,これまで以下のような実績を残している。 ①データの収集:この実施過程は以下の通りである。1.調布市と調整し,調布市の施設で,パンフレット配布,ローカルラジオ局を使って実験参加者の募集をかけた。2.電通大において,実験を開始し,横断データトータル20名分を収集した。 ②データ分析,語彙獲得基礎の解明:幼児語彙獲得の分析とモデル化のため以下の3種類の研究を行い,研究会,学会,国際会議等で発表を行った。1.幼児が話す語彙がどの程度共通であるかを調べた。この結果,語彙数が同じであれば,高い確率で同じ言葉を話すことが分かった。2.様々な言語で男女間での語彙獲得の順序の差を調べた。この結果男女で大きな差がないことが確認されたが,男女間の社会的な格差が語彙発達に影響を与える可能性も確認できた。3.幼児語彙発達の様々な現象を説明できるモデルを,機械学習手法を用いて考案した。実験によりその妥当性を示した。この発表は言語処理学会の若手奨励賞を受賞した。 ③言語テスト:これまでの様々な知見に基づき,Q3統計量を用いた簡易型語彙テストを考案した。この手法により80語程度の語彙で幼児の語彙能力を推定できることを確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
これまでの進捗を以下の三つの点に分けて説明する。 ①定型児・非定型児の横断・縦断データの収集,地域差,非定型児と定型児の語彙発達過差の分析:データ収集に関しては,100人を収集する予定であったが20人にとどまっており,進捗が若干遅れている。この理由は次の通りである。1.調布市の担当者が異動となったため,調布市の施設に依頼する実験参加者募集のパンフレット配布の実施が仕切り直しとなり,実験実施が遅れた。2.ラジオ放送による実験参加者の募集の効果が小さく,予定していた参加者が集まらなかった。しかし,これらにより,都市部での実験参加者募集の実現が難しいことは把握できた。データの分析においては,幼児の語彙数が同じであれば,ほぼ同じ割合で幼児が共通語を発話することが確認できた。これは世界的にも新しい発見であり,研究の進捗を大幅に進めた。また,社会の男女格差が語彙獲得に影響を与えることを確認し,トマセロが提唱している社会語用論的アプローチの妥当性を一部示した。 ②Word2Vecを利用した語彙獲得規則の解明:Word2Vecによるアプローチよりさらに高度なDRQN(Deep RecurrentQ-Network)というモデルを用いて,語彙獲得のモデル化を行いその妥当性を検証した。これは,世界的にも極めて新しい提案であり,研究の進捗を大きく早めた。 ③以上の過程で得られた知見を用いる語彙テストおよび言語聴覚士の言語訓練をサポートする手法の開発:語彙獲得データの完全な収集を待たずに,簡易型語彙テストの開発を行った。これまで,様々な語彙テストが存在するが,本研究により幼児の語彙発達の特性に合わせ,かつ,統計的な手法を用いた初めての幼児のための簡易語彙テストを完成させることに成功した。 以上により,遅れている部分も若干存在するが,全体としては計画以上に研究が進捗していると判断している。
|
Strategy for Future Research Activity |
今後の研究の方向性は,基本的に,①定型児・非定型児の横断・縦断データの収集,地域差,非定型児と定型児の語彙発達過程の差の分析,②Word2Vecを利用した語彙獲得規則の解明,③以上の過程で得られた知見を用いる語彙テストおよび言語聴覚士の言語訓練をサポートする手法の開発の三点を軸に決定する。各項目の詳細の方向性を以下に示す。 ①定型児・非定型児の横断・縦断データの収集,地域差,非定型児と定型児の語彙発達過程の差の分析:データ収集に関しては,参加者が集まらないこともあり,以下の3つの方策を実施する。1.実験担当業務を実施する担当者を雇用し,実験のスケジューリングを効率的に行う。いままで,学生がこの業務を行う予定でいたが,業務経験の不足および研究時間を圧迫する可能性もあり,実施が困難なことが分かったため,このような対処を行う。2.保護者が興味のありそうな講演を行い,実験参加者を集める。3.一部実験業務の業者への委託を行いデータ収集を加速する。データ分析に関しては,現状の分析結果をさらに発展させせる。 ②Word2Vecを利用した語彙獲得規則の解明:DRQNによるモデルをさらに発展させ,より高度な言語発達モデルを作成する。これにより,語彙獲得の規則を発見する。同時にWord2Vecによる分析手法の実現も行う。 ③以上の過程で得られた知見を用いる語彙テストおよび言語聴覚士の言語訓練をサポートする手法の開発:語彙数によって,幼児が話す語彙に共通性があることが非定型の幼児にも適用できるかどうかを調べる。また,この原理を利用することにより語彙獲得を促進する手法が提案できるかどうかも調べる。
|