2018 Fiscal Year Annual Research Report
大規模データ処理による網羅的データを用いた言語発達機構の解明とその応用
Project/Area Number |
17H02190
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
南 泰浩 電気通信大学, 大学院情報理工学研究科, 教授 (70396208)
|
Co-Investigator(Kenkyū-buntansha) |
小林 哲生 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 主幹研究員 (30418545)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 語彙発達 / Word2vec / ニューラルネット / 非定型児 |
Outline of Annual Research Achievements |
本研究の目的は,心理学的知見に基づき語彙獲得に関するデータを網羅的に収集し,これまで心理学では行われていないビックデータ分析により,幼児の語彙獲得規則の解明およびモデル化を行うことであり,さらに,解明した結果から,語彙テスト,語彙訓練システムを作成し,医療現場などの実務者へ提供することである。具体的には①定型児・非定型児の横断・縦断データの収集,地域差,非定型児と定型児の語彙発達過程の差の分析②Word2Vecを利用した語彙獲得規則の解明③以上の過程で得られた知見を,語彙テスト開発,言語聴覚士の言語訓練をサポートする手法に結び付けることを目的としている。この目的に対して,これまで以下のような実績を残している。 ①データの収集:この実施過程は以下の通りである。1.調布市の施設で,パンフレット配布,実験参加者の募集をかけた。2.電通大において,実験を開始し,30年度横断データ413名分を収集した。トータルで433人分を収集した. ②データ分析,語彙獲得基礎の解明:幼児語彙獲得の分析とモデル化のため以下の3種類の研究を行った.これらの成果は学会発表に向けて準備中である。1.幼児が話す語彙がどの程度共通であるかを昨年に引き続き調べた.これに加え,非定型児の結果も加えて,分析した結果,発達の過程は語彙数によって決まっており,非定型児でも同じ過程をたどることが分かった.これは心理学的には大きな発見である.2.地域差による語彙獲得の順序の差を調べた。この結果地域差で大きな差がないことが確認されたが,地域性も若干示すことも確認した。3.昨年度提案した機械学習を用いた幼児語彙発達の様々な現象を説明するモデルを実際の画像データを用いて実装した。実験によりその妥当性を示した。4.Word2Vecによる発達過程の分析を行った. ③語彙予測方法の提案:②の1で得られた結果をもとに,語彙予測手法を提案した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
これまでの進捗を以下の三つの点に分けて説明する。 ①定型児・非定型児の横断・縦断データの収集,地域差,非定型児と定型児の語彙発達過差の分析:データ収集に関しては,定型児400人程度収集する予定であったが,410人収録でき,遅れを解消できた。ただし,非定型児のデータ収集が難しいことも確認できた.これは,担当者が,学内業務が多忙で,非定型児に収集に関するネゴシエーションに時間をさけなかったことにより,データ収集が十分に実施できなかったためである.しかし,その分を,共同研究者が収集した非定型児の分析に重点をおいた.この結果,非定型児であっても,幼児の語彙数が同じであれば,ほぼ同じ割合で幼児が共通語を発話することが確認できた。これは世界的にも新しい発見であり,研究の進捗を大幅に進めた。 ②Word2Vecを利用した語彙獲得規則の解明:英語の幼児のデータに対して,Word2Vecを用いて,言語文脈の発達過程を分析した,この結果,幼児の語彙の文脈使用様相がだんだん大人に近くなることが確認できた.また,DRQN(Deep RecurrentQ-Network)を用いて,語彙獲得のモデルを,さらに高度化し,その妥当性を検証した。これは,世界的にも極めて新しい提案であり,研究の進捗を大きく早めた。 ③以上で得られた知見を用いることによる言語聴覚士の言語訓練をサポートする手法の開発:②で得られた知見をもとに,次に発話する語彙を予測することに成功した。以上により,遅れている部分も若干存在するが,全体としては計画以上に研究が進捗していると判断している。
|
Strategy for Future Research Activity |
今後の研究の方向性は,基本的に,①定型児・非定型児の横断・縦断データの収集,地域差,非定型児と定型児の語彙発達過程の差の分析,②Word2Vecを利用した語彙獲得規則の解明,③以上の過程で得られた知見を用いる語彙テストおよび言語聴覚士の言語訓練をサポートする手法の開発の三点を軸に決定する。各項目の詳細の方向性を以下に示す。 ①定型児・非定型児の横断・縦断データの収集,地域差,非定型児と定型児の語彙発達過程の差の分析:データ収集に関しては,実験担当業務を実施する担当者を雇用し,実験のスケジューリングを効率的に行うことが機能しているため,今後もこれを続けていく.また,保護者が興味のありそうな講演を行い,実験参加者を増加させることを今年度も行う.非定型児のデータ収取は,極めて,難しいので,現状は分析のみに注力する.ただし,1000人規模のデータを取得した場合その中には,非定型児も含まれる可能性がある.このデータを分析していくことは考えていく. ②Word2Vecを利用した語彙獲得規則の解明:DRQNによるモデルをさらに発展させ,より高度な言語発達モデルを作成する。これにより,語彙獲得の規則を発見する。同時にWord2Vecによる分析手法の実現も行う。 ③以上の過程で得られた知見を用いる語彙テストおよび言語聴覚士の言語訓練をサポートする手法の開発:語彙予測が,非定型児の語彙獲得を促進する手法に役立てていけるどうか検討していく。
|