2018 Fiscal Year Research-status Report
項省略を考慮した日本語の統語的ブートストラッピング
Project/Area Number |
18K12357
|
Research Institution | Tokyo University of Science |
Principal Investigator |
折田 奈甫 東京理科大学, 理工学部教養, 講師 (70781459)
|
Project Period (FY) |
2018-04-01 – 2020-03-31
|
Keywords | 言語獲得 / 統語的ブートストラッピング / 項省略 / 絵本 |
Outline of Annual Research Achievements |
言語獲得研究では、子どもが動詞の項の数を手がかりにその動詞の大まかな意味を推測し学習するという統語的ブートストラッピング仮説が、日本語を含む様々な言語で検証されてきた。しかし、日本語の子ども向け発話では、動詞の項や文法関係を示す格助詞が高頻度で省略される。本研究は、談話から何について話されているかが推測できれば、省略された項が未知の動詞の意味の学習の手がかりとなり、日本語においても項の数という言語普遍的手がかりが役立つと仮説を立て、①絵本述語項構造コーパスを構築・分析し、項省略と格助詞がインプットでどのような特徴を持ち分布するかを検証し、②このコーパスを用いた動詞の意味の学習の計算機シミュレーションを行う。
2018年度は、絵本述語項構造コーパスの構築と分析を行い、子どもの言語インプットに関する新しい知見が得られた。第一に、会話では頻繁に省略される項や格助詞が、絵本ではさほど省略されないことがわかった。この結果は、子供向け発話からインプットの有無や程度を議論してきたこれまでの母語獲得研究に対して、異なる種類のインプットの分布を観察することの重要性を提起している。第二に、有生物が少しだけ出てくるような状況(絵)の時に、動詞の項が省略されやすいことが分かった。このような学習状況が省略項の存在の推測を可能にし、したがって動詞の意味の学習に役立つ可能性がある。これらの結果の詳細は、認知科学の国際学会において発表予定である(The 41st Annual Meeting of the Cognitive Science Society)。2019年度は、これらの知見をもとに、絵本述語項構造コーパスを用いた計算機モデルによる動詞の意味の学習シミュレーションを行う。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
概ね当初の予定通り順調に進んでいる。2018年度の研究成果はトップレベルの国際学会で発表が決まっている。絵本述語項構造コーパスへの追加アノテーションが予定より若干遅れているが、これは言語学のトレーニングを受けた高度な判断ができるアノテータの確保ができなかったためである。
|
Strategy for Future Research Activity |
絵本述語項構造コーパスの追加アノテーションを行い、絵本述語項構造コーパスを用いた計算機モデルによる動詞の意味の学習シミュレーションを行う。絵本述語項構造コーパスの構築・分析とシミュレーションの結果をまとめて国際的な学術雑誌へ投稿する予定である。
|
Causes of Carryover |
アノテーションのための人件費として計上していたが、当初予定より使用できなかった。言語学のトレーニングを受けた高度な判断ができるアノテータの確保が難しかったためである。次年度はアノテーション作業を当初計画より増やす予定である。
|
Research Products
(2 results)