2017 Fiscal Year Research-status Report
日本語複文構造の学習において役割を果たす生得的知識の同定について
Project/Area Number |
16K02621
|
Research Institution | Yokohama National University |
Principal Investigator |
藤井 友比呂 横浜国立大学, 大学院環境情報研究院, 准教授 (40513651)
|
Co-Investigator(Kenkyū-buntansha) |
時崎 久夫 札幌大学, 地域共創学群, 教授 (20211394)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 複文 / 補文標識 / 句構造文法 / コーパス / 刺激の貧困 / 対子供発話 |
Outline of Annual Research Achievements |
平成29年度は,平成28年度に行った対子供の自然発話の分析の反省および補足作業を行い,中間的な成果を出す計画であった.補足作業としては,CHILDESデータベースのMORティアと呼ばれる形態素解析情報の利用,およびコーディングティアと呼ばれる発話を分類した結果の情報の作成など,CHILDESデータベースを活用する上での技術的な進展があった. しかし,発話のコーディング(分類)そのものにおいて様々な問題が見え,とくに分類の不確定性という問題が見えて,その解決に時間を割かなければならなかった.一般的に言えば,発話コーディングにもとづいたコーパス研究は,現象の複雑さ,理論的分析の複雑さに応じて,発話分類に不確定性が増してくるという問題がついてまわることが明らかになった.問題の解決に向けて動き出し,解決法も見えているが,具体的には,比較的数少ない,同様の発話データのコーディングを行っている過去研究で取られている方法論を再度検証しなおし,本研究課題が対象にしている現象が過去研究の現象と同程度に複雑であるにも関わらず理論設定を単純に考えていたことが問題であることが分かった. 平成29年度は,一方で上で述べたような分類の不確定性から自由な方法論の追求をスタートした.青空文庫等からで利用できる電子テキストデータと形態素解析器,オープンソースのソフトウェア,辞書を用いたテキスト分析である.2つの表現の共起頻度等を調べることができる.本年度はいわゆる適正束縛の効果がテキスト上に現れてるかを調べるために,トとヲの共起頻度のパイロット研究を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
大きな目標は,データベース上のデータが,仮説選択について曖昧データとされるかか非曖昧データとされるかを決定することである.が,結果は理論的設定によって大きく変わってくる.そして理論的設定は現象が複雑になればなるほど,複雑になる.具体的には,理論的設定を行うさいの変数として,これまで日本語複文の句構造のみを考慮に入れていたが,実はもう一つ空主語の扱いに関して変数を明示的に考慮する必要がある.
|
Strategy for Future Research Activity |
空主語の扱いについて考慮し,理論設定を洗練させる必要がある.そうすれば曖昧データと非曖昧データの分類は平成30年度に可能となるはずである. 一方,対子供発話の分析にはさらなる困難が生じる可能性もあるので,青空文庫等のテキストデータの分析も同時に進め,成果を確保したい.
|
Causes of Carryover |
今年度は中間的な成果の発表を見送らざるを得なかった.次年度,対外的な成果公表を確保するため研究を推し進める計画である.
|
Research Products
(1 results)