2015 Fiscal Year Annual Research Report
次世代日本語コーパスプロトタイプの構築とその脳認知言語学実験への応用
Project/Area Number |
25370457
|
Research Institution | Tohoku University |
Principal Investigator |
吉本 啓 東北大学, 高度教養教育・学生支援機構, 教授 (50282017)
|
Co-Investigator(Kenkyū-buntansha) |
横山 悟 千葉科学大学, 薬学部, 准教授 (20451627)
森 芳樹 東京大学, 総合文化研究科, 教授 (30306831)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | コーパス言語学 / 統語論 / 日本語文法 |
Outline of Annual Research Achievements |
本研究では、日本語の書き言葉文に対し十分な統辞論的情報を均質的にタギングするための方法を確立し、実際にプロトタイプ日本語トリーバンクを構築すること、またこれに対し文の意味情報を自動的にタグ付けし、コーパスの詳しい言語情報を利用して脳内言語処理モデルを構築することを目的とする。 極力フラットな統辞構造を採用し、機能情報を付加するという方針の下に、自動解析器を使用しながらも、主として人手によって日本語トリーバンクを構築した。客観的でバランスのとれた分類・解析基準を定めながら構築作業を進めた。また、コーパスの頻度情報を利用して脳内言語処理の研究を進めた。 このために、現代日本語の書き言葉の文に対して、ジャンルや文体を問わず、十分な統辞論的情報 (句構造) を均質的にタギングするための方法を確立し、実際に相当数の文に対して統辞情報を付加したプロトタイプ日本語トリーバンクを構築した。さらに、これらの文に付加された統辞情報にもとづいて、文の意味情報 (述語論理式による意味表示) を SCT を利用して自動的にタグ付けするための手法を開発した。
|