研究課題/領域番号 |
15K12888
|
研究種目 |
挑戦的萌芽研究
|
配分区分 | 基金 |
研究分野 |
日本語学
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
浅原 正幸 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, 准教授 (80379528)
|
研究分担者 |
中田 節子 (有田節子) 立命館大学, 言語教育情報研究科, 教授 (70263994)
|
研究期間 (年度) |
2015-04-01 – 2017-03-31
|
研究課題ステータス |
完了 (2016年度)
|
配分額 *注記 |
3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2016年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2015年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | アノテーション / 近代語 / コーパス / 係り受け / 述語項構造 / 分類語彙表 / 節境界 |
研究成果の概要 |
本研究では、近代語コーパスに対する統語情報アノテーションの仕様策定を行った。具体的には、文節係り受け・並列構造・述語項構造アノテーションを明六雑誌6サンプルに対して行い、問題点を明らかにした。このデータに基づき Universal Dependency に適応させたデータを開発した。同内容は2017年9月に開かれる国際会議 JADH-2017 で発表予定である。また、意味情報を含む他のレベルのアノテーションとして、節境界情報・分類語彙表番号アノテーションを試行的に行った。
|