研究課題/領域番号 |
17H00917
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
浅原 正幸 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, 教授 (80379528)
|
研究分担者 |
服部 隆 上智大学, 文学部, 教授 (10289598)
古宮 嘉那子 茨城大学, 理工学研究科(工学野), 講師 (10592339)
市村 太郎 常葉大学, 教育学部, 講師 (10701352)
山崎 誠 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (30182489)
宮内 佐夜香 中京大学, 文学部, 准教授 (30508502)
池上 尚 埼玉大学, 教育学部, 准教授 (50739125)
岡 照晃 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, 特任助教 (50782942)
|
研究期間 (年度) |
2017-04-01 – 2022-03-31
|
キーワード | コーパス / アノテーション |
研究実績の概要 |
統語情報と意味情報の2つに分けて研究実績を示す。 統語情報は、従前より続けていた『現代日本語書き言葉均衡コーパス』に対する係り受け・並列構造アノテーションに関する論文が言語処理学会論文誌『自然言語処理』に採録されたほか、日本国内の依存構造アノテーション研究者とともに執筆した論文「Universal Depndencies 日本語コーパス」も同誌に採録された。また情報構造の論文ではあるが「名詞句の情報の状態と読み時間について」が言語処理学会 2018年度論文賞を受賞した。また、『現代日本語書き言葉均衡コーパス』の Universal Dependencies 版に関する発表を国際会議 Universal Dependencies Workshop 2018 で行った(UD-Japanese BCCWJ: Universal Dependencies Annotation for the Balanced Corpus of Contemporary Written Japanese)。 意味情報においては、『分類語彙表』に対するデータ拡充を進めた。反対語情報・単語親密度情報・位相情報・岩波国語辞典との対応表などの整備を行った。単語親密度・位相情報に関する言語処理学会年次大会における発表は、 NLP 2019 言語資源賞を受賞した。現代語に対する『分類語彙表』情報アノテーションを国際会議 PACLIC 32 で行った(Between Reading Time and Clause Boundaries in Japanese - Wrap-up Effect in a Head-Final Language) ほか、節境界情報アノテーションについても Workshop of Asian Language Resources 13で発表を行った(Japanese clause classification annotation on the `Balanced Corpus of Contemporary Written Japanese')。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
アノテーション作業を着実に進めたほか、積極的に対外発表を国内外で行ったため。
|
今後の研究の推進方策 |
引き続き分類語彙表番号アノテーションを続けるとともに、対外発表を進める。
|