研究分担者 |
服部 隆 上智大学, 文学部, 教授 (10289598)
古宮 嘉那子 東京農工大学, 工学(系)研究科(研究院), 准教授 (10592339)
市村 太郎 京都府立大学, 文学部, 准教授 (10701352)
山崎 誠 大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (30182489)
宮内 佐夜香 中京大学, 文学部, 教授 (30508502)
加藤 祥 目白大学, 外国語学部, 専任講師 (40623004)
池上 尚 埼玉大学, 教育学部, 准教授 (50739125)
近藤 明日子 東京大学, 人文社会系研究科, 助教 (30425722)
|
研究実績の概要 |
意味情報アノテーションの研究として、文章中の単語や表現を分類語彙表(国立国語研究所が作成した語彙分類体系)の分類番号に対応付ける作業を進めた。2021年度は『日本語歴史コーパス』に対する分類語彙表アノテーションの取りまとめを行った。『今昔物語集』(コア部分)と『国定読本(第2期)』の分類語彙表番号アノテーションを完成させた。同内容は国際会議 LREC-2022 (Language Resources and Evaluation Conference 2022) 併設ワークショップ (2nd Workshop on Language Technologies for Historical and Ancient Languages) へ投稿し、採択された。さらに同ワークショップを通して交流した研究者らと提案した、1st Workshop on Ancient Language Processing (at RANLP 2023) の企画が採択された。 『分類語彙表』に対する反対語情報付与の研究については、国際会議 the 35th Pacific Asia Conference on Language, Information and Computation において発表を行った。 統語情報アノテーションの研究においては、Universal Dependencies における日本語の分かち書きの問題について、the Fifth Workshop on Universal Dependencies (UDW, SyntaxFest 2021) で発表を行った。同内容は論文誌『自然言語処理』に採録された(2023年3月掲載)。
|