• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実績報告書

日本語歴史コーパスに対する統語・意味情報アノテーション

研究課題

研究課題/領域番号 17H00917
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

浅原 正幸  大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (80379528)

研究分担者 服部 隆  上智大学, 文学部, 教授 (10289598)
古宮 嘉那子  東京農工大学, 工学(系)研究科(研究院), 准教授 (10592339)
市村 太郎  京都府立大学, 文学部, 准教授 (10701352)
山崎 誠  大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (30182489)
宮内 佐夜香  中京大学, 文学部, 教授 (30508502)
加藤 祥  目白大学, 外国語学部, 専任講師 (40623004)
池上 尚  埼玉大学, 教育学部, 准教授 (50739125)
近藤 明日子  東京大学, 人文社会系研究科, 助教 (30425722)
研究期間 (年度) 2017-04-01 – 2022-03-31
キーワード分類語彙表 / Universal Dependencies
研究実績の概要

意味情報アノテーションの研究として、文章中の単語や表現を分類語彙表(国立国語研究所が作成した語彙分類体系)の分類番号に対応付ける作業を進めた。2021年度は『日本語歴史コーパス』に対する分類語彙表アノテーションの取りまとめを行った。『今昔物語集』(コア部分)と『国定読本(第2期)』の分類語彙表番号アノテーションを完成させた。同内容は国際会議 LREC-2022 (Language Resources and Evaluation Conference 2022) 併設ワークショップ (2nd Workshop on Language Technologies for Historical and Ancient Languages) へ投稿し、採択された。さらに同ワークショップを通して交流した研究者らと提案した、1st Workshop on Ancient Language Processing (at RANLP 2023) の企画が採択された。
『分類語彙表』に対する反対語情報付与の研究については、国際会議 the 35th Pacific Asia Conference on Language, Information and Computation において発表を行った。
統語情報アノテーションの研究においては、Universal Dependencies における日本語の分かち書きの問題について、the Fifth Workshop on Universal Dependencies (UDW, SyntaxFest 2021) で発表を行った。同内容は論文誌『自然言語処理』に採録された(2023年3月掲載)。

現在までの達成度 (段落)

令和3年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和3年度が最終年度であるため、記入しない。

  • 研究成果

    (8件)

すべて 2023 2022 2021 その他

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (3件) (うち国際学会 3件) 備考 (4件)

  • [雑誌論文] Universal Dependencies for Japanese Based on Long-Unit Words by NINJAL2023

    • 著者名/発表者名
      Omura Mai、Wakasa Aya、Asahara Masayuki
    • 雑誌名

      Journal of Natural Language Processing

      巻: 30 ページ: 4~29

    • DOI

      10.5715/jnlp.30.4

    • 査読あり / オープンアクセス
  • [学会発表] CHJ-WLSP: Annotation of `Word List by Semantic Principles' Labels for the Corpus of Historical Japanese2022

    • 著者名/発表者名
      Masayuki Asahara, Nao Ikegami, Tai Suzuki, Taro Ichimura, Asuko Kondo, Sachi Kato, Makoto Yamazaki
    • 学会等名
      2nd Workshop on Language Technologies for Historical and Ancient Languages
    • 国際学会
  • [学会発表] The Annotation of Antonym Information in the `Word List by Semantic Principles’2021

    • 著者名/発表者名
      Sachi Kato, Masayuki Asahara, Nanami Moriyama, Asami Ogiwara, and Makoto Yamazaki
    • 学会等名
      the 35th Pacific Asia Conference on Language, Information and Computation
    • 国際学会
  • [学会発表] Word delimitation issues in UD Japanese2021

    • 著者名/発表者名
      Mai Omura, Aya Wakasa, and Masayuki Asahara
    • 学会等名
      the Fifth Workshop on Universal Dependencies (UDW, SyntaxFest 2021)
    • 国際学会
  • [備考] wlsp2unidic

    • URL

      https://github.com/masayu-a/WLSP2UniDic

  • [備考] WLSP-antonym

    • URL

      https://github.com/masayu-a/WLSP-antonym

  • [備考] WLSP2UniDic_historical

    • URL

      https://github.com/masayu-a/WLSP2UniDic_historical

  • [備考] BCCWJ-WLSP

    • URL

      https://github.com/masayu-a/BCCWJ-WLSP

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi