• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Development of an open science promotion environment focusing on annotation of Japanese corpora

Research Project

Project/Area Number 20K20411
Project/Area Number (Other) 19H05477 (2019)
Research Category

Grant-in-Aid for Challenging Research (Pioneering)

Allocation TypeMulti-year Fund (2020)
Single-year Grants (2019)
Review Section Medium-sized Section 2:Literature, linguistics, and related fields
Research InstitutionNational Institute for Japanese Language and Linguistics

Principal Investigator

Ogiso Toshinobu  大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (20337489)

Co-Investigator(Kenkyū-buntansha) 河内 昭浩  群馬大学, 教育学部, 准教授 (10625172)
橋本 雄太  国立歴史民俗博物館, 大学共同利用機関等の部局等, 准教授 (10802712)
永崎 研宣  一般財団法人人文情報学研究所, 人文情報学研究部門, 主席研究員 (30343429)
鴻野 知暁  東京大学, 大学院人文社会系研究科(文学部), 助教 (30751515)
海野 圭介  国文学研究資料館, 研究部, 教授 (80346155)
後藤 真  国立歴史民俗博物館, 大学共同利用機関等の部局等, 准教授 (90507138)
Project Period (FY) 2019-06-28 – 2023-03-31
Project Status Completed (Fiscal Year 2022)
Budget Amount *help
¥25,740,000 (Direct Cost: ¥19,800,000、Indirect Cost: ¥5,940,000)
Fiscal Year 2021: ¥7,020,000 (Direct Cost: ¥5,400,000、Indirect Cost: ¥1,620,000)
Fiscal Year 2020: ¥9,750,000 (Direct Cost: ¥7,500,000、Indirect Cost: ¥2,250,000)
Fiscal Year 2019: ¥8,970,000 (Direct Cost: ¥6,900,000、Indirect Cost: ¥2,070,000)
Keywordsコーパス / アノテーション / 形態論情報 / 日本語歴史コーパス / オープンデータ / 言語資源 / 日本語学 / クラウドソーシング / 人文情報 / オープンサイエンス / データ共有 / 人文情報学
Outline of Research at the Start

本研究は、国立国語研究所のコーパス検索システム「中納言」に、新たに利用者が新たな情報を任意の場所に付加するアノテーション機能を追加し、付加した情報を他のユーザーと共有することができるシステムを構築することである。本システムを用いることで、「中納言」にログインしたユーザーが、コーパスへのアノテーションという形でこうしたデータを共有・公開し、再利用できる環境を作る。この環境の構築とアノテーションの実践により、コーパスにもとづく研究データの公開とコーパス利用者間での共有を促し、書き言葉テキストを中心としたオープンサイエンスの基盤とすることを目指す。

Outline of Final Research Achievements

In this research project, we have developed a general-purpose annotation sharing environment for corpora. As an example of application of this shared environment, we implemented an error correction reporting function for the morphological information of the "Corpus of Historical Japanese" in the public corpus search system "Chunagon". We nicknamed this reporting function "Minnagon" and began operating the collection of correction report by corpus users in FY2022. With this, the crowdsourced corpus correction environment is now ready, and the "Corpus of Historical Japanese" was updated by reflecting the morphological information correction reports collected by February 2023. We have decided to continue to operate the corpus under a joint research project of the National Institute for Japanese Language and Linguistics (NINJAL), and to periodically revise the corpus.

Academic Significance and Societal Importance of the Research Achievements

日本語研究の分野では研究に欠くことのできないインフラとして機能しつつあるコーパス検索アプリケーション「中納言」に、ユーザーが新たな情報を任意の場所に付加するアノテーション機能を追加し、情報を他のユーザーと共有して活用することができるシステムを構築した。その応用例として形態論情報の誤り修正報告機能(愛称「みんなごん」)を実装し、実際にこれを運用してクラウドソースによる『日本語歴史コーパス』の修正・更新を実現した。構築された共同研究環境は、テキストを中心とするオープンサイエンスを実現する基盤であり、ユーザーによるコーパス修正は今後の学術の方向性を示す先進的な事例として価値を持つものである。

Report

(5 results)
  • 2022 Annual Research Report   Final Research Report ( PDF )
  • 2021 Research-status Report
  • 2020 Research-status Report
  • 2019 Annual Research Report
  • Research Products

    (18 results)

All 2022 2021 2020 2019 Other

All Journal Article (1 results) (of which Open Access: 1 results) Presentation (14 results) (of which Int'l Joint Research: 2 results,  Invited: 3 results) Remarks (3 results)

  • [Journal Article] 『日本語歴史コーパス』の誤り修正プラットフォームの開発2021

    • Author(s)
      小木曽 智信 , 八木 豊
    • Journal Title

      じんもんこん2021論文集

      Volume: (2021) Pages: 206-211

    • NAID

      170000186280

    • Related Report
      2021 Research-status Report
    • Open Access
  • [Presentation] 『日本語歴史コーパス』の活用-語彙表を用いた集計と分析-2022

    • Author(s)
      小木曽智信・竹内綾乃
    • Organizer
      日本語学会2022年度春季大会
    • Related Report
      2022 Annual Research Report
  • [Presentation] みんなで直す『日本語歴史コーパス』-中納言+みんなごん-2022

    • Author(s)
      小木曽智信・竹内綾乃・松崎安子
    • Organizer
      日本語学会2022年度秋季大会
    • Related Report
      2022 Annual Research Report
  • [Presentation] 『日本語歴史コーパス』ver.2023.3通時コーパス拡張進捗報告2022

    • Author(s)
      小木曽智信
    • Organizer
      「通時コーパス」シンポジウム2023
    • Related Report
      2022 Annual Research Report
  • [Presentation] 『日本語歴史コーパス』の新しい語彙表とその応用例2021

    • Author(s)
      小木曽智信
    • Organizer
      日本語学会2021年度秋季大会
    • Related Report
      2021 Research-status Report
  • [Presentation] A Brief Introduction to the Corpus of Historical Japanese Edo period series (Panel: Studies of Early Modern Japanese Based on the Corpus of Historical Japanese)2021

    • Author(s)
      Toshinobu Ogiso
    • Organizer
      EAJS2021: 16th International Conference of the European Association of Japanese Studies
    • Related Report
      2021 Research-status Report
    • Int'l Joint Research
  • [Presentation] 近現代雑誌通時コーパスの語彙統計情報の公開2021

    • Author(s)
      近藤 明日子,相田 太一,小木曽 智信
    • Organizer
      言語処理学会第28回年次大会(NLP2022)
    • Related Report
      2021 Research-status Report
  • [Presentation] 『日本語歴史コーパス』の誤り修正プラットフォームの開発2021

    • Author(s)
      小木曽 智信,八木 豊
    • Organizer
      じんもんこん2021
    • Related Report
      2021 Research-status Report
  • [Presentation] 『日本語歴史コーパス』ver.2021.3 通時コーパス構築進捗報告2021

    • Author(s)
      小木曽智信
    • Organizer
      「通時コーパス」シンポジウム2021
    • Related Report
      2020 Research-status Report
  • [Presentation] 『日本語歴史コーパス』ver.2020.3 通時コーパス構築進捗報告2020

    • Author(s)
      小木曽智信
    • Organizer
      「通時コーパスシンポジウム」2020オンライン
    • Related Report
      2020 Research-status Report
  • [Presentation] 『日本語歴史コーパス奈良時代編Ⅰ万葉集』から『オックスフォード・NINJAL 上代日本語コーパス』『万葉集校本データベース』へのリンクについて2020

    • Author(s)
      小木曽智信
    • Organizer
      「通時コーパスシンポジウム」2020オンライン
    • Related Report
      2020 Research-status Report
  • [Presentation] 「昭和・平成書き言葉コーパス」の構築と活用に向けて2020

    • Author(s)
      小木曽智信
    • Organizer
      研究発表会 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」
    • Related Report
      2020 Research-status Report
  • [Presentation] 国立国語研究所の言語資源とオープンデータ・オープンサイエンス2019

    • Author(s)
      小木曽智信
    • Organizer
      第1回 SPARC Japan セミナー
    • Related Report
      2019 Annual Research Report
    • Invited
  • [Presentation] 大規模研究資源の構築・整備の評価:国語研のコーパス を例に2019

    • Author(s)
      小木曽智信
    • Organizer
      Wiley Research Seminar Japan 2019
    • Related Report
      2019 Annual Research Report
    • Int'l Joint Research / Invited
  • [Presentation] オープンサイエンスとしてのコーパス日本語学の可能性2019

    • Author(s)
      小木曽智信
    • Organizer
      名古屋大学大学院人文学研究科日本語学分野公開講演会
    • Related Report
      2019 Annual Research Report
    • Invited
  • [Remarks] 『日本語歴史コーパス』平安時代編Ⅰ仮名文学ver.1.3

    • URL

      https://clrd.ninjal.ac.jp/chj/heian.html#kanabungaku

    • Related Report
      2022 Annual Research Report
  • [Remarks] 「みんなごん」(オープンサイエンス推進環境[外記」形態論情報の修正機能)

    • URL

      https://chunagon.ninjal.ac.jp/osr/def/1/annotation

    • Related Report
      2022 Annual Research Report
  • [Remarks] 『日本語歴史コーパス』

    • URL

      https://ccd.ninjal.ac.jp/chj/

    • Related Report
      2020 Research-status Report

URL: 

Published: 2019-07-04   Modified: 2024-03-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi