• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

アノテーション付き大規模通言語コーパスを利用した言語変種についての計量的研究

研究課題

研究課題/領域番号 19K13180
研究種目

若手研究

配分区分基金
審査区分 小区分02060:言語学関連
研究機関九州大学

研究代表者

伊藤 薫  九州大学, 言語文化研究院, 助教 (30769394)

研究期間 (年度) 2019-04-01 – 2023-03-31
研究課題ステータス 完了 (2022年度)
配分額 *注記
3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
2022年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2019年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
キーワードUniversal Dependencies / 言語変種 / コーパス / 言語資源 / ヒューマンインタフェース / 計量研究 / 自然言語処理 / 言語計量 / ジャンル / レジスター / データサイエンス
研究開始時の研究の概要

本研究ではUniversal Dependencies (UD)と呼ばれる多言語に共通した注釈が付与されたコーパス(研究のために集積された言語データ)を用いて、様々な言語変種(社会的状況や時代などで生じる言語の差異)についての研究を行う。UDは本来自然言語処理やAIの開発目的で収集されたため、正確性よりも量が重視されており、必ずしも言語学の研究のために使いやすいデータとは言えない。しかし、その中には比較的信頼性の高い情報も含まれているため、言語変種についての研究を通じて、工学的な目的で作成されたデータを科学研究のために利用する方法について探る。

研究成果の概要

本研究課題の成果として、日本語Universal Dependencies (UD)ツリーバンクのアノテーション(情報付与)に関する考察や提言を行った。加えて、UDツリーバンクをコンピュータ上で読み込むためのツールであるChaKi.NETを改良し、ChaKi.NET liteとして公開した。ツールの改良により、インターフェイスを備えていない言語データの使用に習熟していない言語学者にとっても危機言語のデータを容易にアクセスできるようにした。

研究成果の学術的意義や社会的意義

本研究課題において作成したツールは、危機言語に関するデータ作成も活発なUniversal Dependencies (UD)プロジェクトにおいて生み出される情報へのアクセスを容易にする。UDプロジェクトは元々情報系分野のプロジェクトであり、利用者はプログラミングに精通していることが想定されている。しかし、UDツリーバンクには他の形式では公開されていない危機言語などのデータなども含まれており、本ツール開発により活用の裾野を増やし、言語学分野のデジタル・トランスフォーメーションに貢献した。

報告書

(5件)
  • 2022 実績報告書   研究成果報告書 ( PDF )
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 研究成果

    (5件)

すべて 2023 2022 2021 2020 2019

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (4件) (うち招待講演 1件)

  • [雑誌論文] ChaKi.NET lite の開発2023

    • 著者名/発表者名
      伊藤薫・森田敏生
    • 雑誌名

      国立国語研究所論集

      巻: 25

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [学会発表] ChaKi.NET liteの開発 Universal Dependenciesコーパスの利用を見据えた ChaKi.NETユーザインターフェイスの改良2022

    • 著者名/発表者名
      伊藤薫・ 森田敏生
    • 学会等名
      Evidence-based Linguistics Workshop 2022
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Universal Dependencies における述語並列記述の展望2021

    • 著者名/発表者名
      伊藤 薫
    • 学会等名
      言語処理学会第27回年次大会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] Universal Dependenciesコーパスを利用したレジスター研究の試み2020

    • 著者名/発表者名
      伊藤 薫
    • 学会等名
      言語処理学会第26回年次大会(NLP2020)
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] Universal Dependencies に基づく言語学研究の射程2019

    • 著者名/発表者名
      伊藤 薫
    • 学会等名
      Universal Dependencies シンポジウム
    • 関連する報告書
      2019 実施状況報告書
    • 招待講演

URL: 

公開日: 2019-04-18   更新日: 2024-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi