• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実績報告書

日本語コーパスに対する情報付与を核としたオープンサイエンス推進環境の構築

研究課題

研究課題/領域番号 19H05477
配分区分補助金
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

小木曽 智信  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (20337489)

研究分担者 河内 昭浩  群馬大学, 教育学部, 准教授 (10625172)
橋本 雄太  国立歴史民俗博物館, 大学共同利用機関等の部局等, 助教 (10802712)
永崎 研宣  一般財団法人人文情報学研究所, 人文情報学研究部門, 主席研究員 (30343429)
鴻野 知暁  東京大学, 大学院人文社会系研究科(文学部), 助教 (30751515)
海野 圭介  国文学研究資料館, 研究部, 教授 (80346155)
後藤 真  国立歴史民俗博物館, 大学共同利用機関等の部局等, 准教授 (90507138)
研究期間 (年度) 2019-06-28 – 2022-03-31
キーワードアノテーション / コーパス / オープンデータ / 言語資源 / 日本語学 / 人文情報学
研究実績の概要

本年度は、国立国語研究所のコーパス検索システム「中納言」にユーザーによるアノテーション機能を付与する前提となる機能として、ユーザーグループを設定する機能の拡張や、多重の形態論情報に対応したパーマリンク(コーパス上の特定の語を一意に指し示すアドレス)の機能の実装を行った。さらに、コーパスの形態論情報をもとに、個々の語に対するアノテーションを行うためのユーザーインターフェイスの開発を行い、「中納言」の検索結果にアノテーション情報を重ねて表示できるようにした。さらに、これらの機能を実装した新しい「中納言」を新規購入したサーバーにセットアップし、アノテーションの試行環境を整えた。
これにより、今後、複数の語(グループ)や語・グループ間の関連付け等のより複雑なアノテーションを行えるようにしていくための基礎が整った。現時点では試験用の環境として非公開としているが、サーバーの運用を開始した。
このほか、本プロジェクトの構想を含む、言語資源とオープンデータ・オープンサイエンスに関する研究発表を3件行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

当初の予定通り、コーパス検索システム「中納言」に、個別の語へのアノテーション機能を追加し、サーバー上に試行環境を用意することができた。これにより、複数の語(グループ)や語・グループ間の関連付け等のアノテーションの基礎が整った。
ただし、新型コロナウイルスによる影響で、研究発表を予定していた学会が中止となったため研究成果がやや乏しいものとなったほか、研究ミーティングについては予定通りに行うことができなかった。

今後の研究の推進方策

今年度開発した基本機能をもとに、複数の語(グループ)や語・グループ間の関連付け等のより高度なアノテーション機能を開発するとともに、これらの機能を活用して実際にアノテーションを行なって、データを作成するとともに機能について開発にフィードバックする。また、個別の語に対するアノテーション機能を応用し、形態論情報付与の誤りの報告機能の実装を行う。

  • 研究成果

    (3件)

すべて 2019

すべて 学会発表 (3件) (うち国際学会 1件、 招待講演 3件)

  • [学会発表] 国立国語研究所の言語資源とオープンデータ・オープンサイエンス2019

    • 著者名/発表者名
      小木曽智信
    • 学会等名
      第1回 SPARC Japan セミナー
    • 招待講演
  • [学会発表] 大規模研究資源の構築・整備の評価:国語研のコーパス を例に2019

    • 著者名/発表者名
      小木曽智信
    • 学会等名
      Wiley Research Seminar Japan 2019
    • 国際学会 / 招待講演
  • [学会発表] オープンサイエンスとしてのコーパス日本語学の可能性2019

    • 著者名/発表者名
      小木曽智信
    • 学会等名
      名古屋大学大学院人文学研究科日本語学分野公開講演会
    • 招待講演

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi