• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 研究成果報告書

統語・意味解析情報タグ付きコーパス開発用アノテーション研究:複文を中心に

研究課題

  • PDF
研究課題/領域番号 15H03210
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 言語学
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

PARDESHI P.V.  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, 教授 (00374984)

研究分担者 岸本 秀樹  神戸大学, 人文学研究科, 教授 (10234220)
野田 尚史  大学共同利用機関法人人間文化研究機構国立国語研究所, 日本語教育研究領域, 教授 (20144545)
吉本 啓  東北大学, 高度教養教育・学生支援機構, 教授 (50282017)
窪田 悠介  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, 准教授 (60745149)
長崎 郁  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, プロジェクト非常勤研究員 (70401445)
バトラー アラステア  弘前大学, 人文社会科学部, 准教授 (90588873)
HORN S.W.  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, プロジェクト非常勤研究員 (70801538)
影山 太郎  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, その他 (80068288)
研究期間 (年度) 2015-04-01 – 2020-03-31
キーワード関係節 / 複文 / アノテーション / 統語・意味解析付きコーパス / コーパス研究
研究成果の概要

本研究は現代日本語の特徴の一つである関係節および従属節を中心とする複文について言語学的情報を検索、抽出するために必要なアノテーション方法を研究し、それに基づいてタグ付け作業を行い、複文に関するより高度の環境整備を整えることを目標とした。この作業は国立国語研究所の「統語・意味解析コーパスの開発と言語研究」プロジェクトと連携をしながら進め、2020年3月時点で、40,831万文規模のコーパス(560,098語)を検索ツールとともに公開した。

自由記述の分野

コーパス言語学

研究成果の学術的意義や社会的意義

本研究の成果として約4万文(56万語)規模の統語・意味解析付きコーパスが開発され、公開された。このコーパスでは現代日本語のテクストに対し文の統語・意味解析情報を付与し、複数な検索ツールが用意されており、多様な日本語の機能語や句構造、節の諸類型および複雑な構文を大量の言語データから検索・抽出して研究に活用することが可能である。また、初心用の検索ツール完備により、大学などで日本語の統語論の教育にも利用できる。さらに、このコーパスでは日英両言語表記で公開されており、日本語表記に精通してない海外の研究者も利用できるので、日本語研究の国際化に貢献できる。

URL: 

公開日: 2021-02-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi