• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

統語・意味解析情報タグ付きコーパス開発用アノテーション研究:複文を中心に

研究課題

研究課題/領域番号 15H03210
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 言語学
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

PARDESHI P.V.  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, 教授 (00374984)

研究分担者 岸本 秀樹  神戸大学, 人文学研究科, 教授 (10234220)
野田 尚史  大学共同利用機関法人人間文化研究機構国立国語研究所, 日本語教育研究領域, 教授 (20144545)
吉本 啓  東北大学, 高度教養教育・学生支援機構, 教授 (50282017)
窪田 悠介  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, 准教授 (60745149)
長崎 郁  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, プロジェクト非常勤研究員 (70401445)
バトラー アラステア  弘前大学, 人文社会科学部, 准教授 (90588873)
HORN S.W.  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, プロジェクト非常勤研究員 (70801538)
影山 太郎  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, その他 (80068288)
研究期間 (年度) 2015-04-01 – 2020-03-31
研究課題ステータス 完了 (2019年度)
配分額 *注記
16,640千円 (直接経費: 12,800千円、間接経費: 3,840千円)
2019年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2018年度: 3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2017年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2016年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2015年度: 4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
キーワード関係節 / 複文 / アノテーション / 統語・意味解析付きコーパス / コーパス研究 / 従属節 / 統語・意味解析 / アノテーション研究 / 言語学 / コーパス言語学 / タグ付け作業 / 統語・意味解析情報タグ付きコーパス
研究成果の概要

本研究は現代日本語の特徴の一つである関係節および従属節を中心とする複文について言語学的情報を検索、抽出するために必要なアノテーション方法を研究し、それに基づいてタグ付け作業を行い、複文に関するより高度の環境整備を整えることを目標とした。この作業は国立国語研究所の「統語・意味解析コーパスの開発と言語研究」プロジェクトと連携をしながら進め、2020年3月時点で、40,831万文規模のコーパス(560,098語)を検索ツールとともに公開した。

研究成果の学術的意義や社会的意義

本研究の成果として約4万文(56万語)規模の統語・意味解析付きコーパスが開発され、公開された。このコーパスでは現代日本語のテクストに対し文の統語・意味解析情報を付与し、複数な検索ツールが用意されており、多様な日本語の機能語や句構造、節の諸類型および複雑な構文を大量の言語データから検索・抽出して研究に活用することが可能である。また、初心用の検索ツール完備により、大学などで日本語の統語論の教育にも利用できる。さらに、このコーパスでは日英両言語表記で公開されており、日本語表記に精通してない海外の研究者も利用できるので、日本語研究の国際化に貢献できる。

報告書

(6件)
  • 2019 実績報告書   研究成果報告書 ( PDF )
  • 2018 実績報告書
  • 2017 実績報告書
  • 2016 実績報告書
  • 2015 実績報告書
  • 研究成果

    (61件)

すべて 2019 2018 2017 2016 2015 その他

すべて 雑誌論文 (20件) (うち国際共著 5件、 査読あり 7件、 オープンアクセス 10件、 謝辞記載あり 1件) 学会発表 (37件) (うち国際学会 5件) 備考 (2件) 学会・シンポジウム開催 (2件)

  • [雑誌論文] 統語・意味情報付きコーパスの開発に関する研究:中国語名詞句の解析について2019

    • 著者名/発表者名
      周振,吉本啓
    • 雑誌名

      国立国語研究所論集

      巻: 17 ページ: 35-65

    • NAID

      120006707635

    • 関連する報告書
      2019 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Probing the nature of an island constraint with a parsed corpus: A case study on the Coordinate Structure Constraint in Japanese2019

    • 著者名/発表者名
      Yusuke Kubota and Ai Kubota
    • 雑誌名

      Linguistic Issues in Language Technology

      巻: 18-3 ページ: 1-24

    • 関連する報告書
      2019 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Parsed corpus as a source for testing generalizations in Japanese2019

    • 著者名/発表者名
      Hideki Kishimoto and Prashant Pardeshi
    • 雑誌名

      Linguistic Issues in Language Technology

      巻: 18-2 ページ: 1-24

    • 関連する報告書
      2019 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] From discourse to logic with Stanford CoreNLP and Treebank Semantics2019

    • 著者名/発表者名
      Alastair Butler
    • 雑誌名

      the Sixteenth International Workshop of Logic and Engineering of Natural Language Semantics (LENLS 16)

      巻: 16 ページ: 1-4

    • 関連する報告書
      2019 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] NPCMJに対する述語項構造シソーラスの意味役割と概念フレームの付与2019

    • 著者名/発表者名
      竹内孔一,Alastair Butler,長崎郁,Prashant Pardeshi
    • 雑誌名

      研究報告自然言語処理(NL)

      巻: 2019-NL-241 ページ: 1-4

    • 関連する報告書
      2019 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 統語・意味解析情報を伴う日本語コーパスの開発とその日本語教育・学習への応用2018

    • 著者名/発表者名
      吉本啓
    • 雑誌名

      日本言語文藝研究

      巻: 18 ページ: 1-11

    • 関連する報告書
      2018 実績報告書
  • [雑誌論文] Parsed Annotation with Semantic Calculation2018

    • 著者名/発表者名
      Stephen Wright Horn and Alastair Butler
    • 雑誌名

      Proceedings of the 17th International Workshop on Treebanks and Linguistic Theories (TLT)

      巻: 17 ページ: 39-52

    • 関連する報告書
      2018 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] Derived mappings for FrameNet construction from a parsed corpus of Japanese.2018

    • 著者名/発表者名
      Stephen Wright Horn, Alastair Butler, Iku Nagasaki and Kei Yoshimoto
    • 雑誌名

      LREC 2018 Proceedings, International FrameNet Workshop, 11th edition of the Language Resources and Evaluation Conference

      巻: 11 ページ: 28-32

    • 関連する報告書
      2018 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] 前提投射の実例のツリーバンクによる検索2018

    • 著者名/発表者名
      窪田悠介, 峯島宏次
    • 雑誌名

      日本言語学会第157回大会予稿集

      巻: 157 ページ: 282-287

    • 関連する報告書
      2018 実績報告書
  • [雑誌論文] From meaning representations to syntactic trees2016

    • 著者名/発表者名
      Alastair Butler
    • 雑誌名

      Proceedings of the Thirteenth International Workshop of Logic and Engineering of Natural Language Semantics13(LENLS13)

      巻: 13 ページ: 147-160

    • 関連する報告書
      2016 実績報告書
  • [雑誌論文] DynamicPower at SemEval-2016 Task 8: Processing syntactic parse trees with a Dynamic Semantics core2016

    • 著者名/発表者名
      Alastair Butler
    • 雑誌名

      Proceedings of SemEval-2016

      巻: 10 ページ: 1148-1153

    • 関連する報告書
      2016 実績報告書
  • [雑誌論文] Deterministic natural language generation from meaning representations for machine translation2016

    • 著者名/発表者名
      Alastair Butler
    • 雑誌名

      Proceedings of the 2nd Workshop on Semantics-Driven Machine Translation

      巻: 2 ページ: 1-9

    • 関連する報告書
      2016 実績報告書
  • [雑誌論文] 統語・意味解析情報付き日本語コーパスのアノテー ション2016

    • 著者名/発表者名
      アラステア・バトラー・吉本啓・岸本秀樹・プラシャント・パルデシ
    • 雑誌名

      言語処理学会第22回年次大会発表論文集

      巻: 22 ページ: 589-592

    • 関連する報告書
      2015 実績報告書
    • オープンアクセス
  • [雑誌論文] 中国語連体修飾節構文の解析2016

    • 著者名/発表者名
      周振・Alastair Butler・吉本啓
    • 雑誌名

      言語処理学会第22回年次大会発表論文集

      巻: 22 ページ: 809-812

    • 関連する報告書
      2015 実績報告書
  • [雑誌論文] 中国人日本語学習者のVN型二字漢語動詞の習 得に関する研究: VN型二字漢語動詞の一体性の視点から2015

    • 著者名/発表者名
      周振・吉本啓
    • 雑誌名

      国際文化研究

      巻: 21 ページ: 99-112

    • NAID

      120005626290

    • 関連する報告書
      2015 実績報告書
  • [雑誌論文] 統語・意味解析情報付き日本語 コーパスの開発2015

    • 著者名/発表者名
      プラシャント・パルデシ・Alastair Butler・吉本啓 ・岸本秀樹
    • 雑誌名

      言語処理学会第21回年次大会発表論文集

      巻: 21 ページ: 20-23

    • 関連する報告書
      2015 実績報告書
    • オープンアクセス
  • [雑誌論文] Large scale semantic represent ation with flame graphs2015

    • 著者名/発表者名
      Alastair Butler and Kei Yoshimoto
    • 雑誌名

      言語処理学会第21回年次大会発表論文集

      巻: 21 ページ: 301-304

    • 関連する報告書
      2015 実績報告書
    • オープンアクセス / 謝辞記載あり
  • [雑誌論文] Coindexed null elements for a Japanese parsed corpus2015

    • 著者名/発表者名
      Alastair Butler, Shota Hiayama and Kei Yoshimoto
    • 雑誌名

      言語処理学会第21回年次大会発表論文集

      巻: 21 ページ: 708-711

    • 関連する報告書
      2015 実績報告書
    • オープンアクセス
  • [雑誌論文] 中国語意味解析コーパス構築のための句レベルのスコープアノテーション -文の構成要素の間のコントロール関係の同定および否定の作用域の制御を中心に-2015

    • 著者名/発表者名
      周振・Alastair Butler・吉本啓
    • 雑誌名

      言語処理学会第21回年次大会発表論文集

      巻: 21 ページ: 856-859

    • 関連する報告書
      2015 実績報告書
    • オープンアクセス
  • [雑誌論文] 中国語結果構文の解析2015

    • 著者名/発表者名
      周振・Alastair Butler・吉本啓
    • 雑誌名

      言語科学会第17回年次国際大会, ハンドブック

      巻: 17 ページ: 56-59

    • 関連する報告書
      2015 実績報告書
  • [学会発表] 高度文法情報付きコーパスとその日本語研究への応用2019

    • 著者名/発表者名
      プラシャント・パルデシ,吉本啓,窪田悠介,峯島宏次,三好伸芳,井戸美里,大久保弥
    • 学会等名
      関西言語学会第44回大会シンポジウム「高度文法情報付きコーパスとその日本語研究への応用」
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] 前提投射の統語コーパスでの検索2019

    • 著者名/発表者名
      窪田悠介,峯島宏次
    • 学会等名
      関西言語学会第44回大会シンポジウム「高度文法情報付きコーパスとその日本語研究への応用」
    • 関連する報告書
      2019 実績報告書
  • [学会発表] Development of a parsed corpus and its applications to linguistic research and education2019

    • 著者名/発表者名
      Prashant Pardeshi, Kei Yoshimoto, Susanne Miyata, Koichi Takeuchi, and Hideki Kishimoto
    • 学会等名
      言語科学会第21回国際年次大会 (JSLS 2019)
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] Developing a Japanese syntax textbook as part of NPCMJ Project2019

    • 著者名/発表者名
      Hideki Kishimoto
    • 学会等名
      言語科学会第21回国際年次大会 (JSLS 2019)
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] Treebanks and grammatical research: A case study on the Coordinate Structure Constraint in Japanese2019

    • 著者名/発表者名
      Yusuke Kubota
    • 学会等名
      2019 Joint Conference of Linguistic Societies in Korea and the 26th Joint Workshop on Linguistics and Language Processing (JWLLP-26)
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] Parsed annotation with semantic calculation.2018

    • 著者名/発表者名
      Alastair Butler, Stephen Wright Horn.
    • 学会等名
      17th International Workshop on Treebanks and Linguistic Theory, University of Oslo, Norway.
    • 関連する報告書
      2018 実績報告書
    • 国際学会
  • [学会発表] A unified interface for exploring English and Japanese.2018

    • 著者名/発表者名
      Alastair Butler.
    • 学会等名
      日本英語学会第36回大会シンポジウム「ツリーバンク開発と言語理論」, 横浜国立大学
    • 関連する報告書
      2018 実績報告書
  • [学会発表] English/Japanese contrastive study based on normalisation, a step in the semantic processing.2018

    • 著者名/発表者名
      Stephen Wright Horn, Alastair Butler.
    • 学会等名
      日本英語学会第36回大会シンポジウム「ツリーバンク開発と言語理論」, 横浜国立大学.
    • 関連する報告書
      2018 実績報告書
  • [学会発表] 言語研究と統語・意味解析情報付きコーパス2018

    • 著者名/発表者名
      吉本啓
    • 学会等名
      日本英語学会第36回大会シンポジウム「ツリーバンク開発と言語理論」, 横浜国立大学.
    • 関連する報告書
      2018 実績報告書
  • [学会発表] 構文検索ツールNPCMJ Explorer」2018

    • 著者名/発表者名
      鈴木彩香, 窪田悠介, プラシャント・パルデシ.
    • 学会等名
      日本英語学会第36回大会シンポジウム『ツリーバンク開発と言語理論』, 横浜国立大学
    • 関連する報告書
      2018 実績報告書
  • [学会発表] reebank meets descriptive grammar: The NPCMJ Explorer.2018

    • 著者名/発表者名
      Ayaka Suzuki, Yusuke Kubota, Prashant Pardeshi
    • 学会等名
      Grammar and Corpora 2018, University of Paris-Diderot
    • 関連する報告書
      2018 実績報告書
  • [学会発表] 中国語存現文の解析2018

    • 著者名/発表者名
      周振, アラステア・バトラー, 吉本啓
    • 学会等名
      言語科学会第20回国際年次大会, 文京学院大学
    • 関連する報告書
      2018 実績報告書
  • [学会発表] 統語コーパスと言語研究 ー構文検索ツールNPCMJ Explorerからの視点ー2018

    • 著者名/発表者名
      鈴木彩香, 窪田悠介, プラシャント・パルデシ
    • 学会等名
      Morphology and Lexicon Forum 2018, 筑波大学
    • 関連する報告書
      2018 実績報告書
  • [学会発表] The lexical semantics of control: A view from Japanese.2018

    • 著者名/発表者名
      Yusuke Kubota
    • 学会等名
      Workshop on the clause structure of Japanese and Korean (The 25th International Conference on Head-Driven Phrase Structure Grammar), University of Tokyo.
    • 関連する報告書
      2018 実績報告書
  • [学会発表] Using treebanks for linguistic research.2018

    • 著者名/発表者名
      Yusuke Kubota
    • 学会等名
      he English Linguistic Society of Japan 11th International Spring Forum, Hokkaido University.
    • 関連する報告書
      2018 実績報告書
  • [学会発表] Reconsidering the Coordinate Structure Constraint once again: Corpus-based evidence2018

    • 著者名/発表者名
      Yusuke Kubota
    • 学会等名
      Conceptual and Methodological Alternatives in Theoretical Linguistics
    • 関連する報告書
      2017 実績報告書
  • [学会発表] 統語解析情報付きコーパス検索用インタフェースの開発2018

    • 著者名/発表者名
      アラステア・バトラー, 長崎郁, スティーブン・ライト・ホーン, プラシャント・パルデシ, 吉本啓
    • 学会等名
      言語処理学会第24回年次大会
    • 関連する報告書
      2017 実績報告書
  • [学会発表] Seeding lexical semantics: resources using parsed corpora2017

    • 著者名/発表者名
      Alastair Butler, Stephen Wright Horn, Iku Nagasaki
    • 学会等名
      NINJAL International Symposium "Exploiting Parsed Corpora: Apllication in Research, Pedagogy and Processing"
    • 関連する報告書
      2017 実績報告書
  • [学会発表] Parsed corpus as a source for testing generalizations in Japanese syntax.2017

    • 著者名/発表者名
      Hideki Kishimoto, Prashant Pardeshi
    • 学会等名
      NINJAL International Symposium "Exploiting Parsed Corpora: Apllication in Research, Pedagogy and Processing"
    • 関連する報告書
      2017 実績報告書
  • [学会発表] A case study on the Coordinate Structure Constraint in Japanese2017

    • 著者名/発表者名
      Yusuke Kubota, Ai Kubota
    • 学会等名
      NINJAL International Symposium "Exploiting Parsed Corpora: Apllication in Research, Pedagogy and Processing"
    • 関連する報告書
      2017 実績報告書
  • [学会発表] Exploiting coreferential information in NPCMJ for L2 reading of Japanese texts2017

    • 著者名/発表者名
      Kei Yoshimoto, Akiko Takahashi
    • 学会等名
      NINJAL International Symposium "Exploiting Parsed Corpora: Apllication in Research, Pedagogy and Processing"
    • 関連する報告書
      2017 実績報告書
  • [学会発表] Treebank Semantics parsed corpus series2017

    • 著者名/発表者名
      Alastair Butler, Stephen Wright Horn
    • 学会等名
      NINJAL International Symposium "Exploiting Parsed Corpora: Apllication in Research, Pedagogy and Processing"
    • 関連する報告書
      2017 実績報告書
  • [学会発表] 「ツリーバンク検索への「UNIX 的」アプローチ」2017

    • 著者名/発表者名
      窪田悠介
    • 学会等名
      国語研究所言語資源活用ワークショップ
    • 関連する報告書
      2017 実績報告書
  • [学会発表] 統語・意味解析情報付き日本語コーパスのアノテーション2016

    • 著者名/発表者名
      アラステア・バトラー、 吉本 啓、 岸本 秀樹、 プラシャント・パルデシ
    • 学会等名
      言語処理学会 第22回年次大会
    • 発表場所
      東北大学
    • 年月日
      2016-03-07
    • 関連する報告書
      2015 実績報告書
  • [学会発表] Treebank annotation of FraCaS and JSeM2016

    • 著者名/発表者名
      Alastair Butler, Ai Kubota, Shota Hiyama and Kei Yoshimoto
    • 学会等名
      Logic and Engineering of Natural Language Semantics (LENLS 13)
    • 関連する報告書
      2016 実績報告書
  • [学会発表] From meaning representations to syntactic trees2016

    • 著者名/発表者名
      Alastair Butler
    • 学会等名
      Logic and Engineering of Natural Language Semantics (LENLS 13)
    • 関連する報告書
      2016 実績報告書
  • [学会発表] Deterministic natural language generation from meaning representations for machine translation2016

    • 著者名/発表者名
      Alastair Butler
    • 学会等名
      2nd Workshop on Semantics-Driven Machine Translation
    • 関連する報告書
      2016 実績報告書
  • [学会発表] ワークショップ「イントロダクション」統語・意味解析情報付き日本語コーパスの構築に向けて2016

    • 著者名/発表者名
      プラシャント・バルデシ
    • 学会等名
      日本言語学会第153回大会
    • 関連する報告書
      2016 実績報告書
  • [学会発表] ワークショップ「まとめと将来の展望」統語・意味解析情報付き日本語コーパスの構築に向けて2016

    • 著者名/発表者名
      プラシャント・バルデシ
    • 学会等名
      日本言語学会第153回大会
    • 関連する報告書
      2016 実績報告書
  • [学会発表] ワークショップ「アノテーション方式とコーパスの特色」統語・意味解析情報付き日本語コーパスの構築に向けて2016

    • 著者名/発表者名
      吉本啓
    • 学会等名
      日本言語学会第153回大会
    • 関連する報告書
      2016 実績報告書
  • [学会発表] ワークショップ「デモンストレーション」統語・意味解析情報付き日本語コーパスの構築に向けて2016

    • 著者名/発表者名
      アラステア・バトラー、窪田愛、窪田悠介
    • 学会等名
      日本言語学会第153回大会
    • 関連する報告書
      2016 実績報告書
  • [学会発表] Parsed Corpus Semantics2016

    • 著者名/発表者名
      Alastair Butler
    • 学会等名
      New Landscapes in Theoretical Computational Linguistics
    • 関連する報告書
      2016 実績報告書
  • [学会発表] A parsed corpus of Japanese enriched to reach levels of semantic analysis2016

    • 著者名/発表者名
      Alastair Butler, Shiro Akasegawa, Prashant Pardeshi and Kei Yoshimoto
    • 学会等名
      Brandeis University, Boston, USA Colloquium
    • 関連する報告書
      2016 実績報告書
  • [学会発表] 形式意味論と計算言語学の最近の動向2016

    • 著者名/発表者名
      窪田悠介
    • 学会等名
      第13回東海意味論研究会
    • 関連する報告書
      2016 実績報告書
  • [学会発表] 統語・意味解析情報を伴う日本語コーパスの開発とその日本語教育・学習への応用2016

    • 著者名/発表者名
      吉本啓
    • 学会等名
      台湾日本語言文藝研究学会第15回定例学会
    • 関連する報告書
      2016 実績報告書
  • [学会発表] 文の統語・意味解析情報をタグ付けした日本語構造体コーパスの開発2015

    • 著者名/発表者名
      吉本啓・プラシャント・パルデシ
    • 学会等名
      関西言語学会ワークショップ
    • 発表場所
      神戸大学
    • 年月日
      2015-06-13
    • 関連する報告書
      2015 実績報告書
  • [学会発表] Development of Japanese Corpus Tagged with Syntactic and Semantic In formation2015

    • 著者名/発表者名
      Kei Yoshimoto and Alastair Butler
    • 学会等名
      The 18th Joint Workshop on Linguistics and Language Processing. Korean Society for Language and Information. Kyung Hee University, Seoul
    • 発表場所
      韓国
    • 年月日
      2015-05-22
    • 関連する報告書
      2015 実績報告書
  • [備考] NPCMJ(NINJAL Parsed Corpus of Modern Japanese)

    • URL

      http://npcmj.ninjal.ac.jp/

    • 関連する報告書
      2019 実績報告書 2018 実績報告書
  • [備考] NPCMJ Explorer

    • URL

      http://npcmj.ninjal.ac.jp/explorer/

    • 関連する報告書
      2019 実績報告書 2018 実績報告書
  • [学会・シンポジウム開催] “Development of a parsed corpus and its applications to linguistic research and education”2019

    • 関連する報告書
      2019 実績報告書
  • [学会・シンポジウム開催] Unshared Task on Theory and System analysis with FraCaS, MultiFraCaS and JSeM Test Suites2016

    • 関連する報告書
      2016 実績報告書

URL: 

公開日: 2015-04-16   更新日: 2022-11-04  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi