• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

統語・意味解析情報タグ付きコーパス開発用アノテーション研究:複文を中心に

研究課題

研究課題/領域番号 15H03210
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

PARDESHI P.V.  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, 教授 (00374984)

研究分担者 岸本 秀樹  神戸大学, 人文学研究科, 教授 (10234220)
野田 尚史  大学共同利用機関法人人間文化研究機構国立国語研究所, 日本語教育研究領域, 教授 (20144545)
吉本 啓  東北大学, 高度教養教育・学生支援機構, 教授 (50282017)
影山 太郎  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, その他 (80068288)
バトラー アラステア  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・対照研究領域, 研究員 (90588873)
研究期間 (年度) 2015-04-01 – 2020-03-31
キーワード関係節 / 従属節 / アノテーション / 統語・意味解析
研究実績の概要

本研究は現代日本語の特徴の一つである関係節および従属節を中心とする複文について言語学的情報を検索、抽出するために必要なアノテーション方法を研究し、それに基づいて約5万文(約90万語)に対してタグ付け作業を行い、複文に関するより高度の環境整備を整えることを目標とする。この作業は国立国語研究所の「統語・意味解析コーパスの開発と言語研究」プロジェクトと連携をしながら進め、以下の成果があった。
① コーパス構築:1万文規模のコーパスの公開(国立国語研究所のウェブサイトを通じて、http://npcmj.ninjal.ac.jp/)
②研究発表:本課題の共同研究者が以下の研究会で研究成果の一部を発表した:(a)論文執筆3件(Proceedings of the Thirteenth International Workshop of Logic and Engineering of Natural Language Semantics13(LENLS13), Proceedings of SemEval-2016, Proceedings of the 2nd Workshop on Semantics-Driven Machine Translation)(b)口頭発表12件(Logic and Engineering of Natural Language Semantics (LENLS 13)にて2件、2nd Workshop on Semantics-Driven Machine Translationで1件、日本言語学会第153回大会で4件、New Landscapes in Theoretical Computational Linguisticsで1件、A parsed corpus of Japanese enriched to reach levels of semantic analysisで1件、第13回東海意味論研究会で1件、台湾日本語言文藝研究学会第15回定例学会で1件)、国際ワークショップ:Unshared Task on Theory and System analysis with FraCaS, MultiFraCaS and JSeM Test Suitesで1件.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

① 昨年度の引き続き、アノテーション方法を研究する研究班が関係節を含む従属分のアノテーション基準についてデータに基づいて研究を進め、基準を決定した。また、アノテーションを施す日本語のテキスト(新聞記事)を選定した。
② アノテーションを実施する開発班では研究補助員を指導してアノテーションを実施した。
③研究成果をネットで一般公開するためにインターフェースの試作版を内部公開し、共同研究者から修正・改良についてご意見をいただいた。これに基づき来年度はさらに改良を加えインターフェースを一般公開する予定である。

今後の研究の推進方策

本研究が開始していてから2年たち、アノテーション方法は徐々に固まりつつあり、また、アノテーションを施す実施体制も確立している。しかし、今後も、アノテーション方法の研究を続けると同時にコーパス開発も継続する。各文について得られた意味解析を手掛かりとして、アノテーションの評価を行い、アノテーション方法を改良する。残りの期間ではデータの量を増やし、また、検索のしやすさを実現するために内部公開中のインターフェースに文字列検索などの機能を追加し、ネットを通じて国内外に向けて発信する。加えて、アノテーション方法やインターフェース開発に関する成果を国内外の学会発表、論文執筆を通じて発信する。

  • 研究成果

    (15件)

すべて 2016

すべて 雑誌論文 (3件) 学会発表 (11件) 学会・シンポジウム開催 (1件)

  • [雑誌論文] From meaning representations to syntactic trees2016

    • 著者名/発表者名
      Alastair Butler
    • 雑誌名

      Proceedings of the Thirteenth International Workshop of Logic and Engineering of Natural Language Semantics13(LENLS13)

      巻: 13 ページ: 147-160

  • [雑誌論文] DynamicPower at SemEval-2016 Task 8: Processing syntactic parse trees with a Dynamic Semantics core2016

    • 著者名/発表者名
      Alastair Butler
    • 雑誌名

      Proceedings of SemEval-2016

      巻: 10 ページ: 1148-1153

  • [雑誌論文] Deterministic natural language generation from meaning representations for machine translation2016

    • 著者名/発表者名
      Alastair Butler
    • 雑誌名

      Proceedings of the 2nd Workshop on Semantics-Driven Machine Translation

      巻: 2 ページ: 1-9

  • [学会発表] Treebank annotation of FraCaS and JSeM2016

    • 著者名/発表者名
      Alastair Butler, Ai Kubota, Shota Hiyama and Kei Yoshimoto
    • 学会等名
      Logic and Engineering of Natural Language Semantics (LENLS 13)
  • [学会発表] From meaning representations to syntactic trees2016

    • 著者名/発表者名
      Alastair Butler
    • 学会等名
      Logic and Engineering of Natural Language Semantics (LENLS 13)
  • [学会発表] Deterministic natural language generation from meaning representations for machine translation2016

    • 著者名/発表者名
      Alastair Butler
    • 学会等名
      2nd Workshop on Semantics-Driven Machine Translation
  • [学会発表] ワークショップ「イントロダクション」統語・意味解析情報付き日本語コーパスの構築に向けて2016

    • 著者名/発表者名
      プラシャント・バルデシ
    • 学会等名
      日本言語学会第153回大会
  • [学会発表] ワークショップ「まとめと将来の展望」統語・意味解析情報付き日本語コーパスの構築に向けて2016

    • 著者名/発表者名
      プラシャント・バルデシ
    • 学会等名
      日本言語学会第153回大会
  • [学会発表] ワークショップ「アノテーション方式とコーパスの特色」統語・意味解析情報付き日本語コーパスの構築に向けて2016

    • 著者名/発表者名
      吉本啓
    • 学会等名
      日本言語学会第153回大会
  • [学会発表] ワークショップ「デモンストレーション」統語・意味解析情報付き日本語コーパスの構築に向けて2016

    • 著者名/発表者名
      アラステア・バトラー、窪田愛、窪田悠介
    • 学会等名
      日本言語学会第153回大会
  • [学会発表] Parsed Corpus Semantics2016

    • 著者名/発表者名
      Alastair Butler
    • 学会等名
      New Landscapes in Theoretical Computational Linguistics
  • [学会発表] A parsed corpus of Japanese enriched to reach levels of semantic analysis2016

    • 著者名/発表者名
      Alastair Butler, Shiro Akasegawa, Prashant Pardeshi and Kei Yoshimoto
    • 学会等名
      Brandeis University, Boston, USA Colloquium
  • [学会発表] 形式意味論と計算言語学の最近の動向2016

    • 著者名/発表者名
      窪田悠介
    • 学会等名
      第13回東海意味論研究会
  • [学会発表] 統語・意味解析情報を伴う日本語コーパスの開発とその日本語教育・学習への応用2016

    • 著者名/発表者名
      吉本啓
    • 学会等名
      台湾日本語言文藝研究学会第15回定例学会
  • [学会・シンポジウム開催] Unshared Task on Theory and System analysis with FraCaS, MultiFraCaS and JSeM Test Suites2016

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi