• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Annual Research Report

統語・意味解析情報タグ付きコーパス開発用アノテーション研究:複文を中心に

Research Project

Project/Area Number 15H03210
Research InstitutionNational Institute for Japanese Language and Linguistics

Principal Investigator

PARDESHI P.V.  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語対照研究系, 教授 (00374984)

Co-Investigator(Kenkyū-buntansha) 岸本 秀樹  神戸大学, 人文学研究科, 教授 (10234220)
野田 尚史  大学共同利用機関法人人間文化研究機構国立国語研究所, 日本語教育研究・情報センター, 教授 (20144545)
吉本 啓  東北大学, 高度教養教育・学生支援機構, 教授 (50282017)
影山 太郎  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論・構造研究系, 所長 (80068288)
Project Period (FY) 2015-04-01 – 2020-03-31
Keywords関係節 / 従属節 / アノテーション / タグ付け作業 / 統語・意味解析
Outline of Annual Research Achievements

本研究は現代日本語の特徴の一つである関係節および従属節を中心とする複文について言語学的情報を検索、抽出するために必要なアノテーション方法を研究し、それに基づいて約5万文(約90万語)に対してタグ付け作業を行い、複文に関するより高度の環境整備を整えることを目標とする。
上記の目標を達成するために、本年度はアノテーション方法を研究する班およびアノテーションを実施する開発班 (東北大ユニット、神戸大ユニット) を組織し、アノテーション方法の研究を開始するとともにアノテーション作業も開始した。関係節および従属文のアノテーション基準についてデータにもとづいて決定した。アノテーション対象とする日本語テクストを新聞記事等から選び、研究補助員を指導してアノテーションを開始した。
統語情報タグ付けの規約として、Annotation Manual for the Penn Historical Corpora and the PCEEC (Santorini 2010) のそれに従う。これはPenn Treebank の解析規約を修正して、ノード数の少ない平坦な統語構造を採用することを特色としている。
意味論的に良質かつ均質な論理意味表示を得ることに配慮した。かたわら、理論的考察およびプログラム開発も行った。今年度は計画通り、約1万文にアノテーションを付与することができた。アノテーションしたデータをネットを通じて公開するために準備作業としてインターフェースの試作版の開発も行った。来年度に一般公開できるように今後改良作業を進める予定である。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

①アノテーション方法を研究する班およびアノテーションを実施する開発班 (東北大ユニット、神戸大ユニット) が予定通り組織することができた。
②公開可能な日本語のテキスト(新聞記事など)を確保することができた。
③アノテーション方法の研究やアノテーション作業を実施すための人材を確保することができた。
④研究成果をネットで一般公開できるためにインターフェースの試作版が完成した。

上記の理由により、本研究は概ね順調に進めることができた。

Strategy for Future Research Activity

今後もアノテーション方法の研究を続けると同時にコーパスの開発も継続し、最終的にアノテーションを完了させる。各文について得られた意味解析を手掛かりとして、アノテーションの評価を行う。また、結果をまとめて国内外の学会発表、論文執筆を通じて研究成果を発信する。また、インターフェース開発を完成させ、研究成果をネットを通じて国内に発信する。

  • Research Products

    (11 results)

All 2016 2015

All Journal Article (8 results) (of which Open Access: 5 results,  Acknowledgement Compliant: 1 results) Presentation (3 results)

  • [Journal Article] 統語・意味解析情報付き日本語コーパスのアノテー ション2016

    • Author(s)
      アラステア・バトラー・吉本啓・岸本秀樹・プラシャント・パルデシ
    • Journal Title

      言語処理学会第22回年次大会発表論文集

      Volume: 22 Pages: 589-592

    • Open Access
  • [Journal Article] 中国語連体修飾節構文の解析2016

    • Author(s)
      周振・Alastair Butler・吉本啓
    • Journal Title

      言語処理学会第22回年次大会発表論文集

      Volume: 22 Pages: 809-812

  • [Journal Article] 中国人日本語学習者のVN型二字漢語動詞の習 得に関する研究: VN型二字漢語動詞の一体性の視点から2015

    • Author(s)
      周振・吉本啓
    • Journal Title

      国際文化研究

      Volume: 21 Pages: 99-112

  • [Journal Article] 統語・意味解析情報付き日本語 コーパスの開発2015

    • Author(s)
      プラシャント・パルデシ・Alastair Butler・吉本啓 ・岸本秀樹
    • Journal Title

      言語処理学会第21回年次大会発表論文集

      Volume: 21 Pages: 20-23

    • Open Access
  • [Journal Article] Large scale semantic represent ation with flame graphs2015

    • Author(s)
      Alastair Butler and Kei Yoshimoto
    • Journal Title

      言語処理学会第21回年次大会発表論文集

      Volume: 21 Pages: 301-304

    • Open Access / Acknowledgement Compliant
  • [Journal Article] Coindexed null elements for a Japanese parsed corpus2015

    • Author(s)
      Alastair Butler, Shota Hiayama and Kei Yoshimoto
    • Journal Title

      言語処理学会第21回年次大会発表論文集

      Volume: 21 Pages: 708-711

    • Open Access
  • [Journal Article] 中国語意味解析コーパス構築のための句レベルのスコープアノテーション -文の構成要素の間のコントロール関係の同定および否定の作用域の制御を中心に-2015

    • Author(s)
      周振・Alastair Butler・吉本啓
    • Journal Title

      言語処理学会第21回年次大会発表論文集

      Volume: 21 Pages: 856-859

    • Open Access
  • [Journal Article] 中国語結果構文の解析2015

    • Author(s)
      周振・Alastair Butler・吉本啓
    • Journal Title

      言語科学会第17回年次国際大会, ハンドブック

      Volume: 17 Pages: 56-59

  • [Presentation] 統語・意味解析情報付き日本語コーパスのアノテーション2016

    • Author(s)
      アラステア・バトラー、 吉本 啓、 岸本 秀樹、 プラシャント・パルデシ
    • Organizer
      言語処理学会 第22回年次大会
    • Place of Presentation
      東北大学
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] 文の統語・意味解析情報をタグ付けした日本語構造体コーパスの開発2015

    • Author(s)
      吉本啓・プラシャント・パルデシ
    • Organizer
      関西言語学会ワークショップ
    • Place of Presentation
      神戸大学
    • Year and Date
      2015-06-13
  • [Presentation] Development of Japanese Corpus Tagged with Syntactic and Semantic In formation2015

    • Author(s)
      Kei Yoshimoto and Alastair Butler
    • Organizer
      The 18th Joint Workshop on Linguistics and Language Processing. Korean Society for Language and Information. Kyung Hee University, Seoul
    • Place of Presentation
      韓国
    • Year and Date
      2015-05-22

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi