• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実施状況報告書

高度な統語・意味解析情報を持つコーパスの開発とその応用

研究課題

研究課題/領域番号 16K02654
研究機関東北大学

研究代表者

吉本 啓  東北大学, 高度教養教育・学生支援機構, 教授 (50282017)

研究分担者 森 芳樹  東京大学, 大学院総合文化研究科, 教授 (30306831)
小林 昌博  鳥取大学, 教育支援・国際交流推進機構, 准教授 (50361150)
研究期間 (年度) 2016-04-01 – 2019-03-31
キーワードコーパス / 統語論 / 意味論
研究実績の概要

科学研究費基盤研究(C)「高度な統語・意味解析情報を持つコーパスの開発とその応用」では、日本語テキストに正確な統辞・意味解析情報を付加した日本語コーパスの構築法を研究し、また実際にそれにもとづいてコーパス開発を行うことを目標としている。平成29年度の研究では、引き続きこれまでに開発したアノテーション法にもとづいて現実の大量テクストに対し統辞・意味解析情報を付与した。この作業は研究補助員が担当した。
またこの作業を通じて、アノテーション法の改良および研究補助員をまじえたチームによる共同開発を適切に行うために必要な規則の客観化および明確化を検討した。今回は特に、(1) 品詞タグ体系を抜本的に改善 (助詞 P への機能タグ付与による細分化等) し、(2) 従属節種類ごとに、コントロールが行われる条件を明確化し、(3) 「に」「の」「と」のコピュラ助動詞としての用法を明確に規定し、さらに (4) 曖昧性を持つ語形について、それらを見分けるためのノウハウを明文化した。
また、多人数のチームによる共同作業を可能にするために規則やノウハウをこれまでにまとめて作成したマニュアルの改良を行った。マニュアルの主要な改善点としては、(1) 格助詞「に」「を」の必須文法役割および任意文法役割表示の区別を明確にし、(2) 日本語のいわゆる「外の関係」の関係節が使用される条件を明確にし、(3) 様々に異なるコントロールが行われる条件をそれぞれ簡素化して平易に説明し、(4) 多様な量化表現を単純な構文スキーマに還元してアノテーションをより簡単にし、また (5) 1語で複数の文法機能を持つ曖昧な語を対象として、簡単に区別するための基準を明確化した。
さらに、コーパスを利用した日本語学習者支援システムを開発し、評価実験を行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

統語・意味情報付きコーパス開発の一部として、本年度も約1万文にアノテーションを施し、国語研ウェブサイトより追加公開を行った。その際、アノテーションの一貫性と基準の明確化について検討をあわせ行った。特に、品詞タグ改良の問題について、国立国語研究所のバトラー、ホーン両研究員と意見を交換しながら改良を進めた。また、アノテーション作業の効率化のために、マニュアルの改訂をさらに進めた。また、コーパスを利用した日本語学習者支援システムを開発し、評価実験を行った。

今後の研究の推進方策

これまでのコーパスのアノテーションを通じて明らかになった諸問題を整理し、アノテーション方式の一層の洗練のためにフィード・バックさせる。
基礎となる形態素解析に問題が多いので、抜本的な解決を図る。
また、開発したコーパスの、日本語教育教材や脳認知科学実験基礎データとしての応用について検討を進める。

次年度使用額が生じた理由

年度末に人件費支払いに当てたが、人件費 (労働保険料を含む) が正確にいくらになるか事前に知ることは困難であったため、次年度使用額が生じた。残金は物品費等として有効に使用する予定である。

  • 研究成果

    (4件)

すべて 2018 2017

すべて 雑誌論文 (3件) 学会発表 (1件) (うち国際学会 1件)

  • [雑誌論文] 統語解析情報付きコーパス検索用インタフェースの開発2018

    • 著者名/発表者名
      長崎郁・アラステア-バトラー・スティーブン-ライト-ホーン・プラシャント-パルデシ・吉本啓
    • 雑誌名

      言語処理学会第24回年次大会発表論文集

      巻: 24 ページ: 1123-1126

  • [雑誌論文] 日本語複合的機能語中の名詞の「名詞性」について2017

    • 著者名/発表者名
      吉本啓
    • 雑誌名

      日本英語学会 Conference Handbook

      巻: 35 ページ: 267-272

  • [雑誌論文] イントロダクション2017

    • 著者名/発表者名
      吉本啓
    • 雑誌名

      日本語文法学会第18回大会発表予稿集

      巻: 18 ページ: 113-121

  • [学会発表] Exploiting coreferential information in NPCMJ for L2 reading of Japanese texts2017

    • 著者名/発表者名
      Kei Yoshimoto and Akiko Takahashi
    • 学会等名
      NINJAL International Symposium `Exploiting Parsed Corpora: Applications in Research, Pedagogy, and Processing
    • 国際学会

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi