• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

書き言葉コーパスの自動アノテーションの研究

計画研究

研究領域代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備
研究課題/領域番号 18061005
研究機関奈良先端科学技術大学院大学

研究代表者

松本 裕治  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)

研究分担者 徳永 健伸  東京工業大学, 大学院・情報理工学研究科, 教授 (20197875)
乾 健太郎  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (60272689)
橋田 浩一  独立行政法人産業技術総合研究所, サービス工学研究センター, 次長 (00357766)
橋本 泰一  東京工業大学, 統合研究院, 特任准教授 (10345382)
浅原 正幸  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80379528)
キーワードコーパス / 形態素解析 / 統語解析 / 述語項構造解析 / アノテーション / 言語解析 / 照応解析 / 談話解析
研究概要

コーパス管理ツール「茶器」のデータベース仕様を見直し,NETフレームワーク上での再構築を行った.統語解析における並列構造のアノテーション仕様について検討し,並列構造の範囲に関するアノテーションと係り受け構造を表示し,修正を行うことができるTreeEditインタフェースを完成させた.述語項構造解析と事象間の時間関係解析に全域的な情報を利用することで精度向上を実現した.また,照応解析について,先行詞候補に制限を与えることで精度を犠牲にせずに効率改善が可能であることを示した.
汎用アノテーションツールSLATの機能を拡張し,Ver.2.0の基本設計と一部の実装を完了した.旧版に比べ,アノテーション工程の管理まで視野に入れてデータベース・スキーマを再設計し,また,クライアントの処理の大幅な高速化をはかった.
さまざまな書式のコーパスデータに対して統合的なアクセスを可能にするためのアーキテクチャを設計し,これを単一の種類のコーパスデータに関して実装することにより一般に多様なデータを統合するための準備を行なった.
20年度作成した拡張固有表現コーパス(白書,書籍,Yahoo!知恵袋)に対して,タグ付けの見直しを行い,さらに新聞(380文書),雑誌(79文書)に対してタグ付けを行った.また,20年度に作成したコーパスを用いて,機械学習アルゴリズムの一つであるCRFをベースに固有表現認識ツールを開発した.評価実験を行ったところ,精度は約80%,再現率約46%,F値約60%という結果を得た.

  • 研究成果

    (15件)

すべて 2010 2009 その他

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (11件) 備考 (1件)

  • [雑誌論文] バイパス付きアラ牙ンメントグラフを用いた日本語並列句検出と範囲同定2010

    • 著者名/発表者名
      大熊秀治, 原一夫, 新保仁, 松本裕治
    • 雑誌名

      人工知能学会論文誌 25

      ページ: 206-214

    • 査読あり
  • [雑誌論文] 述語語義と意味役割の結合学習のための構造予測モデル2010

    • 著者名/発表者名
      渡邉陽太郎, 浅原正幸E 松本裕治
    • 雑誌名

      人工知能学会論文誌 25

      ページ: 252-261

    • 査読あり
  • [雑誌論文] Markov Logicを利用した時間的順序関係の同時推論2009

    • 著者名/発表者名
      吉川克正, リーデルセバスチャン, 浅原正幸, 松本裕治
    • 雑誌名

      人工知能学会論文誌 24

      ページ: 521-530

    • 査読あり
  • [学会発表] 半環に基づく前向き後ろ向きアルゴリズムの一般化2010

    • 著者名/発表者名
      東藍, 新保仁, 松本裕治
    • 学会等名
      人工知能学会データマイニングと統計数理研究会資料,SIG-DMSM-A903
    • 発表場所
      東京都立川市
    • 年月日
      2010-03-30
  • [学会発表] 拡張固有表現タグ付きコーパスの構築-白書,書籍,Yahoo!知恵袋コァデーター2010

    • 著者名/発表者名
      橋本泰一, 中村俊一
    • 学会等名
      言語処理学会第16回年次大会
    • 発表場所
      東京都文京区
    • 年月日
      2010-03-11
  • [学会発表] 述語語義と意味役割の結合学習のための構造予測モデル2010

    • 著者名/発表者名
      渡邉陽太郎, 浅原正幸, 松本裕治
    • 学会等名
      言語処理学会第16回年次大会
    • 発表場所
      東京都文京区
    • 年月日
      2010-03-11
  • [学会発表] Aspects of Language Resource Management : Creation and Utilisation2010

    • 著者名/発表者名
      Tokunaga Takenobu
    • 学会等名
      2nd FLaReNet Forum
    • 発表場所
      Barcelona, Spain
    • 年月日
      2010-02-11
  • [学会発表] WG2 PW124617-6 : SemAF-Discourse Relations.2010

    • 著者名/発表者名
      Koiti Hasida
    • 学会等名
      ISO/TC37/WG Meeting
    • 発表場所
      Cyty University Hong Kong
    • 年月日
      2010-01-16
  • [学会発表] A Generalization of Forward-backward Algorithm2009

    • 著者名/発表者名
      Ai Azuma, Yuji Matsumoto
    • 学会等名
      In Proceedings of the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases(ECML/PKDD)
    • 発表場所
      B1ed, Slovenia
    • 年月日
      2009-09-08
  • [学会発表] Capturing Salience with a Trainable Cache Model for Zero-anaphora Resolution2009

    • 著者名/発表者名
      Ryu Iida, Kentaro Inui, Yuji Matsumoto
    • 学会等名
      In Proceedings of the Joint Conference of the 47th Annual Meeting of the Association for Computational Linguistics and the 4^<th> International Joint Conference on Natural Language Processing(ACL-IJCNLP 2009)
    • 発表場所
      Singapore
    • 年月日
      2009-08-04
  • [学会発表] Bypassed Alignment Graph for Learning Coordination in Japanese Sentences2009

    • 著者名/発表者名
      Hideharu Okuma, Kazuo Hara, Masashi Shimbo, Yuji Matsumoto
    • 学会等名
      In Proceedings of the Joint Conference of the 47th Annual Meeting of the Association for Computational Linguistics and the 4^<th> International Joint Conference on Natural Language Processing (ACL-IJCNLP 2009)
    • 発表場所
      Singapore
    • 年月日
      2009-08-04
  • [学会発表] Jointly Identifying Temporal Relations with Markov Logic Matsumoto2009

    • 著者名/発表者名
      Katsumasa Yoshikawa, Sebastian Riedel, Masayuki Asahara, Yuji Matsumoto
    • 学会等名
      In Proceedings of the Joint Conference of the 47th Annual Meeting of the Association for Computational Linguistics and the 4^<th> International Joint Conference on Natural Language Processing (ACL-IJCNLP 2009)
    • 発表場所
      Singapore
    • 年月日
      2009-08-03
  • [学会発表] オンライン最大マージン学習アルゴリズムに基づく多言語依存構造-述語項構造解析2009

    • 著者名/発表者名
      渡邉陽太郎, 浅原正幸, 松本裕治
    • 学会等名
      情報処理学会研究報告,自然言語処理研究会,2009-NL-192,No.2
    • 発表場所
      北海道北見市
    • 年月日
      2009-07-22
  • [学会発表] Multilingual Syntactic-Semantic Dependency Parsing with Three-Stage Approximate Max-Margin Linear Models2009

    • 著者名/発表者名
      Yotaro Watanabe, Masayuki Asahara, Yuji Matsumoto
    • 学会等名
      In Proceedings of the Thirteenth Conference on Computational NaturalLanguage Learning (CoNLL)
    • 発表場所
      Boulder, CO, USA
    • 年月日
      2009-06-04
  • [備考]

    • URL

      http://sourceforge.jp/projects/chaki/

URL: 

公開日: 2011-06-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi