• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 自己評価報告書

書き言葉コーパスの自動アノテーションの研究

計画研究

  • PDF
研究領域代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備
研究課題/領域番号 18061005
研究種目

特定領域研究

配分区分補助金
審査区分 人文・社会系
研究機関奈良先端科学技術大学院大学

研究代表者

松本 裕治  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)

研究期間 (年度) 2006 – 2010
キーワード自然言語処理 / 言語学 / 機械学習 / コーパス / アノテーション
研究概要

言語学から言語処理研究にいたる様々な基礎・応用分野に役立つコーパスへのタグ付けを行うための支援環境を構築する.形態素,構文,意味,文脈情報等の様々なレベルのタグ付けを対象とし,
(1)タグ付けの自動化と,
(2)コーパスへタグ付けを行う際の効率や精度を管理・維持するための支援環境の構築という2つの次元から問題を整理する.前者については,単語分かち書き,品詞付与,文節や固有表現の解析,係り受け解析等の構文解析,用言および体言に対する項構造解析,照応解析等の指示対象の解析,文書構造や談話構造解析など,さまざまな言語情報についてのタグ設計およびタグ付け基準の設定を行う.異なるレベルの整合性を保ちつつ記述するための統合的なタグ付け方式の設計を行う.後者については,設計されたタグ方式に従ってコーパスを作成しつつ,タグ付きコーパスからの機械学習に基づいてタグ付けの自動化を行う言語解析システムの構築と、タグ付きコーパスを管理し,利用するための支援ツールの設計と開発を行う.

  • 研究成果

    (9件)

すべて 2008 2007 その他

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (2件) 備考 (4件)

  • [雑誌論文] トーナメントモデルを用いた日本語係り受け解析2008

    • 著者名/発表者名
      岩立将和, 浅原正幸, 松本裕治
    • 雑誌名

      自然言語処理 Vol.15, No.5

      ページ: 169-185

    • 査読あり
  • [雑誌論文] Asian language resources: the state-of-the-art.2008

    • 著者名/発表者名
      Takenobu Tokunaga, Chu-Ren Huang, Yat Mei Lee
    • 雑誌名

      Language Resources and Evaluation Vol.42. No.2

      ページ: 109-116

    • 査読あり
  • [雑誌論文] 関係データベースを用いた構文木付きコーパス検索手法2007

    • 著者名/発表者名
      橋本泰一, 吉田恭祐, 野口正樹, 徳永健伸, 田中穂積
    • 雑誌名

      自然言語処理 Vol.14. No.4

      ページ: 3-22

    • 査読あり
  • [学会発表] Japanese dependency parsing using a tournament model2008

    • 著者名/発表者名
      Masakazu Iwatate, Masayuki Asahara, Yuji Matsumoto
    • 学会等名
      Proceedings of the 22nd International Conference on Computational Linguistics
    • 発表場所
      Manchester
    • 年月日
      2008-08-21
  • [学会発表] Adapting International Standard for Asian Language Technologies.2008

    • 著者名/発表者名
      Tokunaga Takenobu, Dain Kaplan, Chu-Ren Huang, Shu-Kai Hsieh, Nicoletta Calzolari, Monica Monachini, Claudia Soria, Kiyoaki Shirai, et al.
    • 学会等名
      Proceedings of the Sixth International Language Resources and Evaluation
    • 発表場所
      Marrakech, Morocco
    • 年月日
      2008-05-29
  • [備考] 岩立将和, 浅原正幸, 松本裕治, 言語処理学会第14回年次大会優秀発表賞,「トーナメントモデルを用いた日本語係り受け解析」2008年3月

  • [備考] 松本裕治, 2007年度日本OSS貢献者賞,「日本語形態素解析システム「茶筌(ChaSen)」の開発をはじめとしたOSSへの貢献」2007年10月

  • [備考] 飯田龍, 情報処理学会平成19年度山下記念研究賞,「NAIST テキストコーパス:述語項構造と共参照関係のアノテーション」2007年8月

  • [備考] 飯田龍, 小町守, 乾健太郎, 松本裕治,言語処理学会第13回年次大会優秀発表賞,「日本語書き言葉を対象とした述語項構造と共参照関係のアノテーション:NAISTテキストコーパス開発の経験から」2007年3月

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi