• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 実績報告書

書き言葉コーパスの自動アノテーションの研究

計画研究

研究領域代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備
研究課題/領域番号 18061005
研究機関奈良先端科学技術大学院大学

研究代表者

松本 裕治  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)

研究分担者 徳永 健伸  東京工業大学, 大学院・情報埋工学研究科, 教授 (20197875)
乾 健太郎  東京工業大学, 情報科学研究科, 准教授 (60272689)
橋田 浩一  独立行政法人産業技術総合研究所, サービス工学研究センター, 次長 (00357766)
橋本 泰一  東京工業大学, 統合研究院, 特任准教授 (10345382)
浅原 正幸  東京工業大学, 情報科学研究科, 助教 (80379528)
キーワードコーパス / 形態素解析 / 統語解析 / 述語項構造解析 / アノテーション / 言語解析 / 照応解析 / 談話解析
研究概要

コーパスに対する自動アノテーションツールの開発 : 日本語係り受け解析をタグ付け作業に利用する際に, 再現率と適合率の関係について調査し, 効率的な利用法の検討を行った. 文節情報のタグ付けについて検討し, 文節まとめ上げのための自動ツールの設計を行った. 述語項構造解析のための手法の事態名詞への拡張を行った. 事象間の時間関係解析のため, 局所的情報と大域的情報の効果的な融合法を提案した.
コーパス管理ツールの開発 : 形態素・係り受け解析済みコーパス管理ツールの再設計を行い, ネットワーク経由での利用が可能になるように拡張した. これまでの機能の再検討を行い, 基本機能をドットネットフレームワーク上で再実装した. 検索履歴を表示する機能の実装を行つた. さらに, 検索結果表示の高速化を達成した. 汎用アノテーションツールについては, 処理の高速化, および, データ構造の設計の詳細化や多重に埋め込まれたタグの記述にも対応可能になるよう格調した.
大規模な固有表現辞書の構築とタグ付きコーパスの開発 : 大規模な固有表現抽出を行ない, また, コアデータの一部に対して, 固有表現タグ付け作業をつた.
談話構造アノテーションツールの開発 : 文関係, 共参照, 項構造を記述するためセマンティックエディタの拡張を行つた. 一般化された木構造表示ユーザインタフェースの実装を継続し, 談話構造や意味構造を編集する機能をこのユーザインタフェースに実装した.

  • 研究成果

    (4件)

すべて 2009 2008

すべて 雑誌論文 (3件) (うち査読あり 2件) 学会発表 (1件)

  • [雑誌論文] 統語情報の付与2009

    • 著者名/発表者名
      松本裕治
    • 雑誌名

      国文学と鑑賞 74

      ページ: 44-52

  • [雑誌論文] 言語処理による作文支援・語彙学習への可能性について2009

    • 著者名/発表者名
      松本裕治, 大山浩美
    • 雑誌名

      日本語教育学会 140

      ページ: 37-47

    • 査読あり
  • [雑誌論文] トーナメントモデルを用いた日本語係り受け解析2008

    • 著者名/発表者名
      岩立将和, 浅原正幸, 松本裕治
    • 雑誌名

      自然言語処理 15

      ページ: 169-185

    • 査読あり
  • [学会発表] Japanese dependency parsing using a tournament model2008

    • 著者名/発表者名
      Masakazu Iwatate, Masaynki Asahara and Yuji Matsumoto
    • 学会等名
      Proceedings of the 22nd International Conference on Computational Linguistics
    • 発表場所
      Manchester, UK
    • 年月日
      2008-08-21

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi