• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2000 年度 実績報告書

大規模構文木付きコーパスの作成とその保守・管理システムに関する研究

研究課題

研究課題/領域番号 12480082
研究機関東京工業大学

研究代表者

徳永 健伸  東京工業大学, 大学院・情報理工学研究科, 助教授 (20197875)

研究分担者 白井 清昭  東京工業大学, 大学院・情報理工学研究科, 助手 (30302970)
田中 穂積  東京工業大学, 大学院・情報理工学研究科, 教授 (80163567)
キーワード構文木付きコーパス / コーパス作成支援 / 自然言語処理 / 構文解析
研究概要

本年度は以下の3点について研究をおこなった.
1.例文に付与する構文木のベースとなる文法の構築
例文に構文木を付与する前に,構文木のベースとなる文法を構築する.研究終了後には構文木付きコーパスを公開することを考慮し,多くの人が利用できるような汎用性のある文法を記述する.また,言語学的な知識も積極的に取り入れる.
2.構文木の自動付与
1.で作成した文法をもとに例文を構文解析し,自動的に構文木を付与する.構文解析の結果(構文木)が一意に決まらない場合は,ヒューリスティクスを用いて,なるべく正しい構文木を選択するようにする.
3.構文木修正ツールの開発
自動付与した構文木の誤りを修正するツールを試作する.人間が誤りの箇所を見つけやすいように構文木をグラフィカルに表示し,マウス操作で構文木を修正できるようなツールを設計する.また,作業者が誤って構文木を修正してしまう場合もあるので,修正の履歴を保持し,必要なら修正前の構文木を復元できるようにする.また,作業者がコメントを残す手段も提供する.

URL: 

公開日: 2002-04-03   更新日: 2013-12-05  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi