2000 Fiscal Year Annual Research Report
大規模構文木付きコーパスの作成とその保守・管理システムに関する研究
Project/Area Number |
12480082
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
徳永 健伸 東京工業大学, 大学院・情報理工学研究科, 助教授 (20197875)
|
Co-Investigator(Kenkyū-buntansha) |
白井 清昭 東京工業大学, 大学院・情報理工学研究科, 助手 (30302970)
田中 穂積 東京工業大学, 大学院・情報理工学研究科, 教授 (80163567)
|
Keywords | 構文木付きコーパス / コーパス作成支援 / 自然言語処理 / 構文解析 |
Research Abstract |
本年度は以下の3点について研究をおこなった. 1.例文に付与する構文木のベースとなる文法の構築 例文に構文木を付与する前に,構文木のベースとなる文法を構築する.研究終了後には構文木付きコーパスを公開することを考慮し,多くの人が利用できるような汎用性のある文法を記述する.また,言語学的な知識も積極的に取り入れる. 2.構文木の自動付与 1.で作成した文法をもとに例文を構文解析し,自動的に構文木を付与する.構文解析の結果(構文木)が一意に決まらない場合は,ヒューリスティクスを用いて,なるべく正しい構文木を選択するようにする. 3.構文木修正ツールの開発 自動付与した構文木の誤りを修正するツールを試作する.人間が誤りの箇所を見つけやすいように構文木をグラフィカルに表示し,マウス操作で構文木を修正できるようなツールを設計する.また,作業者が誤って構文木を修正してしまう場合もあるので,修正の履歴を保持し,必要なら修正前の構文木を復元できるようにする.また,作業者がコメントを残す手段も提供する.
|