研究概要 |
日本語および英語の品詞タグ付けや係り受け解析を行う言語処理ツールを開発するとともに,それの解析結果と辞書を連携して格納し,管理と検索を行うためのシステムの実装を行った.本年はダグ付きコーパスと辞書の連携管理を行う機能の設計と実装,および係り受け解析結果の検索機能の実装を重点的に行った.具体的に作成した機能は次の通りである. 1.品詞タグ付けコーパスと辞書を関係データベースに格納し,品詞タグ付けコーパスを辞書項目へのポインタ列として実装する機能. 2.単語列検索機能:格納されたテキストを任意の単語列を,単語がもつ任意の属性(出現形,読み,発音,階層構造付きの品詞,活用型,活用形)を部分的に指定して検索する機能.前年度に実装したこの検索機能を新しいデータベースに対応するように修正した. 3.単語検索結果の前後の文脈中に現れる他単語との統計的共起尺度を計算する機能. 4.係り受け解析されたコーパスを関係データベースに格納する機能. 5.任意の係り受け構造を指定して,それにマッチする部分構造を持つ文を網羅的に検索する機能. これらの機能の洗い出しやデータベースの設計,検索手法や統計的共起情報の計算法を議論するため,年度内に奈良,東京,大阪で合計8回の全体会合をもった.また,記述的な問題については,奈良先端大のメンバーで週に1回の内部会合を開いて,詳細を議論した. 上記機能を実装したシステムを第2版として年度明けに公開する予定である.
|