交付申請時の研究計画に従い,次の3テーマを推進した. 1. 統語情報を活用した可変長で不連続性を許したMWE抽出法の精密化:名古屋大学松原研究室で提案されている方法をベースに,可変長で不連続性を許したMWE候補に対する絞り込みを検討した.対象分野ごとに,事前知識を活用したり,語間の共起性を考慮したりするようなヒューリスティクスを導入し,抽出の精度向上を試みた. 2. 階層的MWEリストの試作:九州大学の機関リポジトリを源とした部局別階層的MWEリストや,国内の同程度規模の研究大学で構築された分野別論文データベースを源とした分野別階層的MWEリストを試作した. 3. 関連プログラムの公開:本研究で開発したプログラム群については,UNIX系OSの計算機環境を中心に公開した.
|