2013 Fiscal Year Annual Research Report
RubyとMSXMLによる日本語名詞述語文の実例調査とコーパス分析ツールの構築
Project/Area Number |
23720225
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
今田 水穂 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクトPDフェロー (10579056)
|
Keywords | 名詞述語文 / アノテーション |
Research Abstract |
前年度後半以降、京都大学テキストコーパスから抽出した名詞述語文に対して複数の作業者による人手の意味情報付与を行ってきたが、最終年度は作成したコーパスとツールの公開に向けた仕様の修正、自動処理過程の再構築(工程の分割と簡素化)および人手データの再修正と補完を行った。この結果、コーパスに含まれる66186タグ単位(言語情報を付与するための単位)に対して概念辞書(日本語WordNetとSUMO)を使用した自動処理による語義付与を実施し、49539タグ単位に実際に語義を付与した。また、名詞述語文の主語と述語に相当する1431対のタグ単位を自動処理により抽出し、これらの全てに対して人手により意味関係情報を付与した。研究成果の一部は日本言語学会第146回大会(2013.6)と第4回コーパス日本語学ワークショップ(2013.9)で発表した。最終的な報告は国立国語研究所論集第8号に投稿予定であり、併せて成果物をウェブ上で公開する。
|