Research Abstract |
本研究の目的は,(a)語彙意味論(とくに語彙概念構造)に基づく日本語動詞意味辞書の開発,および(b)語彙意味論に基づく構成的言い換えの計算モデルの構築の2点である.これに従い,本年度は以下のような成果を得た. (1)語彙概念構造(LCS)辞書の仕様作成: 竹内(2004)が作成したLCS辞書(以下TLCS)の設計を全面的に見直し,本研究で開発する動詞意味辞書の記述項目およびその仕様を整理した.具体的には,動詞の統語的・意味的特性を,(a)LCSの意味述語,(b)意味述語によって表現される意味特性,(c)意味特性を検査する統語的振る舞い(検査項目)という3つのレベルで記述する仕様を設計し,以下の作業を通じて意味特性の体系とそれに対応する検査項目を決定し,2本の学術論文(印刷中)にまとめた. (A)本年度の作業対象として日本語基本動詞約4,000語(総語義数約9,000)を選別し,既存の資源から語義,語釈文,例文等の情報を収集したデータベースを作成した. (B)各語義について格パタンおよび格の意味役割の情報を付与しながら,語義を100クラス程度の意味クラスに分類した. (C)得られた意味分類を基礎データとして,動詞意味辞書に記述すべき意味特性および検査項目を整理し,辞書開発作業の仕様を確定した. (2)中規模LCS辞書の開発: 決定した仕様に従い,上記4,000語を対象に統語的振る舞いを検査し,意味特性を付与する作業を行った.その結果,統語的振る舞いの検査方法について,検査のための代表例文の選択方法や検査項目の不備などいくつかの問題点が明らかになった.こうした問題の解決ついては来年度早々に着手し,2006年末には現4,000語規模のLCSの記述を完成させる予定である. (3)意味構成的言い換えモデルの構築: 機能動詞結合,動詞交替(自他,場所格交替など),態の交替,カテゴリ交替を対象として語彙意味論に基づく言い換え計算モデルについて検討した,また,必要な意味関係(派生関係,自他関係,同義関係,対義関係,反義関係など)の辞書の作成を進めた. (4)クラス別言い換えコーパスの作成: 大規模新聞報道記事集合に対して,言い換えクラスごとに言い換え可能な箇所を検索ツール茶器を利用して収集し,言い換えの正解例を作成することを試みた.
|