研究課題/領域番号 |
19011004
|
研究機関 | 慶應義塾大学 |
研究代表者 |
斎藤 博昭 慶應義塾大学, 理工学部, 准教授 (30235064)
|
研究分担者 |
藤井 聖子 東京大学, 総合文化研究科, 准教授 (70165330)
小原 京子 慶應義塾大学, 理工学部, 准教授 (00286650)
|
キーワード | 諸彙資源 / フレーム意味論 / コーパス言語学 / フレームネット / 語彙意味論 / アノテーション |
研究概要 |
本研究の目的は、 1.フレーム意味論とコーパスデータに基づく日本語語彙意味情報資源「日本語フレームネット(JFN)」の理論的・方法論的モデルを構築することと、 2.それにより本特定領域研究が構築する大規模日本語書き言葉コーパス(以下「日本語コーパス」)の評価を行うことである。 本年度は1.に関して、「移動」や「感覚」の意味分野に関する語彙項目の意味分析を行い、「日本語コーパス」や既存の日本語フレームネットコーパスから抽出した例文に対して意味タグ付け作業を行った。これらの作業を通じて、主に以下の三領域に関して研究が進んだ。 1)日本語語彙・文の意味記述に適したタグ集合や分析方法の検討、 2)独自に開発を進めてきた検索ツールJFN kwicを改良し、共起語をさまざまな条件下で検索するだけでなく、品詞を指定しての連語の頻度順検索を可能にした点、 3)アノテーションツールJFNDesktopを改良し、付与されたFrame Element層、Phrase Type層、Grammatical Function層、PostPos層といった4種のタグ間の関係をその出現頻度で一覧する機能を新たに実装することによって、タグ付与の傾向や誤りを容易に検出できるようになった点、である。 2.の「日本語コーパス」の評価に関しては、2007年秋に領域内メンバーに配布された「BCCWJ領域内公開データ(2007年度版)」を対象に意味タグ付け作業を行った。このデータには、各種白書、Yahoo!知恵袋、各種書籍が含まれているが、今年度は書籍データを主に使用した。
|