研究課題/領域番号 |
19K00593
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分02060:言語学関連
|
研究機関 | 東北大学 |
研究代表者 |
吉本 啓 東北大学, 高度教養教育・学生支援機構, 名誉教授 (50282017)
|
研究分担者 |
森 芳樹 東京大学, 大学院総合文化研究科, 教授 (30306831)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | コーパス / ツリーバンク / 統語論 / 意味論 / 日本語 |
研究成果の概要 |
研究代表者らは,日本語として初めての統語解析情報付きコーパス NINJAL Parsed Corpus of Modern Japanese (NPCMJ) の開発に携わってきた。同コーパスをさらに充実したものとするために,以下の研究を行った。第一に,従属節の主語が明示されない場合の解釈について,節の種類によってそれぞれ実情に合ったディフォールト規則を設定し,主節の項を継承するものとした。第二に,これまで欠落していたテンス情報のアノテーションをダイナミック意味論にもとづいて施した。第三に,正確な意味解析のために,ディフォールトにもとづくスコープ階層を提案した。
|
自由記述の分野 |
コーパス言語学
|
研究成果の学術的意義や社会的意義 |
従来,日本語については形態素情報を中心とするコーパスしか存在せず,日本語文法研究への本格的な利用は難しかった。研究代表者らの構築した統語解析情報付きコーパス NPCMJ により,構文研究へのコーパス利用の道を開くことができた。今回の研究のうち,従属節の非明示的主語およびスコープのディフォールト解釈は,正確な意味分析を行うためのアノテーション作業を効率化することを可能にする。また,言語的なテンス意味をアノテーションとして施すのは日本語として初めての試みであり,言語学のみならず言語処理においても貴重なデータを提供する。
|