研究課題/領域番号 |
19K00593
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分02060:言語学関連
|
研究機関 | 東北大学 |
研究代表者 |
吉本 啓 東北大学, 高度教養教育・学生支援機構, 名誉教授 (50282017)
|
研究分担者 |
森 芳樹 東京大学, 大学院総合文化研究科, 教授 (30306831)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2019年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | コーパス / ツリーバンク / 統語論 / 意味論 / 日本語 / 主語 / 時制 / 否定 / テンス / アスペクト / 主題 / スコープ |
研究開始時の研究の概要 |
研究代表者が開発中の NINJAL Parsed Corpus of Modern Japanese (NPCMJ) は、文の意味を反映する統語構造 (句構造) を付加したコーパスである。これにより、日本語の様々な構文の使用の実態を解明することができる。他方、NPCMJ には、より正確で詳しい文法情報のアノテーションが求められている。本研究では、従属節主語の主節主題・主語からの継承、従属節の時制の解釈、および否定文のスコープと焦点、の3つの課題を取り上げ、NPCMJ の検索を利用して真相に迫る。調査結果にもとづいてこれらの課題に関するアノテーション法を考案し、実際にアノテーションを行う。
|
研究成果の概要 |
研究代表者らは,日本語として初めての統語解析情報付きコーパス NINJAL Parsed Corpus of Modern Japanese (NPCMJ) の開発に携わってきた。同コーパスをさらに充実したものとするために,以下の研究を行った。第一に,従属節の主語が明示されない場合の解釈について,節の種類によってそれぞれ実情に合ったディフォールト規則を設定し,主節の項を継承するものとした。第二に,これまで欠落していたテンス情報のアノテーションをダイナミック意味論にもとづいて施した。第三に,正確な意味解析のために,ディフォールトにもとづくスコープ階層を提案した。
|
研究成果の学術的意義や社会的意義 |
従来,日本語については形態素情報を中心とするコーパスしか存在せず,日本語文法研究への本格的な利用は難しかった。研究代表者らの構築した統語解析情報付きコーパス NPCMJ により,構文研究へのコーパス利用の道を開くことができた。今回の研究のうち,従属節の非明示的主語およびスコープのディフォールト解釈は,正確な意味分析を行うためのアノテーション作業を効率化することを可能にする。また,言語的なテンス意味をアノテーションとして施すのは日本語として初めての試みであり,言語学のみならず言語処理においても貴重なデータを提供する。
|