| 研究課題/領域番号 |
19K13195
|
| 研究種目 |
若手研究
|
| 配分区分 | 基金 |
| 審査区分 |
小区分02060:言語学関連
|
| 研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
大村 舞 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源開発センター, プロジェクト非常勤研究員 (20803563)
|
| 研究期間 (年度) |
2019-04-01 – 2025-03-31
|
| 研究課題ステータス |
完了 (2024年度)
|
| 配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2021年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2019年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
| キーワード | コーパス / 話し言葉 / Universal Dependencies / 述語項構造 / 共参照 / 言語学 / アノテーション / 統語 / 述語項構造 アノテーション |
| 研究開始時の研究の概要 |
本研究では、近年公開された大規模日常会話コーパス『日本語日常会話コーパス(CEJC)』に、述語項構造の情報を付与した『「話し言葉」の述語項構造コーパス』のアノテーションデータを開発及び分析に取り組む。従来、文の意味理解のために「述語項構造」の研究が活発に進められてきたが、これらの研究は主に「書き言葉」が主眼であった。「話し言葉」特有の言語現象を分析するためにも、このCEJCに述語項構造の情報を付与したコーパスは重要である。アノテーションを作成し「話し言葉」の述語項構造コーパスの開発および分析を実現する。
|
| 研究成果の概要 |
本研究では、日本語日常会話コーパスに対して、文の意味情報である述語項構造を付与したアノテーション付きコーパスの作成・自動化付与・分析に取り組んだ。当初は『日本語日常会話コーパス(CEJC)』へのアノテーションを目指していた。しかし、項の省略など話し言葉特有の言語現象により、アノテーションの複雑化が予想されたため、方針転換を行い、項の関係がより明確でシンプルな『日本語日常対話コーパス(JDD)』を用いた段階的な整備に切り替えた。さらに、共参照アノテーションの発展として、会話中の場所に関する表現に着目し、地図情報を含むアノテーションデータを作成した。
|
| 研究成果の学術的意義や社会的意義 |
本研究では、日常会話における省略や曖昧な表現を言語学的な観点で分析するために、会話コーパスに述語とその項(関係語句)の情報を付与する試みをした。これにより、話し言葉に特有の統語や意味の解明が可能となり、自然言語処理における会話特化の自動解析や、会話分析の高度化、音声認識、コーパス利用における教育への応用など、学術的・社会的に広範な貢献が期待される。
|