• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実施状況報告書

日常対話コーパスにおける述語項構造アノテーションの作成と分析

研究課題

研究課題/領域番号 19K13195
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

大村 舞  大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (20803563)

研究期間 (年度) 2019-04-01 – 2023-03-31
キーワードコーパス / 言語学 / 話し言葉 / 述語項構造 アノテーション
研究実績の概要

本研究では、近年公開された大規模日常会話コーパス『日本語日常会話コーパス(Corpus of Everyday Japanese Conversation, CEJC)』に、文の意味表現のひとつである「述語項構造」の情報を付与した『「話し言葉」の述語項構造コーパス』のアノテーションデータを開発及び分析に取り組んでいる。従来、文の意味理解のために「述語項構造」の研究が活発に進められてきたが、これらの研究は主に「書き言葉」が主眼であった。「話し言葉」特有の言語現象を分析するために、このCEJCに述語項構造の情報を付与したコーパスを付与する方針で作業を進めてきた。
現在、話し言葉に特化した述語項構造解析ソフトウェア及び、話し言葉用の述語項構造データは公開されていない。そのため初年度である平成31, 32年度の間に、話し言葉における述語項としてのアノテーションの仕様を定め、ベースとなる述語項構造解析ソフトウェアの開発に取り組むことにより大規模な話し言葉の述語項構造コーパスを開発する予定であった。
しかしCEJCを分析していくにつれ、話し言葉における述語項構造には想定以上に話し言葉特有の様々な言語現象があることが判明し、既存の枠組みの範疇を超えた枠組みの制定が必要であることが判明した。その結果、具体的にCEJCにアノテーションの仕様を定めるにはテキストについてアノテーションを付与するだけではなく、ビデオ操作をしながらも述語項のアノテーション作業をしてもらう必要がある。そのため、アノテーション仕様を適切に定めた上で、一定時間をかけて作業者の訓練が必要であることがわかった。そのアノテーション付与者の人材確保をしているところである。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

本研究では、近年公開された大規模日常会話コーパス『日本語日常会話コーパス(Corpus of Everyday Japanese Conversation, CEJC)』に、文の意味表現のひとつである「述語項構造」の情報を付与した『「話し言葉」の述語項構造コーパス』のアノテーションデータを開発及び分析に取り組んでいる。従来、文の意味理解のために「述語項構造」の研究が活発に進められてきたが、これらの研究は主に「書き言葉」が主眼であった。「話し言葉」特有の言語現象を分析するために、このCEJCに述語項構造の情報を付与したコーパスを付与する方針で作業を進めてきた。
現在、話し言葉に特化した述語項構造解析ソフトウェア及び、話し言葉用の述語項構造データは公開されていない。そのため初年度である平成31, 32年度の間に、話し言葉における述語項としてのアノテーションの仕様を定め、ベースとなる述語項構造解析ソフトウェアの開発に取り組むことにより大規模な話し言葉の述語項構造コーパスを開発する予定であった。
しかしCEJCを分析していくにつれ、話し言葉における述語項構造には想定以上に話し言葉特有の様々な言語現象があることが判明し、既存の枠組みの範疇を超えた枠組みの制定が必要であることが判明している。その結果、具体的にCEJCにアノテーションの仕様を定めるにはテキストについてアノテーションを付与するだけではなく、ビデオ操作をしながらも述語項のアノテーション作業をしてもらう必要がある。そのため、アノテーション仕様を適切に定めた上で、一定時間をかけて作業者の訓練が必要であることがわかった。現在、人材育成を並行しておこないつつアノテーション作業を行っているところである。

今後の研究の推進方策

2019年度, 2020年度において検討していた工程の一部を今年度に回し、2021年度は、話し言葉における述語項についてアノテーション方針を適切に定めることおよびアノテーションの人材育成に注力している。さらに、述語項のアノテーション作業者の人材確保及びアノテーション訓練を十分に行うものとして、アノテーション方針についてまとめたものを成果物として出すことを検討している。

次年度使用額が生じた理由

旅費として学会発表のための予算を確保していたが、今年度は発表を予定していた学会がオンライン決行となったことから旅費が不要となった。
また当初考えていた人材の確保が困難であったため、人材費および機材を使うことができていない。
次年度も使用額に関しては、最新の研究動向をリサーチするための書籍代や、述語項構造アノテーションを付与する人材への人件費や機材費用、アノテーションの打ち合わせなどの旅費に用いることを検討している。
オンラインでスムーズにやりとりをするための機材確保も検討している。

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi