研究課題/領域番号 |
18K18519
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
浅原 正幸 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, 准教授 (80379528)
|
研究分担者 |
加藤 祥 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (40623004)
|
研究期間 (年度) |
2018-06-29 – 2021-03-31
|
キーワード | 比喩 / コーパス / アノテーション / 日本語 |
研究実績の概要 |
『現代日本語書き言葉均衡コーパス』(BCCWJ)の書籍・新聞・雑誌サンプルに対して、指標比喩の情報を付与した。具体的には、次の作業を行った。中村(1977) の比喩指標要素を電子化し、『分類語彙表』の分類番号を付与することにより、比喩指標パターンファイルを構築した。別途構築した分類語彙表の分類番号が付与された BCCWJ と対照したうえで、比喩表現候補を抽出した。比喩表現候補に対して、比喩か否かを人手により選別するとともに、比喩であった場合には、「喩辞」「被喩辞」「類型」「種別」などの情報を付与した。さらに、得られた比喩表現に対して、クラウドソーシングを用いて、「1. 何かを他の物事でたとえる(比喩)表現を含むか」「2. 新しい表現を使っていると思うか」「3. わかりやすく表現されているか」「4. 人でないものを人に見たてているか」「5. 具体的なものに見たてて説明しているか」の5種類の情報について、0~5 の6段階評価のデータを構築した。結果、100万語規模のコーパスを母集団とした、約800件からなる指標比喩データベースを構築することができた。 同様にBCCWJの新聞サンプルに対して、結合比喩の情報付与を行った。書籍・雑誌サンプルについても結合比喩の情報付与の準備についても進めた。 また、指標比喩に関しては、日本認知言語学会第19回大会にてポスター発表を行った。さらに、2019年度の国際会議 International Cognitive Linguistics Conference-15 に2件比喩データベース構築関連の発表申込を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
指標比喩(直喩)に関しては目標としていたデータベースの構築ができ、当初の計画以上に進展していると考える。一方、結合比喩(隠喩の一種)については、着手したばかりでやや遅れている。
|
今後の研究の推進方策 |
2019年度は、指標比喩と結合比喩に関する発表を International Cognitive Linguistics Conference-15 にて、それぞれ1件ずつ発表する。 引き続き、結合比喩データの整備を進める。
|
次年度使用額が生じた理由 |
実作業者の作業量が見込よりも進まなかったため。次年度使用額は、作業者を増員したり、クラウドソーシングの費用として用いる。
|