• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

文脈化単語埋め込みによる1億語規模の比喩表現実態調査

研究課題

研究課題/領域番号 22K18483
研究種目

挑戦的研究(萌芽)

配分区分基金
審査区分 中区分2:文学、言語学およびその関連分野
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

浅原 正幸  大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (80379528)

研究分担者 加藤 祥  目白大学, 外国語学部, 専任講師 (40623004)
研究期間 (年度) 2022-06-30 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
6,500千円 (直接経費: 5,000千円、間接経費: 1,500千円)
2024年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2023年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
キーワードコーパス / 比喩 / 比喩表現
研究開始時の研究の概要

本研究では、文学・言語学研究に資する比喩表現データベースを1億語規模の均衡コーパスに基づいて整備する。深層学習による言語モデル BERT により構成される文脈化単語埋め込みという技術を用いて、単語・文をベクトル空間上に写像する。その空間上に、既存の比喩表現データを写像することで、その近傍に比喩表現クラスタを発見的に探索する。本手法により、指標比喩(いわゆる直喩)だけでなく、結合に意味の転換がみられる結合比喩(いわゆる隠喩)についても抽出できる。収集された比喩表現について、「一般の方がどのように比喩を捉えているか」についてアンケート調査を行い、比喩表現の生産過程と受容過程の実態を明らかにする。

研究実績の概要

2023年度は、自動解析のための訓練データの構築のために『現代日本語書き言葉均衡コーパス』に対する結合比喩・文脈比喩のアノテーション作業を進め、30万語規模のアノテーションデータが完成した。このデータに基づく比喩情報の自動解析手法として、系列ラベリング技術に関する調査を行った。また、そのための基礎資料として、1億語規模の分類語彙表番号自動付与データの整備を進めた。
『比喩表現の理論と分類』データの電子化に関する論文1件(国立国語研究所論集)と、『現代日本語書き言葉均衡コーパス』に対する指標比喩アノテーションデータの分析に関する論文1件(日本認知科学会論文誌『認知科学』)を発表した。
2024年3月18日に京都大学で開催された日本語用論学会メタファー研究会「メタファーとコーパス」において、「日本語比喩表現コーパス(BCCWJ-Metaphor)の構築と一般日本語話者の有する比喩性の印象」というタイトルで、比喩コーパス構築の現況について報告した。
また、比喩表現の自動解析技術として、分布意味論に関する研究動向を調査し、これらの内容は、1件の講演会(東京外国語大学国際日本学研究院 NINJAL ユニット講演会)と1件の入門セミナー(立命館大学)にて発表した。
言語処理学会第30回年次大会(NLP2024)にて「日本語言語資源の構築と利用性の向上」を共同企画した。その中でレトリックに関する発表セッションを企画するとともに、2件の比喩表現言語資源に関する発表を行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

指標比喩に関する発表について積極的に発表することができた。
さらに結合比喩、文脈比喩について自動処理用のデータを完成させることができた。

今後の研究の推進方策

2024年度は深層学習を用いた比喩情報自動付与モデルの構築を進める。当初の目標通り1億語規模の比喩情報付与データの構築を進める。

報告書

(2件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 研究成果

    (5件)

すべて 2024 2023 2022

すべて 雑誌論文 (2件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (3件) (うち招待講演 1件)

  • [雑誌論文] 同一性否定の分類に基づく比喩の標識となる表現の整理2024

    • 著者名/発表者名
      加藤 祥、浅原 正幸
    • 雑誌名

      認知科学

      巻: 31 号: 1 ページ: 58-72

    • DOI

      10.11225/cs.2023.062

    • ISSN
      1341-7924, 1881-5995
    • 年月日
      2024-03-01
    • 関連する報告書
      2023 実施状況報告書
  • [雑誌論文] 『比喩表現の理論と分類』データの電子化および情報付与2023

    • 著者名/発表者名
      加藤 祥、浅原 正幸
    • 雑誌名

      国立国語研究所論集

      巻: 25 ページ: 1-19

    • DOI

      10.15084/0002000009

    • ISSN
      2186-1358
    • URL

      https://repository.ninjal.ac.jp/records/2000009

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] 日本語比喩表現コーパス(BCCWJ-Metaphor)の構築と一般日本語話者の有する比喩性の印象2023

    • 著者名/発表者名
      加藤 祥、菊地 礼、浅原 正幸
    • 学会等名
      日本語用論学会 メタファー研究会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 分類語彙表と比喩情報2023

    • 著者名/発表者名
      加藤祥
    • 学会等名
      第17回 NINJALフォーラム 「語彙資源の構築と活用」
    • 関連する報告書
      2022 実施状況報告書
    • 招待講演
  • [学会発表] 『分類語彙表』関連データベース2022

    • 著者名/発表者名
      浅原正幸
    • 学会等名
      第44回NINJALチュートリアル
    • 関連する報告書
      2022 実施状況報告書

URL: 

公開日: 2022-07-05   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi