• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

学術論文における被引用文献の貢献度測定:文献の新たな評価法を目指して

研究課題

研究課題/領域番号 23K18506
研究種目

挑戦的研究(萌芽)

配分区分基金
審査区分 中区分62:応用情報学およびその関連分野
研究機関名古屋大学

研究代表者

松原 茂樹  名古屋大学, 情報基盤センター, 教授 (20303589)

研究分担者 加藤 芳秀  名古屋大学, 情報連携推進本部, 准教授 (20362220)
中村 剛士  中部大学, 工学部, 教授 (90303693)
研究期間 (年度) 2023-06-30 – 2026-03-31
研究課題ステータス 交付 (2024年度)
配分額 *注記
6,500千円 (直接経費: 5,000千円、間接経費: 1,500千円)
2025年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2024年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2023年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
キーワード学術論文 / 研究データ / 被引用文献 / 自動評価 / テキスト解析
研究開始時の研究の概要

文献の被引用回数は、学術における影響力を示す代表的な指標である。しかし、その影響を適切に評価するには、ある論文で引用された文献が、その論文の産出にどの程度貢献したのかを考慮する必要がある。本研究では、文献の新たな評価法を提起するという動機のもと、論文内の引用文脈の解析可能性と被引用文献の貢献度測定の実現可能性を示すことを目的とする。論文の本体及びメタデータから判定可能な客観的な評価法を開発する。

研究実績の概要

論文や研究データなどの研究成果が他の研究に与えた影響度を評価するには、ある論文においてその成果が引用されたか否かだけでなく、その論文の産出にどの程度その文献が寄与したのかに基づく必要がある。本研究では、論文内の引用箇所の周辺テキストの解析可能性と引用された研究成果の評価可能性を検証することを目的とする。そのために2年目は、論文テキストにおける引用要否判定タスクを設定し、(1)論文における引用の要否を判定する技術の検証、及び、(2)学習データの品質とドメインが与える影響の分析を以下の通り実施した。
(1)引用は学術論文において重要であり、先行研究を認識し、関連する著作へのアクセス性を高めるのに有用である。本研究では、研究成果の引用に値する箇所の検出という新しいタスクを設定した。実験では、固有表現認識を用いた学習法と単純なトークン分類法を比較した。固有表現認識に基づく手法は、学習セットとテストセットの間の分布ギャップにもかかわらず、より優れた学習能力を示しており、固有表現認識により科学的ドメイン知識を活用することが、正確なURL引用検出のための有望なアプローチであることが示された。
(2)データセットの品質とドメインの違いがURL引用の要否判定の性能に与える影響を分析した。自然言語処理,天体物理学,電気工学・システム科学の3分野からなるURL引用要否判定向けのデータセットを作成した.先行研究のデータセットと比較した結果,作成したデータセットの品質がより高いことを確認した.次に,データセットの品質が性能に与える影響を調べるために,先行研究と本研究のデータをそれぞれ学習データとした際の判定性能を比較した.その結果,本研究で作成した質の高いデータセットで学習したモデルの方が高い性能を有していることを確認した。

現在までの達成度
現在までの達成度

2: おおむね順調に進展している

理由

プロジェクトの2年目は、論文テキストにおける引用要否判定タスクを新たに設定し、本研究で整備してきた学術資源を活用し研究に取り組んだ。その結果、論文における引用の価値を判定する技術の検証、及び、そのための学習データの品質とドメインが与える影響の考察でいくつかの成果を得ることができた。得られた知見を査読付き論文として著名な国際会議で公表するに至っており、本課題はおおむね順調に進展しているといえる。

今後の研究の推進方策

次年度は、本研究で整備してきた学術論文資源の量的かつ質的拡充をさらに進める。大規模言語モデルを用いた研究成果の自動評価に取り組むことにより、前年度と今年度に試みた影響度のスコアリング性能の向上を目指す。研究推進上の致命的な問題は生じておらず、当初の研究計画に準じて取り組みを進める計画である。

報告書

(2件)
  • 2024 実施状況報告書
  • 2023 実施状況報告書
  • 研究成果

    (4件)
  • 研究データ

    (2件)

すべて 2025 2024 2023

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (3件) (うち国際学会 2件)

  • [雑誌論文] Citation-Worthy Detection of URL Citations in Scholarly Papers2024

    • 著者名/発表者名
      Kazuhiro Wada, Masaya Tsunokake, Shigeki Matsubara
    • 雑誌名

      The 2024 ACM/IEEE-CS Joint Conference on Digital Libraries (JCDL 2024)

      巻: 28 ページ: 1-5

    • DOI

      10.1145/3677389.3702570

    • 関連する報告書
      2024 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] URL引用の要否判定において学習データの品質とドメインが与える影響の分析2025

    • 著者名/発表者名
      和田和浩, 角掛正弥, 松原茂樹
    • 学会等名
      言語処理学会第31回年次大会
    • 関連する報告書
      2024 実施状況報告書
  • [学会発表] Identifying Influential References in Scholarly Papers Using Citation Contexts2023

    • 著者名/発表者名
      Tomoki Ikoma, Shigeki Matsubara
    • 学会等名
      The 25th International Conference on Asia-Pacific Digital Libraries
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] On the Use of Language Models for Function Identification of Citations in Scholarly Papers2023

    • 著者名/発表者名
      Tomoki Ikoma, Shigeki Matsubara
    • 学会等名
      The 2nd Workshop on Information Extraction from Scientific Publications
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会

すべて 2026

  • 学術論文における文献タグによる引用とURLを用いた引用を対象とした引用要否判定用データセット2026

    • 資金配分機関
      • 資金配分機関名
        日本学術振興会
      • e-Rad資金配分機関ID
        1025
      • Crossref Funder Registry資金配分機関ID

        https://doi.org/10.13039/501100001691

      • 体系的番号
        JP23K18506
      • プロジェクト名
        学術論文における被引用文献の貢献度測定:文献の新たな評価法を目指して
    • データの名称
      学術論文における文献タグによる引用とURLを用いた引用を対象とした引用要否判定用データセット
    • 掲載日
      2026-04-06
    • データの説明(抄録・要旨)
      自然言語処理分野の国際会議であるACL, NAACL, EMNLPの本会議論文から作成したデータセット.作成したデータを8:1:1でランダムに学習,検証,テストデータに分割している.各ファイルはcsvファイルであり各列は「ファイル名とそのファイル内での文の位置」「判定対象の文」「文献タグを用いた引用が必要か (2値)」「URLを用いた引用が必要か (2値)」の情報を含む.
    • データの分野
      情報通信
    • データ種別
      データセット
    • 管理対象データの利活用・提供方針
      無償、https://creativecommons.org/licenses/by/4.0/deed.en
    • アクセス種別
      公開
    • リポジトリ情報
      名古屋大学学術機関リポジトリ
    • URI

      http://hdl.handle.net/2237/0002012215

    • データ管理者情報
      • データ管理者情報種別
        データ管理者
      • データ管理者情報
        附属図書館
      • データ管理者情報種別
        データ管理機関
      • データ管理者情報
        名古屋大学
      • データ管理者情報種別
        データ管理者の連絡先
      • データ管理者情報
        lib-os*t.mail.nagoya-u.ac.jp (メールアドレスは「@」を「*」に置換しています。)
    • データNo.

      JP23K18506-2024-0001

    • 関連する報告書
      2024 実施状況報告書
  • 学術論文におけるURLを用いた引用を対象とした要否判定のためのデータセット2026

    • 資金配分機関
      • 資金配分機関名
        日本学術振興会
      • e-Rad資金配分機関ID
        1025
      • Crossref Funder Registry資金配分機関ID

        https://doi.org/10.13039/501100001691

      • 体系的番号
        JP23K18506
      • プロジェクト名
        学術論文における被引用文献の貢献度測定:文献の新たな評価法を目指して
    • データの名称
      学術論文におけるURLを用いた引用を対象とした要否判定のためのデータセット
    • 掲載日
      2026-04-06
    • データの説明(抄録・要旨)
      自然言語処理分野の国際会議であるACL, NAACL, EMNLPの2000年~2021年の本会議論文から作成したデータセット.論文PDFのテキスト化にはPDFNLT-1.0を使用している.URLによる引用(URL引用)を対象にした要否判定を行うことためのモデルの学習と評価に使用することを想定している.年ごとにcsvファイルにしており,各行に判定対象の文が含まれている.
    • データの分野
      情報通信
    • データ種別
      データセット
    • 管理対象データの利活用・提供方針
      無償、https://creativecommons.org/licenses/by/4.0/deed.en
    • アクセス種別
      公開
    • リポジトリ情報
      名古屋大学学術機関リポジトリ
    • URI

      http://hdl.handle.net/2237/0002012359

    • データ管理者情報
      • データ管理者情報種別
        データ管理者
      • データ管理者情報
        附属図書館
      • データ管理者情報種別
        データ管理機関
      • データ管理者情報
        名古屋大学
      • データ管理者情報種別
        データ管理者の連絡先
      • データ管理者情報
        lib-os*t.mail.nagoya-u.ac.jp (メールアドレスは「@」を「*」に置換しています。)
    • データNo.

      JP23K18506-2024-0002

    • 関連する報告書
      2024 実施状況報告書

URL: 

公開日: 2023-07-04   更新日: 2026-04-14  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi