• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 実績報告書

研究データリポジトリの構築に向けた学術論文テキストの解析と利用

研究課題

研究課題/領域番号 21H03773
配分区分補助金
研究機関名古屋大学

研究代表者

松原 茂樹  名古屋大学, 情報基盤センター, 教授 (20303589)

研究分担者 加藤 芳秀  名古屋大学, 情報連携推進本部, 准教授 (20362220)
青木 学聡  名古屋大学, 情報連携推進本部, 教授 (90402974)
研究期間 (年度) 2021-04-01 – 2025-03-31
キーワードオープンサイエンス / データリポジトリ / テキスト分類 / データ引用 / メタデータ / 引用文脈
研究実績の概要

オープンサイエンスの促進に向けて、研究データリポジトリ構築を自動化することは効果的である。本研究では、論文テキストからの情報獲得による研究データ登録とそのメタデータ生成の実現性を、実験的に検証することを目的とする。3年目は、昨年度までに開発した技術に基づき、(1)文献リストにおける研究データ引用の検出、及び、(2)論文における研究データ引用の要否判定、に関する研究を推進した。
(1)論文の引用文献には研究データを参照するものが含まれることがあり、その情報をリポジトリ拡充に利用できる可能性がある。本研究では、論文の参考文献リストから、研究データとして引用されている文献を検出する手法を開発した。当該文献を検出するために、それが引用されている箇所の周辺テキスト(以下、引用文脈)の情報が利用できる。本手法では、文献の引用文脈を特定し、それを用いて研究データを検出するモデルを学習する。自然言語処理分野の国際会議論文を使用した実験により、手法の有効性を確認した。また、広範な分野の論文における研究データ引用の検出可能性を確認した。
(2)学術論文では、文献以外にもデータセットやプログラムなど、様々な研究資源が引用され、それらはURLによって引用されることが多い。論文の読者による研究の理解や再現、研究資源へのアクセスを支援するためには、データセットやプログラム等も適切に引用されることが望ましい。本研究では、文献タグによる引用に加えて、URL引用も含めた引用要否判定タスクを新たに設定した。このタスク設定に従い、自然言語処理分野の国際会議論文を用いたデータセットを作成し、従来の引用要否判定の手法をベースラインとし、URL引用を含めた引用要否の判定性能を検証した。その結果、URL引用の引用要否判定では、前後の文脈が重要であることが明らかとなった。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

プロジェクトの三年目は、学術論文の参考文献における研究データの識別、及び、論文テキストからのメタデータ要素の獲得に関する研究開発を計画していたのに対し、文献リストにおける研究データ引用の検出、ならびに、論文における研究データ引用の要否判定に関して取り組み、いくつかの知見を得ることができた。研究成果については言語処理関連の学会で公表するほか、難関国際会議で論文が採録されるに至っており、本課題はおおむね順調に進展しているといえる。

今後の研究の推進方策

次年度は最終年度として、本研究で整備した論文テキストデータを引き続き使用する。データの質的拡大についてはアノテーション作業などを通して必要に応じて継続する。引き続き、研究データのメタデータ要素の抽出技術に取り組むとともに、リポジトリの実現性の検証に取り組む予定である。研究推進上の問題は生じておらず、当初の研究計画を大きく変更する必要はない。

  • 研究成果

    (5件)

すべて 2024 2023

すべて 学会発表 (5件) (うち国際学会 1件)

  • [学会発表] 論文の文献リストにおける研究データ引用の検出2024

    • 著者名/発表者名
      生駒流季, 松原茂樹
    • 学会等名
      言語処理学会第30回年次大会
  • [学会発表] 論文におけるURLによる引用を考慮した引用要否判定2024

    • 著者名/発表者名
      和田和浩, 角掛正弥, 松原茂樹
    • 学会等名
      言語処理学会第30回年次大会
  • [学会発表] Paper Recommendation Using Citation Contexts in Scholarly Documents2023

    • 著者名/発表者名
      Tomoki Ikoma, Shigeki Matsubara
    • 学会等名
      The 37th Pacific Asia Conference on Language, Information and Computation (PACLIC 37)
    • 国際学会
  • [学会発表] 学術論文におけるURLによる引用の動向とその利用可能性2023

    • 著者名/発表者名
      和田 和浩, 松原 茂樹
    • 学会等名
      情報処理学会第63回インターネットと運用技術研究会(IOT)
  • [学会発表] 文法的・意味的制約に基づくクエリ指向型文圧縮2023

    • 著者名/発表者名
      林 律希, 加藤芳秀, 松原茂樹
    • 学会等名
      人工知能学会第37回全国大会

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi