• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Analysis and statistical modeling of citation graph for scientific articles

Research Project

Project/Area Number 20K11715
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 60030:Statistical science-related
Research InstitutionChuo University

Principal Investigator

中野 純司  中央大学, 国際経営学部, 教授 (60136281)

Project Period (FY) 2020-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2022)
Budget Amount *help
¥3,510,000 (Direct Cost: ¥2,700,000、Indirect Cost: ¥810,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2022: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2021: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2020: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Keywords学術論文データ / 引用関係グラフ / 大規模グラフ / グラフ生成モデル / 共著関係グラフ
Outline of Research at the Start

多くのノードがノード間の方向のあるエッジで結ばれる有向グラフは、多種多様な構造を持つデータを表すことのできる汎用的なデータ構造である。それに対する解析は、検索エンジンの中心となったページランクのように、現代人の生活にはもはやかかせない。ところがそのようなグラフの生成構造に対するモデリングの研究はまだ十分ではない。本研究では学術論文引用関係グラフを例に取り、その生成過程の統計モデルを考察する。

Outline of Annual Research Achievements

近年、学術論文の状況を解析するために Web of Science などの論文データベースが利用されている。本研究では、主として論文の情報をグラフとして表現し、そのグラフの生成構造に対するモデルを考えることにより、その理論的な裏付けを与え、論文や分野の評価などに利用することを考えている。
まず、統計学分野を取り上げ、年ごとの論文数に対してはロジスティック分布を当てはめ、論文の重要度を被引用数で近似し、論文の種類を示すものとして引用数を考え、その分布は一般逆正規分布をあてはめ、引用確率の経年変化についてはガンマ分布密度関数での近似を利用する確率モデルを考えた。さらに、引用関係グラフにおいては特にエッジの構成する3角形の数が重要であることがわかったので、それを実データにあわせるために、確率的な優先的選択の上に隣接点選択を加えた用いたモデルを提案した。そして実データに合うようにパラメータ推定を行った。そのモデルによるシミュレーションを行い、実グラフとの類似度などを調べた。これらの結果は論文として掲載された。
さらに、海外研究者との共同研究として Web of Science 全分野の論文を対象として、Web ページのサーチエンジン手法として有名なページランクを計算した。解析すべきデータ量が膨大になるため、新しい計算アルゴリズムを用いた。その結果、分野間の違いなどが明らかになっており、その結果も論文として掲載された。
また、AI分野などの論文の著者の専門分野をいくつかの国毎に調査し、最新分野の研究動向の比較を行なった結果の論文も掲載された。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

統計分野の論文引用関係グラフにおいて、提案した確率モデルはこれまでに提案されているグラフ生成モデルよりも、それによって発生されたシミュレーションデータにおける実データの再現性がよいという結果を得ており、論文として掲載された。その理由のひとつは学術論文に固有な特徴をモデルに組み込んだからである。また、複数の協力者との研究として、全分野にわたる大規模な学術論文データベースを扱ってみて、ページランクが論文評価でも有効なことを確認し。その結果も論文として掲載された。さらにAIなどの最新分野における論文の著者の特徴を抽出し、主成分分析などを用いて比較を行った結果も論文とできた。

Strategy for Future Research Activity

提案した学術論文の引用関係グラフの確率モデルは、実データの特徴をかなりうまく捉えることができたと考えており、しばらくこのモデルの有用性の検証や必要な拡張に注力する。米国の特許文献は学術論文と似たデータであるが、その解析から、三角形形成の隣接点選択の確率モデルをより精密にすべきであることがわかったので、その考察を行う。
また、全分野にわたる学術論文の引用関係解析においては海外の研究者と対面で会う機会が回復した。これにより Web of Science 以外の論文データベースを用いる研究を考えている。
また、論文の共著者の解析においては著者の専門分野の特定法を改善したい。具体的にはトピックモデルに似た方法の適用を検討している。

Report

(3 results)
  • 2022 Research-status Report
  • 2021 Research-status Report
  • 2020 Research-status Report
  • Research Products

    (15 results)

All 2023 2022 2021 2020 Other

All Int'l Joint Research (6 results) Journal Article (6 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 6 results,  Open Access: 6 results) Presentation (3 results) (of which Int'l Joint Research: 3 results)

  • [Int'l Joint Research] National University of Singapore(シンガポール)

    • Related Report
      2022 Research-status Report
  • [Int'l Joint Research] Zuse Institute Berlin(ドイツ)

    • Related Report
      2022 Research-status Report
  • [Int'l Joint Research] Academia Sinica(その他の国・地域(台湾))

    • Related Report
      2022 Research-status Report
  • [Int'l Joint Research] National Unversity of Singpore(シンガポール)

    • Related Report
      2021 Research-status Report
  • [Int'l Joint Research] Zuse Institute Berlin (ZIB)(ドイツ)

    • Related Report
      2021 Research-status Report
  • [Int'l Joint Research] Institute of Statistical Science/,Academia Sinica/Taiwan(その他の国・地域)

    • Related Report
      2020 Research-status Report
  • [Journal Article] Article's scientific prestige: Measuring the impact of individual articles in the web of science2023

    • Author(s)
      Ying Chen and Torsten Koch and Nazgul Zakiyeva and Kailiang Liu and Zhitong Xu and Chun-houh Chen and Junji Nakano and Keisuke Honda
    • Journal Title

      Journal of Informetrics

      Volume: 17 Issue: 1 Pages: 101379-101379

    • DOI

      10.1016/j.joi.2023.101379

    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] A stochastic generative model for citation networks among academic papers2022

    • Author(s)
      Yuichiro Yasui and Junji Nakano
    • Journal Title

      PLOS ONE

      Volume: 17 Issue: 6 Pages: e0269845-e0269845

    • DOI

      10.1371/journal.pone.0269845

    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] International comparison of cross-disciplinary integration in industry 4.0: A co-authorship analysis using academic literature databases2022

    • Author(s)
      Yuji Mizukami and Junji Nakano
    • Journal Title

      PLOS ONE

      Volume: 17 Issue: 10 Pages: e0275306-e0275306

    • DOI

      10.1371/journal.pone.0275306

    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] 学術分野における論文および統計学論文の引用状況について2020

    • Author(s)
      張 菱軒、潘 建興、中野 純司
    • Journal Title

      統計数理

      Volume: 68 Pages: 247-264

    • Related Report
      2020 Research-status Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] トピックモデルを用いた研究動向の分析2020

    • Author(s)
      武井 美緒、藤野 友和、中野 純司
    • Journal Title

      統計数理

      Volume: 68 Pages: 219-231

    • NAID

      130007752464

    • Related Report
      2020 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] 学術文献DBを用いた共著分析によるIoT研究における異分野融合の国際比較2020

    • Author(s)
      水上 祐治、中野 純司
    • Journal Title

      統計数理

      Volume: 68 Pages: 265-285

    • Related Report
      2020 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] Analysis of citations among U.S. patents using a stochastic generative model2022

    • Author(s)
      Yuichiro Yasui and Junji Nakano
    • Organizer
      IASC-ARS Interim Conference 2022
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] Visualizing characteristics of aggregated symbolic data2021

    • Author(s)
      Junji Nakano
    • Organizer
      63rd World Statistics Congress
    • Related Report
      2021 Research-status Report
    • Int'l Joint Research
  • [Presentation] Statistical model for article citation network in Web of Science2021

    • Author(s)
      Junji Nakano
    • Organizer
      5th ZIB-RIKEN-IMI-ISM MODAL Workshop on Optimization
    • Related Report
      2021 Research-status Report
    • Int'l Joint Research

URL: 

Published: 2020-04-28   Modified: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi