2020 Fiscal Year Research-status Report
Analysis and statistical modeling of citation graph for scientific articles
Project/Area Number |
20K11715
|
Research Institution | Chuo University |
Principal Investigator |
中野 純司 中央大学, 国際経営学部, 教授 (60136281)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Keywords | 学術論文データ / 引用関係グラフ / 大規模グラフ / グラフ生成モデル |
Outline of Annual Research Achievements |
学術論文の状況を解析するために Web of Science などの論文データベースが利用できる。本研究では、主として論文の引用情報をグラフとして表現し、そのグラフの生成構造に対するモデルを考えることにより、その理論的な裏付けを与え、論文や分野の評価などに利用することを考えている。 現在、統計学分野を取り上げ、年ごとの論文数に対してはロジスティック分布を当てはめ、論文の重要度を被引用数で近似し、論文の種類を示すものとして引用数を考え、その分布は一般逆正規分布をあてはめ、引用確率の経年変化についてはガンマ分布密度関数での近似を利用する確率モデルを考えた。さらに、引用関係グラフにおいては特にエッジの構成する3角形の数が重要であることがわかったので、それを実データにあわせるために、確率的な優先的選択の上に隣接点選択を加えた用いたモデルを提案した。そして実データに合うようなパラメータ推定を行った。そのモデルによるシミュレーショ ンを行い、実グラフとの類似度などを調べているところである。ただ、グラフの類似度自身が簡単なものではないで、それについての考察とプログラムによる実装を試みている。 ところで、論文データベースには引用関係の他にも重要な情報が含まれているので、それらを用いていくつかの考察を行った。まず、他学術分野の論文における統計学論文の被引用状況を調べた。また、データベースには研究内容が直接的に表現されている論文要旨も含まれていることより、そこからトピックを抽出し,対象とする組織やグループ毎の研究の動向を把握するための分析を考えた。特に統計科学分野の著名な論文誌と統計科学に関連する二つの研究所の論文の要旨を用いて分析を行い,研究の特徴や論文の発行年度毎の動向が把握できることを見た。さらに、論文の共著者情報を用いて、IoT技術の研究における国別の特徴も考察した。
.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
少なくとも統計分野の論文引用関係グラフにおいて、提案した確率モデルはこれまでに提案されているグラフ生成モデルよりも、それによって発生されたシミュレーションデータにおける実データの再現性がよいという結果を得ている。その理由のひとつは学術論文に固有な特徴をモデルに組み込んだからであるが、それはモデルが特殊になったことを意味する。ただ、実は同様の特徴は他のグラフの解析においても利用できるのではないかと考えており、これに関しては今後考察する予定である。 また、学術論文データベースを扱っているうちに、その利用をいろいろな形で試み、複数の協力者との研究結果として有用な結果が得られた。
|
Strategy for Future Research Activity |
提案した学術論文の引用関係グラフの確率モデルは、実データの特徴をかなりうまく捉えることができたと考えており、しばらくこのモデルの有用性の検証に注力する。例えば統計学以外の分野での、このモデルの有効性を確かめる予定である。また、グラフ生成モデルの検証にはグラフの類似度を用いることが必要であり、これは困難な問題であり調査・研究をしなければならない。 学術論文データベースの種々の利用も続けて考察したい。特に論文の共著者情報を用いて、IoTなどの技術の研究における国別の特徴の考察は、さらに範囲を広げた研究を続ける予定である。 なお、COVID-19の蔓延により社会環境が激変しており、学術研究においてもこれまでと同様には進まなくなっている。特に大学の授業や学会開催が対面ではなくオンラインになったことの影響は大きかった。オンラインにおける研究環境の整備(計算機、ネットワーク環境の強化)はこれまで以上に必要である。学会や研究連絡のための出張は控えざるをえないが、当面はこの状況に対応して研究を進めるしかないと考える。
|
Causes of Carryover |
COVID-19の蔓延のために研究連絡および学会参加のための出張が行えなかった。また、授業のオンライン化のために若干の研究環境強化(自宅)を大学の研究費で行ったが、本研究課題のための強化を行う余裕と必要性がなかった。そのため、研究費を使用できなかった。今後、オンライン利用と本研究のための研究環境強化(計算機などの増強)を行う予定である。
|
Research Products
(4 results)