2022 Fiscal Year Annual Research Report
Reliability of Information on Wikipedia based on Scholarly Bibliographic References
Project/Area Number |
21K21303
|
Research Institution | University of Tsukuba |
Principal Investigator |
吉川 次郎 筑波大学, 図書館情報メディア系, 特任助教 (80908400)
|
Project Period (FY) |
2021-08-30 – 2023-03-31
|
Keywords | 図書館情報学 / 計量書誌学 / 学術情報流通 / オープンサイエンス / Wikipedia / 学際性 / 永続的識別子 |
Outline of Annual Research Achievements |
Wikipediaでの学術文献に基づく信頼性の高い情報提供の定量的な評価の実現をを目的として,以下の研究に取り組んだ. (1) 申請者が開発した手法を用いて,2021年10月時点の英語版Wikipediaにおける31万件の記事上の147万件の学術文献の参照記述について,それぞれの参照記述が初めて登場した時点 (初出時点) を特定したデータセットを構築した.同データセットに関するデータ論文の公表を通じて,データセット本体やその構築に必要なツール群を公開した. (2) 前述したデータセットを用いたタイムラグ分析を行った結果から,作成年が新しいWikipedia記事において,より公表年が新しい学術文献が参照される傾向は見られない一方,Wikipedia記事自体の新規作成から最初の参照記述が追加されるまでの時差は近年になるにつれて短くなる傾向があることを明らかにした.後者は,記事作成と同時に参照記述が追加されるケースが2007年から2008年にかけて急増しており,その当時のコンテンツの量から質への転換を目指す方針に対応する動きとして解釈できる. (3) Wikipedia上での学術文献の参照記述の追加活動が分野横断的 (学際的) であることからアイデアを敷衍させ,学術ビッグデータを用いて研究活動 (研究成果としての論文発表) における学際性の動向分析を行い,複数の研究分野を対象に,それぞれの特徴や経年的な変化を明らかにした. (4) 学術文献の識別子 (デジタルオブジェクト識別子,DOI) 自体の正確性と安定性に関して,DOIの大規模データセットを用いた分析を行った結果,約70万件の削除済のDOIを特定した.これらのDOIについて,コンテンツの種別や削除の発生要因を明らかにした. 以上の研究成果について,研究期間全体で,国際英文誌の雑誌論文2編,国際会議論文3編を公表した.
|
Remarks |
(1) は国際会議「TPDL 2022」に採択されたfull paperの著者最終稿である. (2) は国際会議「TPDL 2022」の採択論文において研究対象であり,申請者が構築したデータセットである.
|
Research Products
(8 results)