研究課題
Wikipediaでの学術文献に基づく信頼性の高い情報提供の定量的な評価の実現をを目的として,以下の研究に取り組んだ.(1) 申請者が開発した手法を用いて,2021年10月時点の英語版Wikipediaにおける31万件の記事上の147万件の学術文献の参照記述について,それぞれの参照記述が初めて登場した時点 (初出時点) を特定したデータセットを構築した.同データセットに関するデータ論文の公表を通じて,データセット本体やその構築に必要なツール群を公開した.(2) 前述したデータセットを用いたタイムラグ分析を行った結果から,作成年が新しいWikipedia記事において,より公表年が新しい学術文献が参照される傾向は見られない一方,Wikipedia記事自体の新規作成から最初の参照記述が追加されるまでの時差は近年になるにつれて短くなる傾向があることを明らかにした.後者は,記事作成と同時に参照記述が追加されるケースが2007年から2008年にかけて急増しており,その当時のコンテンツの量から質への転換を目指す方針に対応する動きとして解釈できる.(3) Wikipedia上での学術文献の参照記述の追加活動が分野横断的 (学際的) であることからアイデアを敷衍させ,学術ビッグデータを用いて研究活動 (研究成果としての論文発表) における学際性の動向分析を行い,複数の研究分野を対象に,それぞれの特徴や経年的な変化を明らかにした.(4) 学術文献の識別子 (デジタルオブジェクト識別子,DOI) 自体の正確性と安定性に関して,DOIの大規模データセットを用いた分析を行った結果,約70万件の削除済のDOIを特定した.これらのDOIについて,コンテンツの種別や削除の発生要因を明らかにした.以上の研究成果について,研究期間全体で,国際英文誌の雑誌論文2編,国際会議論文3編を公表した.
(1) は国際会議「TPDL 2022」に採択されたfull paperの著者最終稿である.(2) は国際会議「TPDL 2022」の採択論文において研究対象であり,申請者が構築したデータセットである.
すべて 2023 2022 その他
すべて 雑誌論文 (4件) (うち査読あり 3件、 オープンアクセス 2件) 学会発表 (2件) (うち国際学会 2件) 備考 (2件)
Proceedings of the 18th International Conference, iConference 2023, Lecture Notes in Computer Science (LNCS)
巻: 13972 ページ: 425-438
10.1007/978-3-031-28032-0_33
人工知能
巻: 38 ページ: 399-407
10.11517/jjsai.38.3_399
LIBRES: Library and Information Science Research e-Journal
巻: 32 ページ: 64-80
10.32655/libres.2022.1.5
Proceedings of the 26th International Conference on Theory and Practice of Digital Libraries (TPDL 2022), Lecture Notes in Computer Science (LNCS)
巻: 13541 ページ: 161-174
10.1007/978-3-031-16802-4_13
https://doi.org/10.48550/arXiv.2207.12018
https://doi.org/10.5281/zenodo.6841257