研究課題/領域番号 |
22K18147
|
研究機関 | 筑波大学 |
研究代表者 |
吉川 次郎 筑波大学, 図書館情報メディア系, 特任助教 (80908400)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
キーワード | 図書館情報学 / 計量書誌学 / 学術情報流通 / オープンサイエンス / Wikipedia / 永続的識別子 |
研究実績の概要 |
Wikipedia上での学術文献の参照記述を追加するタスクを支援するためのシステムの構築を通じて,Wikipediaの学術知識の信頼性や鮮度を向上することを目的として,初年度である2022年度は以下のことに取り組んだ. (1) 申請者が開発した手法を用いて,2021年10月時点の英語版Wikipediaにおける31万件の記事上の147万件の学術文献の参照記述について,それぞれの参照記述が初めて登場した時点 (初出時点) を特定したデータセットを構築した.データセット本体やその構築に必要なツール群に関するデータ論文を国際英文誌「Scientific Data」にて公表した. (2) 前述したデータセットを用いたタイムラグ分析を行い,Wikipedia記事自体の新規作成から最初の参照記述が追加されるまでの時差は近年になるにつれて短くなる傾向があることなどを明らかにした.この成果は国際会議「iConference 2023」にて発表した. (3) 任意のWikipedia記事において参照することが望ましい学術文献を効率的に推薦するための技術開発を兼ねて,学術ビッグデータを用いてアカデミアにおける研究活動 (研究成果としての論文発表) の動向分析を行った.その成果を国際英文誌「LIBRES (Library and Information Science Research E-Journal)」にて公表した. (4) Wikipedia上の学術文献の参照記述を長期的に利活用できるようにするために,学術文献の識別子 (デジタルオブジェクト識別子,DOI) 自体の正確性と安定性に関して,DOIの大規模データセットを用いた分析を行い,約70万件の削除済のDOIを特定したほか,当該コンテンツの種別や削除の発生要因を明らかにした.その成果を国際会議「TPDL 2022」にて発表した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の研究計画において,初年度は (A) 拡充を要する文献参照の特定,(B) 文献参照の「更新」のための推薦に取り組む予定であったが,これらの内容に取り組む以前に,Wikipediaにおける学術文献の参照記述に関する追加状況や文献自体の鮮度,ならびに,学術情報の永続的かつ安定的な利用のための技術基盤の検証を行う必要があるという判断に至った.このことから,今年度はこれらの研究のために必要なデータセットの構築ならびにデータ分析に取り組み,研究成果を複数の国際会議で発表した.これらの分析結果は本研究課題を遂行するうえで重要な知見を複数含んでおり,課題遂行に欠かせないものである. 加えて,前述の (A),(B) の課題遂行に必要となる,Wikipedia上の文献参照に関するデータセット,学術文献の大規模データセットについて整備を進めることができたほか,一部の手法開発に関してもアイデアの検討を進めることができた. 以上のことから,おおむね順調に進展していると自己評価する.
|
今後の研究の推進方策 |
今年度の研究課題の遂行を通じて得られた研究成果を基に,次年度は以下のことに取り組む予定である. Wikipedia上の学術文献の参照記述に関して,(1) 拡充を要する文献参照の特定,(2) 文献参照の「更新」のための推薦に向けた手法の開発および評価を進める.特に,(2) に関しては,任意の学術文献に対して関連文献を推薦する必要があり,そのために必要な学術文献間の関係性を用いた情報推薦の処理技術,ならびに,それらの関係性自体を機械的に取得・整理するための手法の開発を検討し,実装を進める. 上述した内容に加えて,Wikipedia以外のウェブ上のサービスやコミュニティにおける学術文献や学術知識の発信に関する分析を並行的に進めることで,Wikipedia上の学術文献の参照記述の実態解明や他のサービス・コミュニティとの比較による多角的な評価などの応用を目指す.具体的な分析対象として,現在,オンライン動画プラットフォーム「YouTube」における動画を通じた学術文献や学術知識の発信に関する分析を行うことを検討している.
|
次年度使用額が生じた理由 |
2022年度の研究遂行においては,大規模データ処理の効率化によるデータ容量の軽減,ならびに,各種プログラムの計算アルゴリズムの効率化を図ったことにより,手元の計算機資源を用いて研究課題を遂行することができたため,高性能ラップトップPCの新規購入が生じなかった.加えて,所属学会の研究大会がハイブリッド開催であったため,学会参加に伴う旅費が生じなかった.これらの理由により,次年度使用額が計上されている。 次年度使用額については,今後の国際会議参加における支出に充てるとともに,当初の計画書に記載した研究資料費および研究成果公開用のサーバ購入費用などに充てることを検討する.
|
備考 |
(1) は国際会議「TPDL 2022」に採択されたfull paperの著者最終稿である. (2) は国際会議「TPDL 2022」の採択論文において研究対象であり,申請者が構築したデータセットである.
|