2018 Fiscal Year Research-status Report
研究文献生産性分析の基盤構築:その動態の解明とシミュレーションモデル
Project/Area Number |
16K12833
|
Research Institution | National Institute of Informatics |
Principal Investigator |
中渡瀬 秀一 国立情報学研究所, 情報社会相関研究系, 特任研究員 (90599896)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | 文献生産 / 書誌 / 著者目録 / 分析基盤 / 研究助成 / 実証分析 / 動態 / 学術計量 |
Outline of Annual Research Achievements |
本研究は、研究文献の発生状況に関するデータを構造的かつ定量的に分析することによって国内における研究文献の生産動態を実証的に明らかにする分析基盤の構築を目的としている。この分析基盤は情報源(書誌や研究助成データ等)からのデータ収集環境や収集データから作成される分析用基礎データから構成される。 これまで検討した結果、分析用基礎データに求められる要件は(1)研究者情報の豊富さ、(2)それらの継続的取得可能性、(3)高い研究者数カバレッジの主に3点である。 これらを考慮し、全分野的な助成金データから研究計画への参加研究者らの属性やbibliographyを継続的に収集する環境を整備した。これを用いて助成金に紐づく範囲では研究者別の基礎データが蓄積されたが、各研究者におけるbibliographyのカバレッジはまだ低い。この対策として書誌情報(CiNii等)からの集約やSNS(researchマップ)からの収集を検討することを基本方針として本年度の計画を進めた。 まず書誌情報を研究者別に集約してbibliographyを構成する方法を試みたが、単純な集約では名寄せに対処できないこと、また研究者毎のカバレッジに差があることが判明した。次にresearchマップからbibliographyを収集する方法を検討した。この場合、登録研究者数が問題となるのでアクティブなユーザ数(国立大86校)を調査したところ約47000人であった。一方、総務省調査による国立大の研究本務者数は136200人であり上記ユーザで約1/3がカバーされる。そこで上記ユーザのbibliography収集環境の整備に着手した。 また並行して公開データの提供が文献生産に与える影響も分析した。近年Open Scienceが注目されていることから公開データの影響を分析する手法を提案し、分析結果について研究会で発表を行って議論を交わした。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本年度計画の中心は分析用基礎データの作成である。これまでの検討で得た要件(関連情報の豊富さ・継続取得可能性・研究者数カバレッジ)から判断してJSPS研究課題データに含まれる情報を継続的に収集してきた(データ収集環境はKAKENデータベースを利用して構築、2017年度末時点の収集規模は約25万人分)。収集データに含まれる代表研究者、その共同研究者、その属性、成果文献、成果物、助成金等の明示的なデータ項目は相互に関連付けられており、また明示的に細分化されていない項目の抽出作業も可能な限り続けている。 しかし研究者のbibliographyという点では助成金に紐づいた範囲以外の捕捉も必要である。そこで書誌情報源からのデータ集約や研究SNSからのデータ収集を検討した。 まず書誌情報を研究者別に集約してbibliographyを構成する方法を試みたが、名寄せ済み書誌情報が少ないために単純な集約では対処できないこと、また既存の著書目録から情報源を照合した場合にも収録雑誌の偏りにより研究者によるカバレッジの差が大きいことが判明した。次にresearchマップからbibliographyを収集する方法を検討した。この場合には研究者数カバレッジが問題となるためユーザ数を調査した。対象は国立大学86校で直近1年半の間に情報を更新したユーザとしその数は約47000人(兼務含む)であった。一方、平成29年3月末で国立大学の研究本務者数は13万6200人(総務省調べ)なので約1/3は上記ユーザでカバーされている。そこでこれらのユーザの一部からbibliographyを実験的に収集した。 なおresearchマップのシステム更新が令和元年中に予定されている。そのため平成30年度はデータ収集を実験に留め、bibliography収集環境の本構築は翌年度に延期した。これによって計画に遅延が発生している。
|
Strategy for Future Research Activity |
令和元年度は、引き続き研究者のbibliography収集環境を拡充する。これまで整備した環境に加えてresearch マップからのデータ収集にも対応できるようにする。 research マップはシステム更新が令和元年中に予定されているため、平成30年度のデータ収集は実験に限定している。本格的な収集環境構築はシステム更新の完了を確認してから開始する。構築完了後には約5万人弱のユーザ情報を順次収集し、その内容を精査して評価を行う。このデータ収集環境については今後も継続してデータ収集できるような形に整備する予定である。またこれまでに収集したデータの整理・データクリーニング等も時間の許す限り継続する。 最後に、この分析基盤を用いた生産性要因などの分析を行い、その分析例を学会発表や論文化によって公表する。
|
Causes of Carryover |
リサーチ・マップからの試験的な情報収集環境は本年度に整備したが、次年度中に当サービスでシステム更新が予定されている。そのため正式な収集環境の構築はシステム更新後に行うこととし、これに対応するための次年度使用額が生じた。 使用計画としては繰越分の助成金でこれらの構築費用に充当する予定である。
|
Research Products
(4 results)