2017 Fiscal Year Research-status Report
研究文献生産性分析の基盤構築:その動態の解明とシミュレーションモデル
Project/Area Number |
16K12833
|
Research Institution | National Institute of Informatics |
Principal Investigator |
中渡瀬 秀一 国立情報学研究所, 大学共同利用機関等の部局等, 特任研究員 (90599896)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 文献生産 / 書誌 / 動態 / 実証 / 助成金 / 分析基盤 / 著者目録 / 学術計量 |
Outline of Annual Research Achievements |
本研究は、研究文献の発生状況に関するデータを構造的かつ定量的に分析することによって国内研究文献の生産動態を実証的に明らかにする分析基盤の構築を目的としている。この分析基盤は情報源(文献書誌やプロジェクトデータ等)からのデータ収集環境や収集データから作成される分析用基礎データ(作成ノウハウ含む)から構成される。 前年度に基礎データの構成や作成方法について検討した。このデータに求められる要件は(1)研究者情報の豊富さ、(2)それらの継続的取得可能性、(3)高い研究者カバレッジの主に3点である。 これらを考慮した結果、過去データの十分な蓄積があり今後も継続して蓄積が見込まれる総合的助成金のデータを主要な情報源として、そこからプロジェクト参加研究者らの属性情報やbibliographyを収集すること、得られた情報をナレッジGraphのような形式に統合することを作成方針として本年度の計画を進めた。 まず基礎データを作成するためにデータ収集環境の整備を進め、プロジェクトデータ(学振科研)とその研究者データ約25万人分(2017年度末時点)の収集を完了した。これらに含まれる規格化されたデータ項目は構造化され統合される。しかしローデータ中には自由記述部分があり、この形式が不統一な部分の項目識別が課題となっている。つまりデータクリーニング、標準化や名寄せ等がさらに必要である。これらのうち簡易な処理で対応可能なものから順次作業を進めている。 次にプロジェクトデータから得られたbibliographyのカバレッジをより向上させるために、他の情報源(Jグローバルやリサーチmap等)を活用した情報の取得方法を検討した。 また上記と並行し、作成過程のデータの一部を用いてプロジェクト成果物としてのデータ類の公開状況に関する分析を行った。その結果についてポスター発表を行い議論を交わした。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
次年度計画の中心は分析用基礎データの作成である。初年度検討の結果、求められる要件から判断してプロジェクトデータ(学振科研)中の研究者の情報を中心に構成することとなった。そのデータ収集環境をKAKENサービスの協力を得て整備した。これを用いて現在約25万人分(2017年度末時点)のデータが収集されており、今後も逐次更新が可能な状態にある。これらのデータには研究者、その属性、成果文献、その背後にある投入資金、データ成果物やプロジェクト参加者(構成員や連携者)の情報が含まれている。 これらの情報にはデータ項目として識別されていないものが存在し、それらの識別作業にも着手した。 なお研究者のbibliographyをより充実させる必要があるため、さらに他の学術サービス等から公開データを収集する環境構築を進めている。この整備に関する作業は一部委託する予定であったが、委託費高騰により本年度の計画内では実施できなかった。また収集されたデータの識別作業に関するデータクリーニングの費用についても同様であり、それにより計画遅延が発生している。
|
Strategy for Future Research Activity |
平成30年度は、引き続き研究者のbibliography収集環境を構築する。またこれまで収集されたデータの整理・データクリーニング等も継続する。これらの結果として得られた情報はナレッジGraph等の形式を参考にして構造化し、基礎データ化する予定である。 なお昨年度の計画内容で実施に至らなかった委託作業については繰越分と平成30年度の助成金を充当して実施する予定である。 また構築したデータ収集環境は今後も継続してデータ収集できるように整備する。 最後に、この分析基盤を用いた生産性要因などの分析を行い、その分析例を学会発表や論文化によって公表する。
|
Causes of Carryover |
委託費の高騰と必要なスキルを有する人材の希少さのため、コーディング作業やデータクリーニング作業を委託する人材の確保が難しく次年度使用額が生じた。 使用計画としては繰越分と平成30年度分の助成金とを合わせてこれらの委託費用に充当する予定である。
|