2016 Fiscal Year Research-status Report
研究文献生産性分析の基盤構築:その動態の解明とシミュレーションモデル
Project/Area Number |
16K12833
|
Research Institution | National Institute of Informatics |
Principal Investigator |
中渡瀬 秀一 国立情報学研究所, 情報社会相関研究系, 特任研究員 (90599896)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 文献生産 / 書誌 / 動態 / 実証分析 / 計量分析 / 研究費 / Big Data / シミュレーション |
Outline of Annual Research Achievements |
本研究は、研究文献の発生状況に関わるデータである文献書誌やプロジェクト情報などを定量的に分析することによって国内研究文献の生産動態を実証的に明らかにする分析基盤の構築を目的としている。 この分析基盤はデータ収集環境や分析用基礎データ(それらの作成ノウハウを含む)から構成される。 本年度は、まず基礎データを作成するために諸文献データの収集環境の整備を進めた。次に可能なものからデータ収集とデータクリーニングを開始し、さらにそれらを統合して作成する基礎データの形式について検討を行った。またこれらと並行して作成過程のデータの一部を用いて行った研究領域の現況に関する分析結果をシンポジウムで発表し、論文化も行った。 分析用の基礎データ作成のために、具体的には学術文献検索サービス(NII学術コンテンツサービスやJ-GLOBAL等)を活用し、文献書誌および研究プロジェクト情報の収集を行う。それに必要な環境を順次構築してデータ収集にも着手した。収集しているデータの内容を検討した結果、属性情報や関係情報が比較的豊富に得られるプロジェクトの研究主体を分析対象の中心に定めた。またそれらを基礎データのコアとすることでデータ収集もより効率的になることが見込まれる。この方針に沿って文献データの収集は進められている。並行して進めている収集データ精査の過程では、有用な未構造化データの存在も判明したため、当初予定作業のクリーニング作業にデータの標準化や構造化の作業も加えることになった。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
初年度計画の中心は、文献情報の収集および分析用基礎データの作成である。まず検索サービス等から公開データを収集するための基盤構築は一部委託する予定であったが、昨今の人件費高騰によって必要なスキルをもつ人材の確保が難しくなっている。また収集データのクリーニングや標準化を行うための人材確保についても同様である。そのためこれら作業に遅延が発生している。 次に実際に収集したデータの内容を精査した結果、有用な未構造化データが含まれていることが判明したため、これらを基礎データ化するための作業が追加で必要となった。
|
Strategy for Future Research Activity |
平成29年度は、引き続きデータの収集を継続する。その結果として得られた情報に対する構造化・標準化などクリーニング作業も同時に進めてゆく。これら作業の追加発生分に対しては委託を増やして対応する。なお委託先確保を容易にするため作業内容の簡易化も検討する。また現在のデータ収集方法にも改良を加えて運用の安定性を高め、省力化を図るようにする。さらにこれまでの検討結果を踏まえて、動態分析の観点から十分な属性データと継続規模をもつ研究主体をコアとした分析用基礎データの整備を進める。その範囲として、まず平成28年度に収集されたデータを対象にして基礎データ化を行う。次にこの結果を用いて生産性要因などの分析を行い、その成果を学会発表や論文化によって公表する。
|
Causes of Carryover |
人件費の高騰により計画時の予算でコーディング作業やデータクリーニング作業を行うのに十分なスキルを持つ人材の確保が難しかったことによる。
|
Expenditure Plan for Carryover Budget |
繰越分は次年度分の助成金と合わせて人件費等に充当する。
|