研究課題/領域番号 |
18H03631
|
研究機関 | 東京大学 |
研究代表者 |
元橋 一之 東京大学, 大学院工学系研究科(工学部), 教授 (30345441)
|
研究分担者 |
池内 健太 独立行政法人経済産業研究所, 研究グループ, 研究員 (20625496)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | 産学連携 / サイエンスイノベーション / 論文データ / 特許データ |
研究実績の概要 |
論文及び特許のそれぞれについて研究用データベースの作成を中心に行った。まず特許データの発明者識別作業については、IIPパテントデータベースの最新バージョン(2018年3月公表分まで)に対して、科研費の成果報告データ及び電話帳によるレアネーム情報を教師データとした機械学習モデルを作成した。同姓同名の特許発明者ペアに関する類似度算出とクラスタリングによる同一人物による特許グループ作成の2段階において教師付き機械学習を用いていることを特徴とする。また、論文データについては、オープンソースデータであるMAG(Microsoft Academic Graph)の活用可能性に関する評価を行った。商用データベースであるSCOPUSデータと比較したところ、出版年、著者数、引用情報などは正確にとれているが、著者のアフィリエート情報については半数以上に欠落が見られ、著者・発明者接続データとして利用することは困難であることが分かった(この評価結果についてはディスカッションペーパーとして公表)。従って、クラリベート社のWeb of Scienceを購入し分析の用途とすることとした。分析テーマについては、主に海外における同種の研究に関する情報収集に努めた。ルーベンカソリック大学、浙江大学、WIPO(World Intellectual Property Organization)などにおけるセミナーにおいて研究内容に関して発表し、有益なフィードバックを得ることができた。また、中国において中国語の論文データに関する情報収集を行い、その内容については今後のデータベース構築方針に活かされることとなる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初の目標としては、日本の研究者については、論文著者と特許発明者の接続データを完成させ2つの研究テーマのうち大学法人改革や産学連携政策の大学研究者に対する影響分析を始める予定であったが、論文データ、特許データの整備と、研究テーマに関する海外情報収集と分析方法の精緻化を行うにとどまった。その理由としては、当初利用可能と考えていたMAGの活用が難しいことが分かり、その後、商用データベースの購入に時間を要して実際にデータ作業を開始できたのが、2019年1月以降となったためである。特許データの発明者識別については順調に作業が進んだが、論文データのプロセスが遅れて、両者の接続が年度内に終わらなかった。また、非特許文献(論文)の特許引用に関するデータ作成についても、対象となる論文データの導入が遅れたため、同定モデルの作成についてはほぼ終了したが、最終的な結果が得られていない状況である。
|
今後の研究の推進方策 |
計画の遅れを取り戻すために、早急に論文著者と特許発明者の接続データベースの作成を行い、かつ非特許文献(論文)の特許引用に関するデータ作成を早急に行い、大学法人化や特許機関帰属が、大学等の研究に与える影響に関する分析を開始する。なお、当初計画に対するキャッチアップを進めるために研究分担者を1名追加してデータ作業を進める。同時に研究代表者においては、これらのデータを活用した分析フレームワークを精緻化して、大学等における研究者のインセンティブ問題に立ち返ったオープンな論文とクローズな特許の関係について研究者レベルの分析を進める。今後の研究内容について、当初の予定から大きく変更する必要はないが、データサイズが予想以上に大きく、複雑な分析モデルの推計にあたっては長い時間を要することが想定させる。従って、年度後半に高速ワークステーションを導入し繰り返し推計をより効率的に進められるよう研究インフラを整える。
|