研究課題/領域番号 |
19H01517
|
研究機関 | 筑波大学 |
研究代表者 |
立本 博文 筑波大学, ビジネスサイエンス系, 教授 (80361674)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 経営戦略論 / 技術経営論 / 特許分析 / プラットフォーム戦略 / 技術ポートフォリオ / エコシステム / 自動車産業 / 自動走行車 |
研究実績の概要 |
(1)自動車産業のイノベーションである自動運転車に関する特許を統計的に分析して、自動運転に関するエコシステムの把握を試みる。自動運転の技術 開発を示す特許リストとして、特許庁が行っている技術動向調査「H25自動運転自動車」の対象特許リストを入手し、その技術リストを基に米国特許から自動運転 関連の特許リストを新たに作成する。技術動向調査の自動運転の特許リストは出願広報ベースの特許リストであったため、出願広報の全件データベースを作成 し、特許公報番号と特許番号との対応を作成し、権利化された特許のリストを作成した。技術動向調査時には権利化されていなかった特許出願に関しても、後続 の特許広報を調査することで、権利化された特許を把握することを試みる。 (2)技術動向調査はかなり広めに特許リストを作成していることが判明したため(技術動向調査では特許リスト作成後、専門家が特許を読んで内容判断し、無関係 特許を排除するというプロセスがある)、より限定的な特許リストを抽出できるようにする。また、大きな困難として、米国特許全件から目的の特許リストを作 成すると、1日以上の処理時間がかかってしまうため、これを短縮化する手法(検索インデックス作成と並列処理)をもちいて、現実的な処理時間に収まるようにする。 (3)特許庁の自動運転の技術動向調査は2005-2011年の特許広報を対象としたため、2012-2019年の期間に対しても、(1)で作成した特許リスト作成の基準と同様 の基準をもちいて、新リストを作成し、特許分析を行う。 (4)特許のポートフォリオ分析をする際には、様々なコンテクスト情報を併せて包括的に理解する必要がある。そのため、ポートフォリオを可視的に把握できるこ とは有用である。本研究では、特許地図を作成するために、特許間の非線形関係を扱う手法を用いて二次元マップを作成し、検討を行う。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
大規模な特許リストから特許地図を作成するためには、多くの特徴量間の非線形の関係を扱えるようにすることが必要である。近年、機械学習を利用して、「多くの特徴量から構成されるデータ」「特徴量間の非線形な関係性を扱う手法」が導入されている。経営学研究でも、画像データや自然言語データに機械学習手法が導入され、画像からCEOのコミュニケーションスタイルを推定する、というような非線形な関係性を扱う研究が紹介されるようになっている。 本研究も、機械学習の手法(具体的にはt-SNEやUMAP、及び、random_forestなど)を用いて、(a)「数多くの非線形な関係をもつ特徴量を、2次元の技術マップに埋め込むこと」(b)「作成した技術マップから同じ技術資源を持つクラスターを特定する」(c)「そのクラスターによってパフォーマンスを説明する」ことを実現しようと試みている。この手法は、単純に教師あり機械学習のアルゴリズムをデータに適用するよりも、一段難しい。なぜなら、(1)まず教師なし学習で二次元埋め込みして特徴量を作成する(2)その後、作成した特徴量を説明変数、パフォーマンスを目的変数とするような、パイプラインを構成し、(1)(2)に含まれるハイパーパラメータをグリッドサーチで探索する必要があるからである。単純な機械学習アルゴリズムでは(2)の段階のハイパーパラメータ探索しか行わない。本研究では(2)の前段階である特徴量作成段階の(1)でもハイパーパラメータ探索を行っているところに技術的な難しさがある。 (1)(2)のように多段階のパイプライン上のハイパーパラメータサーチは、ハイパーパラメータの組み合わせ数が膨大になるため、間引きサーチをしたとしても、多くの計算が必要となる。 本研究では、産総研の並列計算機の環境を利用することで、この問題に対処しようとしているが手こずっている。
|
今後の研究の推進方策 |
現在、特許リストデータを対象にハイパーパラメータ探索を適切に行えるように試行錯誤を行っている。このハイパーパラメータ探索は、(1)教師あり学習でのハイパーパラメータ探索、だけでなく、(2)教師あり学習で用いる特徴量作成に用いる教師なし学習でのハイパーパラメータ探索、も行うという点に独自性がある。(1)(2)という2段階のハイパーパラメータサーチは、多くの計算時間が必要であるため、並列計算環境を使用したりしているが、そもそも、特許データリストのサイズが大きいため、うまくいっていない。 現段階では、この方法が、よい二次元地図作成にとって妥当な方法であるのかの、検討ができていない。このため、この方法の妥当性をさぐるために、まずは、より小さなデータセット(小さいと言っても、通常、経営学研究が扱うデータとしてはかなり大きい)である、財務データ等、他のデータを用いて、二次元地図の作成を試みる。これにより有用性の検討を試みる。 また、今のところ、(1)(2)のハイパーパラメータサーチは、ハードコーディングされているもので、柔軟なパイプラインの組み換えを行うことが難しい。これは、本研究の一般的な適用を難しくする。より汎用的なライブラリを用いて、(1)(2)のハイパパラメータサーチのパイプラインを表現する必要がある。この点は、経営学研究の研究成果として発表することが難しいものであるが、今後の本研究をすすめる上では実施しておく必要がある。 また、並列計算を実施の仕方についても、より工夫が必要である。主に、研究室内の計算機群を用いて並列計算を行ってきたが、産総研内の計算グリッドをメインに並列計算を行うべきかもしれない。この点は、計算コストとのバランスを見ながらということになる。ただし計算時間が長時間化しているため、より並列性が高い産総研内の計算グリッドを用いる方針である。
|