研究課題/領域番号 |
21K01655
|
研究機関 | 芝浦工業大学 |
研究代表者 |
田中 秀穂 芝浦工業大学, システム理工学部, 教授 (00378712)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 発明の同期 / 特許 |
研究実績の概要 |
本研究の目的は、「発明の同期」の指標化を実現し、その技術進化過程における意義の検証やイノベーション研究における新たな指標としての価値を明らかにすることである。令和3年度は、この目的の実現のためにまず、技術単語レベルでの同期検出手法を発展させることに取り組み、分析プログラムの改良を実施した。 まず大規模データを用いる場合の出力結果の表示についての改良を行った。出力ファイルがエクセルの表示上限を超える場合があることから、同期して特許請求の範囲の中に出現する単語については、Linuxのsedコマンドを使用してこれをファイル分割する設定を行った。また技術用語としては認識できない単語も含まれることがこれまでの問題の一つであったため、その中の一つのタイプである「第+数字+技術用語」の文字構成の単語について、「第+数字」を除去するステップを組み込んだ。これらにより、大規模データのより高い精度での効率的な分析を可能とした。 次にこの改良プログラムを用いて、国際特許分類IPCのA61K分野の特許データを用いた発明の同期解析を試行した。分析に用いた特許文献総数は107,675件であった。分析の結果、1特許当たりの同期単語出現頻度は2010年少し前まで減少した後、横ばいとなるカーブを描くことが観察された。これは他の技術分野で以前に小規模データで分析した場合と類似していた。この共通した推移カーブが意味するところを検証する必要が新たに生じたと認識している。また、共同出願の同期が多く検出されたことから、これら案件の場合の同期の判定の基準を設ける必要があることも検討課題としてあがってきた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
初年度に計画していた実施事項に関する進捗はおおむね順調に推移している。実施体制としては、大学院生の研究スタッフを確保し主担当者との協力のもと研究を実施している。プログラムの改良、同期解析の実施など予定していた内容はいずれも令和3年度に着手し、一定の結果を得ることができた。プログラムの改良の内容は概要に記した通り、出力ファイルのデータ量限界を回避するステップの使用を検討し、技術用語として抽出される単語の質の向上を目的として、「第+数字+技術用語」の文字構成の単語について「第+数字」を除去するステップを組み込むことなどを実施した。 この改良を受けて、IPCのA61K分野の特許データを用いた同期解析を試行した。データセットは107,675件で、再公表特許、分割出願を抽出して除去して作成した。出願期間は1993年から2020年として、同期の検出は初出単語を最初の5年間をはずし、また同期検出期間は18か月を用いたため最後の2年間をはずして分析した。このデータから同期検出プログラムにより、新出単語のリスト、同期単語のリストなどを出力して検討を行った。 一方で、いくつか検討課題が見つかったことから、本格的に大規模データの分析を開始するタイミングは少し後ろにずれることとなる。具体的な時期としては、令和4年度中には開始したいと考えている。
|
今後の研究の推進方策 |
研究実績の概要に記述したように、同期単語の出現頻度がいくつかの技術分野で共通のパターンを示すことについて、意味するところを検証することが来年度に新たに検討すべき課題として浮かび上がっている。この点を明らかにしたうえで、大規模特許データを分析する作業に移行することとする。 検証はいくつかの解析によって実施することを考えている。まずは、同期した技術用語を特許請求の範囲に含む特許文献間の技術分野としての類似度の検証である。これについては単語レベルで同期として検出した特許文献のIPCを分析し、その一致率などから同期の程度を検討する予定である。さらに2010年前後から急激に特許出願数が増加している技術分野を選定して分析し、同期単語数の推移がこれまでの分析分野と異なるかどうかも検証したい。加えて分析に供する特許データを、筆頭IPCの一致で抽出することにより、より内容の一致度が高い単語同期文献を抽出できる可能性についても検討したい。 また今後の研究推進の新たな方向として、英語特許文献での同期検出プログラムが可能かどうかを検討する。発明の同期の発生はグローバルで捉えるべきであることから、PCT出願文献などを対象として分析を行うことが有効である可能性や、単語の抽出が英語の方がシンプルに実施できる可能性などによりこれを検討する予定である。また英語文献の解析プログラムにおいては、出力先ファイルをエクセルからデータベースに変更することにより、分析結果の出力をより容易に行えるように改良することも検討する。 発表については、令和4年度において学会発表1件を実施することを準備しており、発表時期は秋を予定している。
|
次年度使用額が生じた理由 |
データ分析作業のための学生アルバイト従事が予定よりやや少なかったことなどによる。令和4年度は十分な時間が確保できる予定である。
|