研究実績の概要 |
ある特定の目的を達成するための一連の手続きを記したものを手順テキストと呼ぶ。新技術は典型的な手順と比べることで、はじめてその新規性を理解することができるため、典型的な手順に関する概念が記述されている手順オントロジーは、非常に重要な役割を果たすと考えられる。しかしながら、これまでにあらゆる技術分野を対象とした網羅的な手順オントロジーは構築されてこなかった。そこで、我々は、手順オントロジーを自動構築することを目指し、その第一歩として、特許請求項の構造解析を行う。 特許では、新しい技術や発明を説明するために、それを実現する手順を記載することがしばしばある。このような構造を自動的に解析するため、Bi-directional LSTM-CRFおよびCRFを用いた解析器を構築した。提案手法の有効性を調べるため、実験を行った。実験では、米国特許および日本国特許の請求項2456件に対し、人手でhead(主題), proc(手順), comp(構成要素)タグを付与したデータを作成した。実験の結果、米国および日本国特許の両方において、Bi-directional LSTM-CRFとCRFは、いずれもほぼ同じF値が得られたが、Bi-LSTM-CRFが埋め込み表現を使ったことが原因で、精度はCRFが、再現率はBi-LSTM-CRFが高い結果となった。個別のタグに着目すると、日本国特許はprocタグの付与精度が極端に低かった。この点については、例えば、単語埋め込みの学習に用いるデータを請求項のみに限定することで改善できる可能性がある。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究では,以下のスケジュールで手順オントロジーを構築し、その検証を行う予定になっていた。 [課題1] 手順オントロジーの構築(2019年度), (1-1) 請求項の構造解析による手順の抽出, (1-2) 手順の体系化(2019-2020年度) [課題2] 手順オントロジーの有効性の検証, (2-1) 手順オントロジーの特許検索への適用, (2020年度), (2-2) 手順オントロジーを用いた学術論文の新規性の検出(2021年度) 今年度は、日本および米国特許を対象に(1-1)を達成した。また、(1-2)については実装には着手していないものの、その実現方法については見通しが立っていることから、2019年度はほぼ予定通りに研究を遂行していると言える。
|