2019 Fiscal Year Research-status Report
Automatic Construction of Procedural Ontology and Its Application to Information Retrieval
Project/Area Number |
19K12101
|
Research Institution | Chuo University |
Principal Investigator |
難波 英嗣 中央大学, 理工学部, 教授 (50345378)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | オントロジー / 手順 / 特許 |
Outline of Annual Research Achievements |
ある特定の目的を達成するための一連の手続きを記したものを手順テキストと呼ぶ。新技術は典型的な手順と比べることで、はじめてその新規性を理解することができるため、典型的な手順に関する概念が記述されている手順オントロジーは、非常に重要な役割を果たすと考えられる。しかしながら、これまでにあらゆる技術分野を対象とした網羅的な手順オントロジーは構築されてこなかった。そこで、我々は、手順オントロジーを自動構築することを目指し、その第一歩として、特許請求項の構造解析を行う。 特許では、新しい技術や発明を説明するために、それを実現する手順を記載することがしばしばある。このような構造を自動的に解析するため、Bi-directional LSTM-CRFおよびCRFを用いた解析器を構築した。提案手法の有効性を調べるため、実験を行った。実験では、米国特許および日本国特許の請求項2456件に対し、人手でhead(主題), proc(手順), comp(構成要素)タグを付与したデータを作成した。実験の結果、米国および日本国特許の両方において、Bi-directional LSTM-CRFとCRFは、いずれもほぼ同じF値が得られたが、Bi-LSTM-CRFが埋め込み表現を使ったことが原因で、精度はCRFが、再現率はBi-LSTM-CRFが高い結果となった。個別のタグに着目すると、日本国特許はprocタグの付与精度が極端に低かった。この点については、例えば、単語埋め込みの学習に用いるデータを請求項のみに限定することで改善できる可能性がある。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では,以下のスケジュールで手順オントロジーを構築し、その検証を行う予定になっていた。 [課題1] 手順オントロジーの構築(2019年度), (1-1) 請求項の構造解析による手順の抽出, (1-2) 手順の体系化(2019-2020年度) [課題2] 手順オントロジーの有効性の検証, (2-1) 手順オントロジーの特許検索への適用, (2020年度), (2-2) 手順オントロジーを用いた学術論文の新規性の検出(2021年度) 今年度は、日本および米国特許を対象に(1-1)を達成した。また、(1-2)については実装には着手していないものの、その実現方法については見通しが立っていることから、2019年度はほぼ予定通りに研究を遂行していると言える。
|
Strategy for Future Research Activity |
2020年度は、(1-2) 手順の体系化について引き続き検討するとともに、実装し、評価を行う。さらに、[課題2] 手順オントロジーの有効性の検証において、 (2-1) 手順オントロジーの特許検索への適用に着手する。2021年度は (2-2) 手順オントロジーを用いた学術論文の新規性の検出を予定しているが、もし2020年度に研究が順調に進めば、予定を繰り上げて、(2-2)に着手する。
|
Causes of Carryover |
2019年度から研究代表者の所属大学が変わったため、新規にサーバを購入するための予算を計上していたが、異動の際に、前勤務先からサーバを移管できることになり、2019年度にサーバを購入する必要がなくなったため、その分の予算を来年度に繰り越すことにした。2020年度は、特許検索および手順組織化計算用サーバを購入予定であるが繰越分を用い、よりハイスペックなものを購入する。
|