2020 Fiscal Year Research-status Report
Automatic Construction of Procedural Ontology and Its Application to Information Retrieval
Project/Area Number |
19K12101
|
Research Institution | Chuo University |
Principal Investigator |
難波 英嗣 中央大学, 理工学部, 教授 (50345378)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 特許 / BERT / 構造解析 |
Outline of Annual Research Achievements |
二つのテキストの内容が同一であるかどうかを判定するという課題は、自然言語処理における代表的なタスクのひとつである。本研究では特許請求項に焦点を当て、二つの請求項の同一性を自動判定する手法を提案する。 二つの請求項の同一性を判定するという課題は、無効資料調査の一種と考えられる。無効資料調査とは、第三者の特許を無効化するため、または第三者の発明が権利化されることを阻むために行う調査である。つまり無効資料調査の目的は、第三者の発明に特許性がないことを示す根拠となる文書を検索することである。根拠となる文書とは、一般に特許だけに限らず、論文や雑誌など様々な文献を指すが、本研究では記述形式が同じ請求項に限定する。 二つの請求項が同一あるいは非常に類似しているかどうかを判定する研究を行うためには、データを大量に準備する必要がある。本研究では特許庁が公開している国内引用文献マスタというデータベースを利用する。特許では、発明に特許性があるか、出願特許の各請求項に対し審査を行う。審査の結果、特許性がないと判断した場合には、その根拠となる文献を拒絶理由通知書に記載し、出願人に通知する。この拒絶理由通知書に記載された根拠となる文献をまとめたデータベースが国内引用文献マスタである。 本研究では、以下の二つの手順により、二つの請求項が同一であるかどうか判定する。 まず、新森らおよび難波が提案する手法を用いて、各請求項の構造を解析し、次に、要素間を対応付け、二つの請求項の主題部および構成要素か手順が一つ以上同一の場合、二つの請求項が同一であると判定する。実験の結果、難波の手法を用いて請求項を構造解析し、BERTを用いて構成要素の類似性を測る手法において、0.646の検出精度を得た。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の予定では、評価ワークショップNTCIRにおいて実施された特許検索タスクのデータを用いて提案手法の有効性を確認する実験を行う予定であったが、これを、特許庁が公開する国内引用文献マスタというデータベースを利用して行った。その理由は、特許検索タスクが実施された当時は、引用文献マスタには拒絶の根拠となる文献情報は記載されていたものの、文献のどの個所が拒絶の根拠になるのかという情報までは得られなかった。一方、近年、特許庁は拒絶の根拠となる文献に関して、その文献(特許)のどの個所が根拠となるのかまで記載するようになっている。本研究では、拒絶の根拠として請求項が挙げられているものを利用し、請求項と、それを拒絶する根拠となる請求項を類似内容の請求項対として用いることにより、当初の予定よりもより厳密な実験を実施することができたため、おおむね順調に進展していると判断できる。
|
Strategy for Future Research Activity |
2021年度は、多言語での手順の体系化について検討する。さらに、手順オントロジーを用いた学術論文の新規性の検出を予定している。
|
Causes of Carryover |
コロナウィルス感染症の影響で、当初予定していた学会発表等にかかる出張旅費がほとんど執行されなかった。2021年度は、2020年度よりも状況が改善されると思われるため、学会発表等で出張旅費および学会参加費として利用する。
|