研究概要 |
特許マップ自動作成技術の確立を目指し,電子化された特許明細書の入手と蓄積,実験環境の構築,前処理技術の確立,高速かつ十分な精度の特許分類技術の考案,実データを用いた評価,特許マップ提示プログラムの設計と実装を行った. まず,国立情報学研究所のNTCIRワークショップに参加者として登録し,10年分にわたる特許明細書の電子データの利用許諾を得て,本補助金により構築したサーバ計算機のRAIDディスク装置に当該電子データを蓄積した. 次に,蓄積した特許明細書データを処理するためのソフトウェア環境を整備した.具体的には,各種既存ソフトウェアのインストール,「概念べ一ス構築プログラムmkCB」の開癸を行い,特許明細書をクラスタ化するまでに必要となるソフトウェアツール類を整備した. 特許文書データ,分類のための課題,および従来の分類手法について分析した結果,従来の手法には精度が良い手法は存在するが,いずれの手法も今後の分類課題数の増加に対応できるだけの処理速度を有していないことがわかった.そこで,より少ない計算量で特許文書を分類できる「単語重み付けに基づく分類手法」を考案した.NTCIRワークショップのデータおよび分類課題を用いて評価したところ,分類精度は従来の高精度な手法と互角で,処理速度が数倍〜数十倍高速であることを確認した. また,分類した特許文番をマップとして表示する特許マップ提示プログラムをWebアプリケーションとして設計し,実装した.これにより,考案した分類手法によって分類した特許を,さまざまな観点から2次元のマップとしてコンピュータディスプレイ上に表示することが可能となった. 以上によって,特許文書を蓄積・前処理し,与えられた分類基準に基づいて自動的に分類し,それをマップとして提示する,という特許マップ自動作成に関するひととおりの技術を確立した.
|