代表的な知的財産情報である特許公報に対して,その情報を有効活用するために様々な処理が試みられている。 本研究の研究協力者である企業の知的財産部門に所属する専門家は,その特許が述べている解決を試みる課題と,それに対する手段の2つの面から特許公報の分類を行っている。この分類は専門家独自のものであり,請求項とは必ずしも一致していない。そのため,特許に付与されている国際特許分類コードなどの活用して行うことは難しい。また特許公報は膨大であるため,人手で行うのには負荷が大きい。これらのことから,ICTを用いた支援が求められている。 以上の背景から,本研究では,特許公報で述べられている解決を試みる課題とそれに対する手段を推定する手法として,ラフセット理論を活用した手法を提案した。提案手法では,はじめに専門家が課題・手段を分類付けした特許公報の要約から,形態素解析を用い,語句(名詞および接頭詞,接尾詞の列)を得る。それらの語句のうち,特定の課題もしくは手段中に一定回数以上出現するものを抽出する。次にそれらの語句を条件属性,出現の有無を属性値,課題・手段をそれぞれ決定属性と見なし,ラフセット理論によりラフセット決定ルールを構築する。最後に求まったラフセット決定ルールを用い,新規特許の分類を行う。 提案手法に基づき,Javaおよびライブラリを用いて実装したプログラムを構築した。このシステムを用い,専門家の協力のもと評価実験を行った。評価実験の結果,正答率としては一般的な手法であるナイーブベイズを用いた場合よりやや劣る結果となったが,適合率はナイーブベイズを上回る場合も見られた。このことから,本手法は一定の効果があると考えられる。 今後の課題としては,構築された決定ルールの検証,適切なパラメータ抽出方法の検討,機械学習手法による決定ルールの改善が挙げられる。
|