2010 Fiscal Year Annual Research Report
同義語抽出手法を利用した論文用語の特許用語への自動変換および情報検索への応用
Project/Area Number |
22700154
|
Research Institution | Hiroshima City University |
Principal Investigator |
難波 英嗣 広島市立大学, 情報科学研究科, 准教授 (50345378)
|
Keywords | 情報検索 / 言い換え / 論文 / 特許 / 文書分類 / 引用分析 / シソーラス |
Research Abstract |
近年、学術情報量が爆発的に増加し、専門家は自分の専門分野の最新動向を把握するために、絶えず膨大な量の文献を読まなければならない状況に直面している。また、研究分野の専門分化に伴い、ある分野の知識を得るために、さらに複数の別の分野についても知らなければならないということも、もはや一般的になりつつある。しかし、特許では権利範囲をなるべく広く確保するため、一般性の高い特許用語を用いて記述する傾向がある。このため、単純に表層的な単語の一致度を見るだけである従来の検索モデルでは、同じキーワードで特許データベースと論文データベースを検索しても、用語の使われ方の違いから、そのキーワードに関する論文や特許を十分に収集できるとは限らない。また、検索結果の文献数が膨大な場合、その全てに目を通すことは困難である。 平成22年度は、2種類の同義語抽出手法を利用した論文用語の特許用語への自動変換手法:(1)統計翻訳技術を用いた手法と(2)分布類似度を用いた手法を提案した。提案手法の有効性を確認するため、NTCIR-7特許マイニングタスクのデータを用い、学術論文を国際特許分類(IPC)に自動分類する実験を行った。実験の結果、統計翻訳技術を用いた変換手法はIPCのサブグループレベルでベースライン手法のMAP値を0.0020、分布類似度を用いた手法はIPCをサブクラスレベルでベースライン手法を0.0024向上できることが確認された。
|
Research Products
(2 results)