2011 Fiscal Year Annual Research Report
同義語抽出手法を利用した論文用語の特許用語への自動変換および情報検索への応用
Project/Area Number |
22700154
|
Research Institution | Hiroshima City University |
Principal Investigator |
難波 英嗣 広島市立大学, 情報科学研究科, 准教授 (50345378)
|
Keywords | 情報検索 / 言い換え / 論文 / 特許 / シソーラス |
Research Abstract |
近年、学術情報量が爆発的に増加し、専門家は自分の専門分野の最新動向を把握するために、絶えず膨大な量の文献を読まなければならない状況に直面している。また、研究分野の専門分化に伴い、ある分野の知識を得るために、さらに複数の別の分野についても知らなければならないということも、もはや一般的になりつつある。しかし、特許では権利範囲をなるべく広く確保するため、一般性の高い特許用語を用いて記述する傾向がある。このため、単純に表層的な単語の一致度を見るだけである従来の検索モデルでは、同じキーワードで特許データベースと論文データベースを検索しても、用語の使われ方の違いから、そのキーワードに関する論文や特許を十分に収集できるとは限らない。また、検索結果の文献数が膨大な場合、その全てに目を通すことは困難である。 平成23年度は、検索結果をわかりやすく提示するための基礎技術の開発を行った。あるキーワードに関する検索結果に複数のトピックの文献が混在する場合、それらはあらかじめトピックごとに自動分類した方が、結果の視認性が高い。これには文書分類技術が必要となるが、より高い精度で文書分類を行うには、同義語の認識が必要不可欠である。このため、日英上位・下位シソーラスを構築し、さらにそこから日本語および英語の同義語を抽出する手法を提案した。平成23年度は、この他、国立情報学研究所が提供する学術論文データベースCiNii(http://ci.nii.acjp)を対象に、あるキーワードに関する検索結果の文献をトピックごとに自動分類し、さらに各文献の概要から要素技術と効果を自動抽出・ハイライト表示するシステムCiNii Mining(http://www.ls.info.hiroshima-cu.acjp/cgi-bin/cinii.index.cgi)を構築した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「分かりやすい検索結果の表示」に用いる同義語抽出に関しては、十分な評価が行えておらず、その点では当初の計画よりも遅れているが、平成24年度に構築予定の検索システムのプロトタイプを平成23年度にすでに構築していることから、全体としてはおおむね順調に進展していると考えられる。
|
Strategy for Future Research Activity |
「分かりやすい検索結果の表示」に用いる同義語抽出について、早急に評価を行う。また、現在構築済のプロトタイプシステムを、実際のサービスとして利用可能なレベルにまで完成度を高める。
|
Research Products
(3 results)