研究概要 |
本研究では学術文献を単純なキーワード検索などより低コストで検索するために,論文間の様々な関係を利用した高度な検索方法を開発することを目的としている.そのための手法としてデータマイニングの手法を用いて論文間のアソシエーションルールを発見し,そのルールと参照関係から研究の発展経緯を抽出する"リサーチマイニング手法"を提案している. 本年度はまず,Web上で広く利用されている文献情報サイトであるDBLPの全データを対象にし,大規模な書誌情報データの効率の良い管理/格納方法を検討し,次に提案手法であるリサーチマイニング手法の効率化,高速化を検討し,昨年度の試作ツールの改良改善を行った.データの蓄積量に比例して抽出される発展経緯も増加するため,その処理方法や表示方法の検討を行った.特に発展経緯の数が増加した場合に,クラスタ化による抽象化表示は重要であるため,クラスタ化のアルゴリズムに関して検討を行った. さらに,研究者間の関係を文献情報等から抽出した多種類の関係を用いてネットワーク化し,研究者間の新たな関係や論文を発見することを目的としたシステムを提案し,その中で提案手法により抽出された発展経緯を利用する方法を提案した.提案手法によって抽出された研究の発展経緯の関係は単なる共引用関係ではないため,抽出される数が少ないものの,適切に論文間での発展経緯を表現することから,研究者間の関係を表現する接続としても利用できることがわかった.また,研究者間の関係を利用することで,論文の検索に役立つ情報をも与えることができたと考える.
|