研究概要 |
本研究では学術文献を単純なキーワード検索などより低コストで検索するために,論文間の様々な関係を利用した高度な検索方法を開発することを目的としている.そのための手法としてデータマイニングの手法を用いて論文間のアソシエーションルールを発見し,そのルールと参照関係から研究の発展経緯を抽出する"リサーチマイニング手法"を提案している. 本年度は,Web上で広く利用されている文献データベースであるCiteSeerを利用して,検索キーワードに関連する論文とそれらの参照/被参照論文の情報を取得し,その情報に対して,リサーチマイニング手法を適用する実験を行うことで本手法の有効性を確認した.また,それらのデータに対し既存の書誌情報解析手法との比較実験を行い,リサーチマイニング手法の特徴の明確化し,その長所として,1)共引用分析と書誌結合に比べ,参照回数のばらつきに影響されない,2)論文の発展経緯ならびに論文の集合としての研究の発展経緯を抽出可能,といった点を明らかにした. また,本手法を利用した検索システムの実現に向けた研究として,提案手法で抽出された研究の発展経緯を,クラスタリングし,マクロな視点での発展経緯として表示するためのパラメータの影響度に関して調査し,その設定指針を明らかにした. さらに,提案手法で抽出される研究の発展経緯と,それぞれの論文やクラスタの情報とともに表示するシステムの試作を行い,研究の発展経緯を容易に利用できる基盤を構築した.実装したシステムは,リサーチマイニング手法によって抽出した研究の発展経緯の情報を持つサーバ部と,グラフ構造の表示ツールであるTouchGraphを用いて作成されたグラフ選択/表示クライアント部からなり,発展経緯や論文情報の表示機能のほかに,前述のクラスタリングのパラメータ設定指針に基づくパラメータ指定支援の機能も実装している.
|