研究概要 |
本年度の主要な成果は以下のとおり. 1.参考文献データの同定手法の提案. 過去の文献同定手法がいずれも,たかだか数個の特徴量を手掛かりとして用いているのに対し,1200もの特徴量を用いる手法を提案した.多数の特徴量の使用により,より高い精度の同定が可能になると期待されるが,問題となるのは,そのような多数の特徴量をいかにして組みあわせるかという点である.われわれは,Support Vector Machineを用いて,個々の特徴量にあたえる重みを調整しこれを解決した. 2.カーネル法に基づく各種計量書誌学的尺度の解釈法の提案. 論文検索システムのユーザにとって,ある既知の(手元にある)論文に内容的に関連する論文をできるだけ多く,ただし,なんらかの重要さに応じてランク付けして提示してほしい,という要求は自然なものである.科学論文の関連度,重要度の算出を論文間の引用関係から導出する各種の尺度が,計量書誌学,WWWリンク解析分野で提案されているが,過去これら尺度は個別に議論されており,関連度・重要度間の関係は不明確なままであった.われわれは,カーネル法がこの問題に対する解答を与えることを示した. 3.抄録文の構造を考慮した論文検索システムの試作. WWW上で,論文の抄録が比較的容易にアクセスできるようになってきたが,それらに対する検索の手段は旧来どおりキーワードを用いた全文検索にとどまっている.抄録文には一定の構造があると仮定し,この構造を自然言語処理技術を用いて推定し,検索に応用するためのシステムを試作した.
|