2003 Fiscal Year Annual Research Report
科学論文検索・評価システムのためのリンク解析および文献同定手法の開発
Project/Area Number |
15700098
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
新保 仁 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (90311589)
|
Keywords | 情報検索 / 計量書誌学 / 引用解析 / リンク解析 / 論文データベース / 共引用解析 / Merge-purge問題 / Citation indexing |
Research Abstract |
本年度の主要な成果は以下のとおり. 1.参考文献データの同定手法の提案. 過去の文献同定手法がいずれも,たかだか数個の特徴量を手掛かりとして用いているのに対し,1200もの特徴量を用いる手法を提案した.多数の特徴量の使用により,より高い精度の同定が可能になると期待されるが,問題となるのは,そのような多数の特徴量をいかにして組みあわせるかという点である.われわれは,Support Vector Machineを用いて,個々の特徴量にあたえる重みを調整しこれを解決した. 2.カーネル法に基づく各種計量書誌学的尺度の解釈法の提案. 論文検索システムのユーザにとって,ある既知の(手元にある)論文に内容的に関連する論文をできるだけ多く,ただし,なんらかの重要さに応じてランク付けして提示してほしい,という要求は自然なものである.科学論文の関連度,重要度の算出を論文間の引用関係から導出する各種の尺度が,計量書誌学,WWWリンク解析分野で提案されているが,過去これら尺度は個別に議論されており,関連度・重要度間の関係は不明確なままであった.われわれは,カーネル法がこの問題に対する解答を与えることを示した. 3.抄録文の構造を考慮した論文検索システムの試作. WWW上で,論文の抄録が比較的容易にアクセスできるようになってきたが,それらに対する検索の手段は旧来どおりキーワードを用いた全文検索にとどまっている.抄録文には一定の構造があると仮定し,この構造を自然言語処理技術を用いて推定し,検索に応用するためのシステムを試作した.
|
Research Products
(6 results)
-
[Publications] 伊藤敬彦, 堀部史郎, 新保仁, 松本裕治: "複数尺度を用いた参考文献の同定"情報処理学会・テータベース/情報学基礎・合同研究報告2003-DBS-130/2003-FI-71. Vol.2003, No.51. 181-188 (2003)
-
[Publications] M.Shimbo, T.Ishida: "Controlling the learning process of real-time heuristic search"Artificial Intelligence. Vol.146, Issue1. 1-41 (2003)
-
[Publications] T.Yamasaki, M.Shimbo, Y.Matsumoto: "A MEDLINE document search system using section information"人工知能学会研究会資料SIG-KBS-A301. 25-30 (2003)
-
[Publications] T.Ito, T.Kudo, C.Hore, M.Shimbo, Y.Matsumoto: "Computing citation relatedness using kernels (preliminary report)"人工知能学会研究会資料SIG-KBS-A301. 93-98 (2003)
-
[Publications] M.Shimbo, T.Yamasaki, Y.Matsumoto: "Using sectioning information for text retrieval : a case study with the MEDLINE abstracts"Proceedings of the Second International Workshop on Active Mining. 32-41 (2003)
-
[Publications] 伊藤敬彦, 新保仁, 工藤拓, 松本裕治: "カーネル法による計量書誌尺度の統一的解釈"情報処理学会知能と複雑系研究報告2004-ICS-135. Vol.2004, No.29. 119-124 (2004)