• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

ソーシャルネットワークを利用した書誌マイニングに関する研究

Research Project

Project/Area Number 21650052
Research InstitutionNational Institute of Japanese Literature

Principal Investigator

野本 忠司  National Institute of Japanese Literature, 複合領域研究系, 准教授 (20321557)

Co-Investigator(Kenkyū-buntansha) 相田 満  国文学研究資料館, アーカイブズ研究系, 助教 (00249921)
Keywords情報検索 / 図書館情報 / OPAC / 機械学習 / テキスト自動分類
Research Abstract

21年度実施内容
本年度は、著者プロファイルの提案とその有効性を書誌レコードの自動分類を通して検討した。著者プロファイルとは、著者の特徴を、自身及びN次共著者の出版物の日本十進法に基づく分布として表したものである。(N次共著者とは、起点著者とOPACを介して最大Nステップの共著関係で到達できるすべての著者である。つまり、起点著者と直接共著関係にある共著者は、起点著者を含め一次共著者、二次共著者は一次共著者及び一次共著者の共著者となる。)著者プロファイルの有効性を実験的に検証するため、国会図書館のOPACサービスを利用し著者プロファイルを構成、国立国会図書館がオンラインで提供している全国書誌目録を使い、目録の自動分類の精度を測った。分類モデルとして、著者プロファイルと、分野別に用意したサポート・ベクタ・マシーンを均等混合した複合型弁別器を用いた(実際には統計ソフトR用に構成されたオープンソースのkernlabを使用した。)実験データとしては、国会図書館のウェブサイトよりダウンロードした2006年度の全国書誌目録の中から無作為に選別した2,600件の書誌目録(訓練レコード1,600件、テストレコード1,000件)を用いた。実験の結果、分野間で多少のバラツキはあるものの、著者プロファイルが分類精度の向上に顕著な効果があることが確認された。特に共著次数が2のとき、精度が最大になることが分かった。この結果は、著者と2次共著者の出版歴が、その著者の今後の出版分野を推定するのに有効であることを示唆している。なお、今回の研究の詳細は国際会議ACM/SIGIR 2009及び総研大フォーラムにて発表した。

  • Research Products

    (2 results)

All 2009

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (1 results)

  • [Journal Article] Classifying Library Catalogue by Author Profiling2009

    • Author(s)
      Tadashi Nomoto
    • Journal Title

      Proceedings of the 32nd international ACM SIGIR conference on Research and development in information retrieval

      Pages: 644-645

    • Peer Reviewed
  • [Presentation] 著者プロファイルを利用した日本全国書誌の自動分類(ポスター)2009

    • Author(s)
      野本忠司
    • Organizer
      総研大フォーラム
    • Place of Presentation
      国立民族学博物館
    • Year and Date
      2009-10-17

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi