1. 論文情報システムのマッシュアップ 既存のWeb APIに基づくマッシュアップを想定し、論文検索システムを連携する仕組みについて検討した。特に、論文の同定について検討し、教育研究論文索引(以降はEpiと呼ぶ)とCiniiとの論文単位のリンケージについて検討した。多少異なる記述があっても同一候補を提示する仕組み(iLinkage)を利用して、その候補の中から人手で同定判定を行った。約15万件件のうち、サンプル調査の結果を元に、約10万件を判定し約9万件が共通するレコードであった。これまで開発してきたプロトタイプシステムにこのデータを組み込み、EpiからCiniiへの論文リンクを実現した。 2. ふわっと関連検索の開発 どのようなマッシュアップ形態がありえるかについて検討した。マッシュアップ実験の1つとして、任意1のテキストを対象に、そのテキストに類似した文書の検索を実現する手法「ふわっと関連検索」を開発した。この手法は通常の検索システムが提供するキーワード検索機能だけを利用するため、既存のシステムに手を加える必要なく、API活用の利点をそのまま活かせ、容易に多くのシステムに対応可能にする。様々なWeb API(Cinii、Worldcatなど)に適用し、Webに公開した。公開から一カ月で2000件程度のアクセスを集め、有用性を認めた。また、ふわっと関連検索の検索結果および抽出キーワードをさらに外部公開するAPIも公開し、これを外部サイト上でそのまま利用できるようにした。 3. Code4lib2010の参加と報告会 図書情報、論文情報などWeb APIのマッシュアップ技術、適用例の情報収集のため、Code4Lib2010カンファレンスに参加した。参加して得られた情報は、日本のコミュニティでの共有を図るために、報告会を開催した。報告会はUstreamで配信、録画も行い、Webにおいて公開した。
|