• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

機械学習による統合的書誌メタ情報編集システムの実装

研究課題

研究課題/領域番号 24300097
研究種目

基盤研究(B)

配分区分一部基金
応募区分一般
研究分野 図書館情報学・人文社会情報学
研究機関国立情報学研究所

研究代表者

安達 淳  国立情報学研究所, コンテンツ科学研究系, 教授 (80143551)

研究分担者 太田 学  岡山大学, 自然科学研究科, 教授 (10326019)
連携研究者 高須 淳宏  国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
研究期間 (年度) 2012-04-01 – 2015-03-31
研究課題ステータス 完了 (2014年度)
配分額 *注記
16,900千円 (直接経費: 13,000千円、間接経費: 3,900千円)
2014年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
2013年度: 5,720千円 (直接経費: 4,400千円、間接経費: 1,320千円)
2012年度: 5,200千円 (直接経費: 4,000千円、間接経費: 1,200千円)
キーワード書誌パージング / メタデータ / コーパス / CRF / 機関リポジトリ / テキストマイニング
研究成果の概要

本研究は、統合的なメタ情報編集の環境として、電子文書の中からメタ情報を抽出し、その編集とともに他のデータベースと付き合わせて同定を精度良く行うためのシステムの実装を目指した。そのため、学術論文をレイアウト解析し、メタ情報として書誌および引用文献情報を高精度かつ低コストに抽出する方法を提案した。また書誌情報抽出法の評価などのために、学術論文の書誌メタ情報アノテーション付き参考文献文字列コーパスを作成した。

報告書

(4件)
  • 2014 実績報告書   研究成果報告書 ( PDF )
  • 2013 実績報告書
  • 2012 実績報告書
  • 研究成果

    (22件)

すべて 2015 2014 2013 2012

すべて 雑誌論文 (8件) (うち査読あり 8件) 学会発表 (14件)

  • [雑誌論文] 少量学習データによる参考文献書誌情報抽出精度の向上2015

    • 著者名/発表者名
      川上 尚慶, 太田 学, 高須 淳宏, 安達 淳
    • 雑誌名

      情報処理学会論文誌:データベース

      巻: 8

    • NAID

      170000147385

    • 関連する報告書
      2014 実績報告書
    • 査読あり
  • [雑誌論文] Cost Evaluation of CRF-Based Bibliography Extraction from Reference Strings2014

    • 著者名/発表者名
      Naomichi Kawakami, Manabu Ohta, Atsuhiro Takasu, and Jun Adachi
    • 雑誌名

      Proc. of 16th International Conference on Asia-Pacific Digital Libraries (ICADL 2014)

      巻: LNCS 8839 ページ: 268-278

    • DOI

      10.1007/978-3-319-12823-8_28

    • ISBN
      9783319128221, 9783319128238
    • 関連する報告書
      2014 実績報告書
    • 査読あり
  • [雑誌論文] Rule management for information extraction from title pages of academic papers2014

    • 著者名/発表者名
      Atsuhiro Takasu and Manabu Ohta
    • 雑誌名

      Proc. of Third International Conference on Pattern Recognition Applications and Methods (ICPRAM 2014)

      巻: - ページ: 438-444

    • DOI

      10.5220/0004827204380444

    • 関連する報告書
      2013 実績報告書
    • 査読あり
  • [雑誌論文] Empirical evaluation of CRF-based bibliography extraction from reference strings2014

    • 著者名/発表者名
      Manabu Ohta, Daiki Arauchi, Atsuhiro Takasu, and Jun Adachi
    • 雑誌名

      Proc. of 11th IAPR International Workshop on Document Analysis Systems (DAS 2014)

      巻: - ページ: 287-292

    • 関連する報告書
      2013 実績報告書
    • 査読あり
  • [雑誌論文] A document analysis system for linking cross-document entities2012

    • 著者名/発表者名
      Manabu Ohta and Atsuhiro Takasu
    • 雑誌名

      Proc. of the Fourth International Conference on Creative Content Technologies (CONTENT 2012)

      ページ: 14-20

    • 関連する報告書
      2012 実績報告書
    • 査読あり
  • [雑誌論文] CRFによる学術論文タイトルページからの書誌情報抽出における誤り検出2012

    • 著者名/発表者名
      太田学, 井上諒平, 高須淳宏
    • 雑誌名

      日本データベース学会論文誌

      巻: 11 ページ: 37-42

    • NAID

      40019501165

    • 関連する報告書
      2012 実績報告書
    • 査読あり
  • [雑誌論文] Error detection of CRF-based bibliography extraction from reference strings2012

    • 著者名/発表者名
      Manabu Ohta, Daiki Arauchi, Atsuhiro Takasu, and Jun Adachi
    • 雑誌名

      Proc. of 14th International Conference on Asia-Pacific Digital Libraries (ICADL 2012)

      巻: LNCS 7634 ページ: 229-238

    • DOI

      10.1007/978-3-642-34752-8_29

    • ISBN
      9783642347511, 9783642347528
    • 関連する報告書
      2012 実績報告書
    • 査読あり
  • [雑誌論文] Empirical evaluation of CRF-based bibliography extraction from research papers2012

    • 著者名/発表者名
      Manabu Ohta, Ryohei Inoue, and Atsuhiro Takasu
    • 雑誌名

      IADIS International Journal on Computer Science and Information Systems

      巻: 7 ページ: 18-31

    • 関連する報告書
      2012 実績報告書
    • 査読あり
  • [学会発表] 学術論文からの実験情報抽出の一手法2015

    • 著者名/発表者名
      平井 久貴, 新妻 弘崇, 太田 学, 高須 淳宏
    • 学会等名
      第7回データ工学と情報マネジメントに関するフォーラム (DEIM2015)
    • 発表場所
      磐梯熱海ホテル華の湯(福島県郡山市)
    • 年月日
      2015-03-02 – 2015-03-04
    • 関連する報告書
      2014 実績報告書
  • [学会発表] 引用意図を利用した学術論文閲覧支援のための適切な被引用箇所の特定2015

    • 著者名/発表者名
      石井 仁子, 太田 学, 高須 淳宏
    • 学会等名
      第7回データ工学と情報マネジメントに関するフォーラム (DEIM2015)
    • 発表場所
      磐梯熱海ホテル華の湯(福島県郡山市)
    • 年月日
      2015-03-02 – 2015-03-04
    • 関連する報告書
      2014 実績報告書
  • [学会発表] 学術論文からの構成要素抽出手法の改良2015

    • 著者名/発表者名
      樫本 達矢, 太田 学, 高須 淳宏
    • 学会等名
      第7回データ工学と情報マネジメントに関するフォーラム (DEIM2015)
    • 発表場所
      磐梯熱海ホテル華の湯(福島県郡山市)
    • 年月日
      2015-03-02 – 2015-03-04
    • 関連する報告書
      2014 実績報告書
  • [学会発表] CRFによる様々な種類の学術論文からの参考文献文字列の自動抽出2015

    • 著者名/発表者名
      赤澤 琢朗, 太田 学, 高須 淳宏, 安達 淳
    • 学会等名
      第7回データ工学と情報マネジメントに関するフォーラム (DEIM2015)
    • 発表場所
      磐梯熱海ホテル華の湯(福島県郡山市)
    • 年月日
      2015-03-02 – 2015-03-04
    • 関連する報告書
      2014 実績報告書
  • [学会発表] 少量学習データによる参考文献書誌情報抽出2014

    • 著者名/発表者名
      川上 尚慶, 太田 学, 高須 淳宏, 安達 淳
    • 学会等名
      第7回Webとデータベースに関するフォーラム (WebDB Forum 2014)
    • 発表場所
      芝浦工業大学(東京都江東区)
    • 年月日
      2014-11-19 – 2014-11-20
    • 関連する報告書
      2014 実績報告書
  • [学会発表] 学術論文閲覧支援インタフェースのための頭字語の活用2014

    • 著者名/発表者名
      前野 明子, 太田 学, 高須 淳宏
    • 学会等名
      第160回DBS・第131回OS・第35回EMB合同研究発表会
    • 発表場所
      芝浦工業大学(東京都江東区)
    • 年月日
      2014-11-18
    • 関連する報告書
      2014 実績報告書
  • [学会発表] 学術論文閲覧支援インタフェースの試作2014

    • 著者名/発表者名
      前野 明子, 太田 学, 高須 淳宏
    • 学会等名
      第6回データ工学と情報マネジメントに関するフォーラム (DEIM2014)
    • 発表場所
      淡路夢舞台&ウェスティン淡路(兵庫)
    • 関連する報告書
      2013 実績報告書
  • [学会発表] 学術論文からの構成要素抽出の一手法2014

    • 著者名/発表者名
      樫本 達矢, 太田 学, 高須 淳宏
    • 学会等名
      第6回データ工学と情報マネジメントに関するフォーラム (DEIM2014)
    • 発表場所
      淡路夢舞台&ウェスティン淡路(兵庫)
    • 関連する報告書
      2013 実績報告書
  • [学会発表] CRFによる学術論文からの参考文献文字列の抽出2014

    • 著者名/発表者名
      石本 茜, 太田 学, 高須 淳宏, 安達 淳
    • 学会等名
      第6回データ工学と情報マネジメントに関するフォーラム (DEIM2014)
    • 発表場所
      淡路夢舞台&ウェスティン淡路(兵庫)
    • 関連する報告書
      2013 実績報告書
  • [学会発表] CRFによる参考文献書誌情報抽出のための学習コストの削減2014

    • 著者名/発表者名
      川上 尚慶, 太田 学, 高須 淳宏, 安達 淳
    • 学会等名
      第6回データ工学と情報マネジメントに関するフォーラム (DEIM2014)
    • 発表場所
      淡路夢舞台&ウェスティン淡路(兵庫)
    • 関連する報告書
      2013 実績報告書
  • [学会発表] CRFによる学術論文からの実験情報抽出の一手法2014

    • 著者名/発表者名
      平井 久貴, 新妻 弘崇, 太田 学
    • 学会等名
      電子情報通信学会2014年総合大会, 情報・システムソサイエティ特別企画学生ポスターセッション
    • 発表場所
      新潟大学(新潟)
    • 関連する報告書
      2013 実績報告書
  • [学会発表] 文献種類別に分類した参考文献文字列からの書誌情報抽出の一手法2013

    • 著者名/発表者名
      川上尚慶, 荒内大貴, 太田学, 高須淳宏, 安達淳
    • 学会等名
      第5回データ工学と情報マネジメントに関するフォーラム(DEIM 2013)
    • 発表場所
      ホテル華の湯(福島)
    • 関連する報告書
      2012 実績報告書
  • [学会発表] データ工学に関する学術論文からの実験情報抽出の試み2013

    • 著者名/発表者名
      樫本達矢, 荒内大貴, 太田学
    • 学会等名
      電子情報通信学会2013年総合大会, 情報・システムソサイエティ特別企画学生ポスターセッション
    • 発表場所
      岐阜大学(岐阜)
    • 関連する報告書
      2012 実績報告書
  • [学会発表] CRFによる和英文の参考文献文字列からの自動書誌要素抽出2012

    • 著者名/発表者名
      荒内大貴, 太田・学, 高須淳宏, 安達淳
    • 学会等名
      情報処理学会第156回データベースシステム研究発表会
    • 発表場所
      キャンパスプラザ京都(京都)
    • 関連する報告書
      2012 実績報告書

URL: 

公開日: 2012-04-24   更新日: 2019-07-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi