• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Implementation of an Integrated System for Editing Meta Data Using Machine Learning Techniques

Research Project

Project/Area Number 24300097
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypePartial Multi-year Fund
Section一般
Research Field Library and information science/Humanistic social informatics
Research InstitutionNational Institute of Informatics

Principal Investigator

ADACHI Jun  国立情報学研究所, コンテンツ科学研究系, 教授 (80143551)

Co-Investigator(Kenkyū-buntansha) OHTA Manabu  岡山大学, 自然科学研究科, 教授 (10326019)
Co-Investigator(Renkei-kenkyūsha) TAKASU Atsuhiro  国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
Project Period (FY) 2012-04-01 – 2015-03-31
Project Status Completed (Fiscal Year 2014)
Budget Amount *help
¥16,900,000 (Direct Cost: ¥13,000,000、Indirect Cost: ¥3,900,000)
Fiscal Year 2014: ¥5,980,000 (Direct Cost: ¥4,600,000、Indirect Cost: ¥1,380,000)
Fiscal Year 2013: ¥5,720,000 (Direct Cost: ¥4,400,000、Indirect Cost: ¥1,320,000)
Fiscal Year 2012: ¥5,200,000 (Direct Cost: ¥4,000,000、Indirect Cost: ¥1,200,000)
Keywords書誌パージング / メタデータ / コーパス / CRF / 機関リポジトリ / テキストマイニング
Outline of Final Research Achievements

The purpose of this study is to implement a system which extracts meta data from digital documents to edit and identify the meta data accurately by matching against other databases as an integrated environment for editing such meta data. We proposed accurate and inexpensive methods to extract bibliographic and citation information as meta data from research papers of which the layout was analyzed. We also created several reference string corpora of research papers by annotating the reference strings with bibliographic information for evaluating bibliographic information extraction methods.

Report

(4 results)
  • 2014 Annual Research Report   Final Research Report ( PDF )
  • 2013 Annual Research Report
  • 2012 Annual Research Report
  • Research Products

    (22 results)

All 2015 2014 2013 2012

All Journal Article (8 results) (of which Peer Reviewed: 8 results) Presentation (14 results)

  • [Journal Article] 少量学習データによる参考文献書誌情報抽出精度の向上2015

    • Author(s)
      川上 尚慶, 太田 学, 高須 淳宏, 安達 淳
    • Journal Title

      情報処理学会論文誌:データベース

      Volume: 8

    • NAID

      170000147385

    • Related Report
      2014 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Cost Evaluation of CRF-Based Bibliography Extraction from Reference Strings2014

    • Author(s)
      Naomichi Kawakami, Manabu Ohta, Atsuhiro Takasu, and Jun Adachi
    • Journal Title

      Proc. of 16th International Conference on Asia-Pacific Digital Libraries (ICADL 2014)

      Volume: LNCS 8839 Pages: 268-278

    • DOI

      10.1007/978-3-319-12823-8_28

    • ISBN
      9783319128221, 9783319128238
    • Related Report
      2014 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Rule management for information extraction from title pages of academic papers2014

    • Author(s)
      Atsuhiro Takasu and Manabu Ohta
    • Journal Title

      Proc. of Third International Conference on Pattern Recognition Applications and Methods (ICPRAM 2014)

      Volume: - Pages: 438-444

    • DOI

      10.5220/0004827204380444

    • Related Report
      2013 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Empirical evaluation of CRF-based bibliography extraction from reference strings2014

    • Author(s)
      Manabu Ohta, Daiki Arauchi, Atsuhiro Takasu, and Jun Adachi
    • Journal Title

      Proc. of 11th IAPR International Workshop on Document Analysis Systems (DAS 2014)

      Volume: - Pages: 287-292

    • Related Report
      2013 Annual Research Report
    • Peer Reviewed
  • [Journal Article] A document analysis system for linking cross-document entities2012

    • Author(s)
      Manabu Ohta and Atsuhiro Takasu
    • Journal Title

      Proc. of the Fourth International Conference on Creative Content Technologies (CONTENT 2012)

      Pages: 14-20

    • Related Report
      2012 Annual Research Report
    • Peer Reviewed
  • [Journal Article] CRFによる学術論文タイトルページからの書誌情報抽出における誤り検出2012

    • Author(s)
      太田学, 井上諒平, 高須淳宏
    • Journal Title

      日本データベース学会論文誌

      Volume: 11 Pages: 37-42

    • NAID

      40019501165

    • Related Report
      2012 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Error detection of CRF-based bibliography extraction from reference strings2012

    • Author(s)
      Manabu Ohta, Daiki Arauchi, Atsuhiro Takasu, and Jun Adachi
    • Journal Title

      Proc. of 14th International Conference on Asia-Pacific Digital Libraries (ICADL 2012)

      Volume: LNCS 7634 Pages: 229-238

    • DOI

      10.1007/978-3-642-34752-8_29

    • ISBN
      9783642347511, 9783642347528
    • Related Report
      2012 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Empirical evaluation of CRF-based bibliography extraction from research papers2012

    • Author(s)
      Manabu Ohta, Ryohei Inoue, and Atsuhiro Takasu
    • Journal Title

      IADIS International Journal on Computer Science and Information Systems

      Volume: 7 Pages: 18-31

    • Related Report
      2012 Annual Research Report
    • Peer Reviewed
  • [Presentation] 学術論文からの実験情報抽出の一手法2015

    • Author(s)
      平井 久貴, 新妻 弘崇, 太田 学, 高須 淳宏
    • Organizer
      第7回データ工学と情報マネジメントに関するフォーラム (DEIM2015)
    • Place of Presentation
      磐梯熱海ホテル華の湯(福島県郡山市)
    • Year and Date
      2015-03-02 – 2015-03-04
    • Related Report
      2014 Annual Research Report
  • [Presentation] 引用意図を利用した学術論文閲覧支援のための適切な被引用箇所の特定2015

    • Author(s)
      石井 仁子, 太田 学, 高須 淳宏
    • Organizer
      第7回データ工学と情報マネジメントに関するフォーラム (DEIM2015)
    • Place of Presentation
      磐梯熱海ホテル華の湯(福島県郡山市)
    • Year and Date
      2015-03-02 – 2015-03-04
    • Related Report
      2014 Annual Research Report
  • [Presentation] 学術論文からの構成要素抽出手法の改良2015

    • Author(s)
      樫本 達矢, 太田 学, 高須 淳宏
    • Organizer
      第7回データ工学と情報マネジメントに関するフォーラム (DEIM2015)
    • Place of Presentation
      磐梯熱海ホテル華の湯(福島県郡山市)
    • Year and Date
      2015-03-02 – 2015-03-04
    • Related Report
      2014 Annual Research Report
  • [Presentation] CRFによる様々な種類の学術論文からの参考文献文字列の自動抽出2015

    • Author(s)
      赤澤 琢朗, 太田 学, 高須 淳宏, 安達 淳
    • Organizer
      第7回データ工学と情報マネジメントに関するフォーラム (DEIM2015)
    • Place of Presentation
      磐梯熱海ホテル華の湯(福島県郡山市)
    • Year and Date
      2015-03-02 – 2015-03-04
    • Related Report
      2014 Annual Research Report
  • [Presentation] 少量学習データによる参考文献書誌情報抽出2014

    • Author(s)
      川上 尚慶, 太田 学, 高須 淳宏, 安達 淳
    • Organizer
      第7回Webとデータベースに関するフォーラム (WebDB Forum 2014)
    • Place of Presentation
      芝浦工業大学(東京都江東区)
    • Year and Date
      2014-11-19 – 2014-11-20
    • Related Report
      2014 Annual Research Report
  • [Presentation] 学術論文閲覧支援インタフェースのための頭字語の活用2014

    • Author(s)
      前野 明子, 太田 学, 高須 淳宏
    • Organizer
      第160回DBS・第131回OS・第35回EMB合同研究発表会
    • Place of Presentation
      芝浦工業大学(東京都江東区)
    • Year and Date
      2014-11-18
    • Related Report
      2014 Annual Research Report
  • [Presentation] 学術論文閲覧支援インタフェースの試作2014

    • Author(s)
      前野 明子, 太田 学, 高須 淳宏
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム (DEIM2014)
    • Place of Presentation
      淡路夢舞台&ウェスティン淡路(兵庫)
    • Related Report
      2013 Annual Research Report
  • [Presentation] 学術論文からの構成要素抽出の一手法2014

    • Author(s)
      樫本 達矢, 太田 学, 高須 淳宏
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム (DEIM2014)
    • Place of Presentation
      淡路夢舞台&ウェスティン淡路(兵庫)
    • Related Report
      2013 Annual Research Report
  • [Presentation] CRFによる学術論文からの参考文献文字列の抽出2014

    • Author(s)
      石本 茜, 太田 学, 高須 淳宏, 安達 淳
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム (DEIM2014)
    • Place of Presentation
      淡路夢舞台&ウェスティン淡路(兵庫)
    • Related Report
      2013 Annual Research Report
  • [Presentation] CRFによる参考文献書誌情報抽出のための学習コストの削減2014

    • Author(s)
      川上 尚慶, 太田 学, 高須 淳宏, 安達 淳
    • Organizer
      第6回データ工学と情報マネジメントに関するフォーラム (DEIM2014)
    • Place of Presentation
      淡路夢舞台&ウェスティン淡路(兵庫)
    • Related Report
      2013 Annual Research Report
  • [Presentation] CRFによる学術論文からの実験情報抽出の一手法2014

    • Author(s)
      平井 久貴, 新妻 弘崇, 太田 学
    • Organizer
      電子情報通信学会2014年総合大会, 情報・システムソサイエティ特別企画学生ポスターセッション
    • Place of Presentation
      新潟大学(新潟)
    • Related Report
      2013 Annual Research Report
  • [Presentation] 文献種類別に分類した参考文献文字列からの書誌情報抽出の一手法2013

    • Author(s)
      川上尚慶, 荒内大貴, 太田学, 高須淳宏, 安達淳
    • Organizer
      第5回データ工学と情報マネジメントに関するフォーラム(DEIM 2013)
    • Place of Presentation
      ホテル華の湯(福島)
    • Related Report
      2012 Annual Research Report
  • [Presentation] データ工学に関する学術論文からの実験情報抽出の試み2013

    • Author(s)
      樫本達矢, 荒内大貴, 太田学
    • Organizer
      電子情報通信学会2013年総合大会, 情報・システムソサイエティ特別企画学生ポスターセッション
    • Place of Presentation
      岐阜大学(岐阜)
    • Related Report
      2012 Annual Research Report
  • [Presentation] CRFによる和英文の参考文献文字列からの自動書誌要素抽出2012

    • Author(s)
      荒内大貴, 太田・学, 高須淳宏, 安達淳
    • Organizer
      情報処理学会第156回データベースシステム研究発表会
    • Place of Presentation
      キャンパスプラザ京都(京都)
    • Related Report
      2012 Annual Research Report

URL: 

Published: 2012-04-24   Modified: 2019-07-29  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi