• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Cost-Sensitive Information Extraction and Cyber-Physical Browsing Support for Academic Papers

Research Project

Project/Area Number 18K11989
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 90020:Library and information science, humanistic and social informatics-related
Research InstitutionOkayama University

Principal Investigator

Ohta Manabu  岡山大学, 自然科学学域, 教授 (10326019)

Project Period (FY) 2018-04-01 – 2023-03-31
Project Status Completed (Fiscal Year 2022)
Budget Amount *help
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2020: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2019: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2018: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
Keywords電子図書館 / 学術論文 / 情報抽出 / メタデータ / 閲覧支援 / サイバーフィジカル / 表構造解析 / 機械学習 / ウェブ
Outline of Final Research Achievements

In this study, we proposed two methods to extract bibliographic information from academic papers' references in a cost-sensitive manner. Through experiments, we quantitatively demonstrated the relationship between the amount of training data for the extractor and the extraction accuracy. We also explored the potential of reducing training data by using active learning and pseudo-training data. Furthermore, we proposed a method to analyze table structures and automatically graph numerical data within tables. Additionally, as a cyber-physical paper browsing support, we devised a service that automatically collects relevant information from the cyberspace on citations in papers and makes it available to paper readers.

Academic Significance and Societal Importance of the Research Achievements

本研究で提案した参考文献書誌情報をコストセンシティブに抽出する技術は、電子図書館等において学術論文の書誌情報を整備する際に利用できる非常に有望な技術となっている。また提案した表構造解析手法は、近年提案された手法と比べて遜色のない表構造解析精度を達成している。一方、タブレット端末のカメラを通して紙の学術論文を読む読者へのサイバーフィジカル論文閲覧支援は、ウェアラブル端末を利用した近未来の読書のフィージビリティスタディとなっている。

Report

(6 results)
  • 2022 Annual Research Report   Final Research Report ( PDF )
  • 2021 Research-status Report
  • 2020 Research-status Report
  • 2019 Research-status Report
  • 2018 Research-status Report
  • Research Products

    (28 results)

All 2023 2022 2021 2020 2019 2018

All Journal Article (5 results) (of which Peer Reviewed: 5 results) Presentation (23 results)

  • [Journal Article] Table-structure Recognition Method Consisting of Plural Neural Network Modules2022

    • Author(s)
      Aoyagi Hiroyuki、Kanazawa Teruhito, Takasu Atsuhiro, Uwano Fumito, Ohta Manabu
    • Journal Title

      Proc. 11th International Conference on Pattern Recognition Applications and Methods (ICPRAM 2022)

      Volume: - Pages: 542-549

    • DOI

      10.5220/0010817700003122

    • Related Report
      2021 Research-status Report
    • Peer Reviewed
  • [Journal Article] Table-structure recognition method using neural networks for implicit ruled line estimation and cell estimation2021

    • Author(s)
      Ohta Manabu, Yamada Ryoya, Kanazawa Teruhito, Takasu Atsuhiro
    • Journal Title

      Proc. 21st ACM Symposium on Document Engineering (DocEng 2021)

      Volume: - Pages: 1-7

    • DOI

      10.1145/3469096.3469870

    • Related Report
      2021 Research-status Report
    • Peer Reviewed
  • [Journal Article] A Cell-detection-based Table-structure Recognition Method2019

    • Author(s)
      Manabu Ohta, Ryoya Yamada, Teruhito Kanazawa, Atsuhiro Takasu
    • Journal Title

      Proc. 19th ACM Symposium on Document Engineering (DocEng 2019)

      Volume: - Pages: 1-4

    • DOI

      10.1145/3342558.3345412

    • Related Report
      2019 Research-status Report
    • Peer Reviewed
  • [Journal Article] An Approach to Estimating Cited Sentences in Academic Papers Using Doc2vec2018

    • Author(s)
      Shunsuke Tanabe, Manabu Ohta, Atsuhiro Takasu, Jun Adachi
    • Journal Title

      Proc. 10th International Conference on Management of Digital EcoSystems (MEDES'18)

      Volume: - Pages: 118-125

    • DOI

      10.1145/3281375.3281391

    • Related Report
      2018 Research-status Report
    • Peer Reviewed
  • [Journal Article] An Automatic Graph Generation Method for Scholarly Papers Based on Table Structure Analysis2018

    • Author(s)
      Ryoya Yamada, Manabu Ohta, Atsuhiro Takasu
    • Journal Title

      Proc. 10th International Conference on Management of Digital EcoSystems (MEDES'18)

      Volume: - Pages: 132-140

    • DOI

      10.1145/3281375.3281389

    • Related Report
      2018 Research-status Report
    • Peer Reviewed
  • [Presentation] 文の類似度と Extractive QA による被引用文特定の一手法2023

    • Author(s)
      西海真祥, 金澤輝一, 上野史, 太田学
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム (DEIM2023)
    • Related Report
      2022 Annual Research Report
  • [Presentation] BERTによる参考文献書誌情報抽出の誤り検出の評価2023

    • Author(s)
      中山竣平, 金澤輝一, 高須淳宏, 上野史, 太田学
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム (DEIM2023)
    • Related Report
      2022 Annual Research Report
  • [Presentation] グラフニューラルネットワークを用いたエンドツーエンド表構造解析手法の提案2023

    • Author(s)
      青柳拓志, 金澤輝一, 高須淳宏, 上野史, 太田学
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム (DEIM2023)
    • Related Report
      2022 Annual Research Report
  • [Presentation] ニューラルネットワークによる日本語を含む表の構造解析の一手法2023

    • Author(s)
      細谷亮太, 金澤輝一, 上野史, 太田学
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム (DEIM2023)
    • Related Report
      2022 Annual Research Report
  • [Presentation] 初学者の論文閲覧支援のための日本語論文からの専門用語抽出の一手法2023

    • Author(s)
      高橋春成, 金澤輝一, 上野史, 太田学
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム (DEIM2023)
    • Related Report
      2022 Annual Research Report
  • [Presentation] 引用意図を利用した初学者向け学術論文閲覧支援方法の検討2022

    • Author(s)
      西海真祥, 金澤輝一, 上野史, 太田学
    • Organizer
      第21回情報科学技術フォーラム (FIT2022)
    • Related Report
      2022 Annual Research Report
  • [Presentation] 表検出を含むエンドツーエンド表構造解析手法の評価2022

    • Author(s)
      青柳拓志, 金澤輝一, 高須淳宏, 上野史, 太田学
    • Organizer
      ARG 第18回Webインテリジェンスとインタラクション研究会
    • Related Report
      2022 Annual Research Report
  • [Presentation] BERTによる和文の参考文献文字列からの書誌情報抽出の評価2022

    • Author(s)
      高橋春成, 金澤輝一, 高須淳宏, 上野史, 太田学
    • Organizer
      第14回データ工学と情報マネジメントに関するフォーラム (DEIM2022)
    • Related Report
      2021 Research-status Report
  • [Presentation] BERTによる参考文献書誌情報抽出における擬似学習データの有効性評価2021

    • Author(s)
      荒川瞭平, 金澤輝一, 高須淳宏, 上野史, 太田学
    • Organizer
      ARG 第17回Webインテリジェンスとインタラクション研究会
    • Related Report
      2021 Research-status Report
  • [Presentation] ニューラルネットワークを用いた表構造解析の一手法2021

    • Author(s)
      青柳拓志, 金澤輝一, 高須淳宏, 上野史, 太田学
    • Organizer
      第13回データ工学と情報マネジメントに関するフォーラム (DEIM2021)
    • Related Report
      2020 Research-status Report
  • [Presentation] 引用意図を利用した学術論文閲覧支援情報生成の一手法2021

    • Author(s)
      西海真祥, 金澤輝一, 高須淳宏, 上野史, 太田学
    • Organizer
      第13回データ工学と情報マネジメントに関するフォーラム (DEIM2021)
    • Related Report
      2020 Research-status Report
  • [Presentation] ユーザの興味を利用した学術論文閲覧支援の一手法2021

    • Author(s)
      岩本拓実, 金澤輝一, 上野史, 太田学
    • Organizer
      情報処理学会第83回全国大会
    • Related Report
      2020 Research-status Report
  • [Presentation] BERTによる参考文献書誌情報抽出の精度向上2021

    • Author(s)
      荒川瞭平, 金澤輝一, 高須淳宏, 上野史, 太田学
    • Organizer
      情報処理学会第83回全国大会
    • Related Report
      2020 Research-status Report
  • [Presentation] 少量学習データとBi-directional LSTM-CNN-CRFによる参考文献書誌情報抽出2020

    • Author(s)
      荒川瞭平, 太田学, 金澤 輝一, 高須淳宏
    • Organizer
      第12回データ工学と情報マネジメントに関するフォーラム (DEIM2020)
    • Related Report
      2019 Research-status Report
  • [Presentation] 機械学習を用いた表構造解析の一手法2020

    • Author(s)
      山田凌也, 太田学, 金澤 輝一, 高須淳宏
    • Organizer
      第12回データ工学と情報マネジメントに関するフォーラム (DEIM2020)
    • Related Report
      2019 Research-status Report
  • [Presentation] 能動学習を用いた実験情報抽出の一手法2020

    • Author(s)
      八田谷翔太, 太田学
    • Organizer
      電子情報通信学会2020年総合大会 情報・システムソサイエティ特別企画 学生ポスターセッション
    • Related Report
      2019 Research-status Report
  • [Presentation] 学術論文の被引用文章生成の一手法2020

    • Author(s)
      田邊俊介, 太田学
    • Organizer
      電子情報通信学会2020年総合大会 情報・システムソサイエティ特別企画 学生ポスターセッション
    • Related Report
      2019 Research-status Report
  • [Presentation] 学術論文閲覧支援のための備忘録の設計2019

    • Author(s)
      岩本拓実, 高須淳宏, 太田学
    • Organizer
      第18回情報科学技術フォーラム (FIT2019)
    • Related Report
      2019 Research-status Report
  • [Presentation] 転移学習を用いた少量学習データによる参考文献書誌情報抽出2019

    • Author(s)
      木下諒, 太田学, 高須淳宏
    • Organizer
      第11回データ工学と情報マネジメントに関するフォーラム (DEIM2019)
    • Related Report
      2018 Research-status Report
  • [Presentation] 引用文脈の分散表現を利用した学術論文の被引用文章要約の一手法2019

    • Author(s)
      田邊俊介, 太田学, 高須淳宏
    • Organizer
      第11回データ工学と情報マネジメントに関するフォーラム (DEIM2019)
    • Related Report
      2018 Research-status Report
  • [Presentation] 学術論文閲覧支援インタフェースにおける備忘録の自動生成の一手法2019

    • Author(s)
      岩本拓実, 太田学, 高須淳宏
    • Organizer
      第11回データ工学と情報マネジメントに関するフォーラム (DEIM2019)
    • Related Report
      2018 Research-status Report
  • [Presentation] グラフの自動生成のための表の構造解析の一手法2019

    • Author(s)
      山田凌也, 太田学, 高須淳宏
    • Organizer
      第11回データ工学と情報マネジメントに関するフォーラム (DEIM2019)
    • Related Report
      2018 Research-status Report
  • [Presentation] Bi-directional LSTM-CNN-CRFによる参考文献書誌情報抽出2018

    • Author(s)
      浪越大貴, 太田学, 高須淳宏, 安達淳
    • Organizer
      電子情報通信学会データ工学研究会, 情報処理学会データベースシステム研究会
    • Related Report
      2018 Research-status Report

URL: 

Published: 2018-04-23   Modified: 2024-01-30  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi