• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

Cost-Sensitive Information Extraction and Cyber-Physical Browsing Support for Academic Papers

Research Project

Project/Area Number 18K11989
Research InstitutionOkayama University

Principal Investigator

太田 学  岡山大学, 自然科学学域, 教授 (10326019)

Project Period (FY) 2018-04-01 – 2023-03-31
Keywords電子図書館 / 学術論文 / 情報抽出 / メタデータ / 閲覧支援 / サイバーフィジカル / 表構造解析
Outline of Annual Research Achievements

本研究は、学術論文から様々なメタ情報をコストセンシティブに抽出する方法の確立と、抽出したメタ情報を利用したタブレット端末による新しい論文閲覧スタイルの提案を目的とする。
令和4年度は、学術論文の参考文献欄から書誌情報を抽出するために開発を進めてきたBidirectional Encoder Representations from Transformers(BERT)による参考文献書誌情報抽出器の抽出誤りの自動検出を試み、実験によりその検出の精度ならびに見込まれる修正コストなどを評価した。一方、タブレット端末による論文閲覧支援の一環として、引用意図に基づく引用箇所の補足情報の自動生成手法を改良した。特に初学者の論文閲覧支援のために、引用文献以外の多様な情報源から補足情報の候補を収集して読者に提示する機能を被験者実験用ブラウザに組み込んで評価実験を行い有用な知見を得た。論文閲覧支援ではまた、表中の数値データの自動グラフ変換を行うために、文書から表を自動で検出しその構造を解析するエンドツーエンド表構造解析手法を開発した。これらの研究成果について国内研究会などで7件発表した。
研究期間全体では、学術論文からのコストセンシティブ情報抽出として、BERTを用いた参考文献情報抽出器を開発して実験を行い、その抽出精度と学習データ量(生成コスト)のトレードオフ、ならびにこの抽出誤りの人的修正コストが十分に制御可能である見通しを得た。また論文閲覧支援においては、タブレット端末のカメラを通して紙のフィジカルな学術論文を読む読者に、論文から抽出した引用情報や専門用語などとサイバー空間の関連情報を知的に集約して提供するサイバーフィジカル論文閲覧支援インタフェースを提案した。

  • Research Products

    (7 results)

All 2023 2022

All Presentation (7 results)

  • [Presentation] 文の類似度と Extractive QA による被引用文特定の一手法2023

    • Author(s)
      西海真祥, 金澤輝一, 上野史, 太田学
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム (DEIM2023)
  • [Presentation] BERTによる参考文献書誌情報抽出の誤り検出の評価2023

    • Author(s)
      中山竣平, 金澤輝一, 高須淳宏, 上野史, 太田学
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム (DEIM2023)
  • [Presentation] グラフニューラルネットワークを用いたエンドツーエンド表構造解析手法の提案2023

    • Author(s)
      青柳拓志, 金澤輝一, 高須淳宏, 上野史, 太田学
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム (DEIM2023)
  • [Presentation] ニューラルネットワークによる日本語を含む表の構造解析の一手法2023

    • Author(s)
      細谷亮太, 金澤輝一, 上野史, 太田学
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム (DEIM2023)
  • [Presentation] 初学者の論文閲覧支援のための日本語論文からの専門用語抽出の一手法2023

    • Author(s)
      高橋春成, 金澤輝一, 上野史, 太田学
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム (DEIM2023)
  • [Presentation] 引用意図を利用した初学者向け学術論文閲覧支援方法の検討2022

    • Author(s)
      西海真祥, 金澤輝一, 上野史, 太田学
    • Organizer
      第21回情報科学技術フォーラム (FIT2022)
  • [Presentation] 表検出を含むエンドツーエンド表構造解析手法の評価2022

    • Author(s)
      青柳拓志, 金澤輝一, 高須淳宏, 上野史, 太田学
    • Organizer
      ARG 第18回Webインテリジェンスとインタラクション研究会

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi