• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Annual Research Report

専門用語の知識保全エコシステムを有する特定研究グループ向け論文・図表DBの研究

Research Project

Project/Area Number 19K22888
Research InstitutionHokkaido University

Principal Investigator

吉岡 真治  北海道大学, 情報科学研究院, 教授 (40290879)

Co-Investigator(Kenkyū-buntansha) 原 真二郎  北海道大学, 量子集積エレクトロニクス研究センター, 准教授 (50374616)
鈴木 晃  国立研究開発法人物質・材料研究機構, 統合型材料開発・情報基盤部門, NIMS特別研究員 (50799723)
Project Period (FY) 2019-06-28 – 2021-03-31
Keywords論文データベース / テキストマイニング
Outline of Annual Research Achievements

本研究では、論文からの情報抽出・知識発見を支援するための専門用語の知識保全エコシステムを有する特定研究グループ向け論文・図表DBの提案を目指している。このシステムでは、分野の研究者が興味を持つ最新の論文を含むデータベースをPDF 解析技術を用いて構築すると共に、そこからの用語辞書を作成する枠組を提供することによって、ユーザが継続的に専門用語に関する知識保全を行うエコシステム(生態系)を構築する方法を提案している。
2020年度は、昨年度作成した用語辞書管理システムを用いて、実際に分野の専門家から収集した論文集からの専門用語候補の生成と、その登録作業を行うとともに、この用語辞書管理システムの登録結果を用いて、論文・図表を検索するシステムを構築し、具体的な論文分析を行える環境を整備した。また、論文中に現れる専門用語の発生頻度に注目して、研究動向を分析するシステムを合わせて提供することで、用語辞書の作成コストをかけた対価に相当するシステムによる支援機能を充実させた。この用語登録のプロセスの中で、複数の役割で用いられる可能性のある用語が登録されたが、パターンマッチで用語を抽出する場合には、その役割の区別ができないために、複数の役割に同じ単語が表示され、冗長な印象を与えるといったシステム運用上の問題も明らかとなってきた。今後は、作成したシステムを基盤として用いることにより、継続的に論文を追加しながら実運用を行なっていく予定である。この活動の中で、本研究の提案による用語辞書のメンテナンスを行なっていき、より良いエコシステムをもつシステムへの発展へとつなげていく予定である。本システムについては、応用先の専門家の集まりである応用物理学会のセッションでの発表を行うなど、この新しい考え方について、分野の専門家から意見をいただく機会も設けている。

  • Research Products

    (6 results)

All 2021 2020

All Presentation (6 results) (of which Int'l Joint Research: 1 results)

  • [Presentation] Construction of In-house Paper/Figure Database System Supporting Research Trend Analysis2021

    • Author(s)
      Lei Yin, Masaharu Yoshioka and Shinjiro Hara
    • Organizer
      第68回応用物理学会春季学術講演会, 19p-Z32-9.
  • [Presentation] 磁石物性データ大量取得のためのテキスト処理要素技術の開発2021

    • Author(s)
      鈴木晃,石井真史
    • Organizer
      日本金属学会2021年春期(第168回)講演大会, S1.7
  • [Presentation] Word-Level Chemical Named Entity Recognition Based on Subword Sequence Analysis2020

    • Author(s)
      Kojiro Machi and Masaharu Yoshioka
    • Organizer
      Fourth International Workshop on SCIentific DOCument Analysis (SCIDOCA2020), pp. 288-297
    • Int'l Joint Research
  • [Presentation] 化学物質データベースを訓練データに用いた化学物質名識別システムに関する実験的分析2020

    • Author(s)
      町光二郎, 吉岡真治
    • Organizer
      研究報告情報基礎とアクセス技術 (IFAT), 2020-IFAT-139-3, 2020
  • [Presentation] 材料辞書データベースを使った論文からの大量データ抽出:材料用語の階層化による体系的自動タグ付け2020

    • Author(s)
      鈴木晃,石井真史
    • Organizer
      第81回応用物理学会秋季学術講演会, 9p-Z09-17
  • [Presentation] 材料辞書データベースを使った論文からの大量データ抽出:用語間関係性抽出の自動化検討2020

    • Author(s)
      鈴木晃,石井真史
    • Organizer
      第68回応用物理学会春季学術講演会, 19p-Z32-11

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi