• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Development of an advanced search system for documents in archives by integrating computational representations of information useful for searching documents

Research Project

Project/Area Number 23KK0005
Research Category

Fund for the Promotion of Joint International Research (International Collaborative Research)

Allocation TypeMulti-year Fund
Review Section Medium-sized Section 2:Literature, linguistics, and related fields
Research InstitutionKyushu University

Principal Investigator

鈴木 釈規  九州大学, システム情報科学研究院, 助教 (60910213)

Co-Investigator(Kenkyū-buntansha) 冨浦 洋一  九州大学, システム情報科学研究院, 教授 (10217523)
石田 栄美  九州大学, データ駆動イノベーション推進本部, 教授 (50364815)
清水 敏之  九州大学, 附属図書館, 准教授 (60402468)
Project Period (FY) 2023-09-08 – 2026-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥18,850,000 (Direct Cost: ¥14,500,000、Indirect Cost: ¥4,350,000)
Fiscal Year 2025: ¥8,060,000 (Direct Cost: ¥6,200,000、Indirect Cost: ¥1,860,000)
Fiscal Year 2024: ¥8,190,000 (Direct Cost: ¥6,300,000、Indirect Cost: ¥1,890,000)
Fiscal Year 2023: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
Keywordsアーカイブズ / 検索システム / 文書検索システム / 計算可能表現 / 文書探索行動
Outline of Research at the Start

特定の組織が作成した特定の主題に関わる文書群を管理・保存するアーカイブズ機関では、高度な文書検索システムが整備されていない。本研究では、アーカイブズ機関で管理される文書を引用している学術文献や、一部電子化されている文書群から検索システムに有益な情報を観察調査により特定を行い、自動抽出手法の構築を行う。それらの情報から順序づけ・類似度計算を可能にする計算可能表現として変換し統合することで、アーカイブズ文書検索システム構築をする。またアーカイブズ機関における文献利用者の支援を達成できるかについて評価を行う。

Outline of Annual Research Achievements

本研究は、アーカイブズ機関に所蔵されるアーカイブ文書を検索するシステムの構築及び評価を目的とする。今年度は、次の三つの研究を行なった。
(1)アーカイブ資料の引用は非常に少ない。歴史分野の学術文献を対象に、アーカイブ引用文の収集、引用文についての正解作成、複数の機械学習を用いて引用文の自動特定器を構築及びそのための一連の方法を提案した。この研究により、アーカイブ資料の情報を含む文の特定が可能となり、Finding Aidsを補うことが期待できる。この成果は、国際会議 (International Conference on Asia-Pacific Digital Libraries, ICADL2023)で発表した。
(2)アーカイブズ機関に所蔵されるアーカイブ資料の多くは電子化が進んでいなく、アーカイブリポジトリコンテナと呼ばれる箱に格納されている。資料探索者は、アーカイブ図機関で閲覧希望のコンテナを請求する必要があり、時間・コストを要する。所望の資料が格納されるコンテナを、文書とコンテナ格納関係、資料に付与されたメタデータ(作成日、関連機関など)の関係をグラフとしてモデル化し、グラフニューラルネットワークを用いた検索手法を提案した。Known-Item 検索として評価実験を行い、有効性を確認した。この成果は、国際会議(International ACM SIGIR Conference on Research and Development in Information Retrieval)に採択が決定した。
(3)アーカイブ検索システムの研究を推進するために、検索システムについての課題共有型、国際ワークショップ(NTCIR-18)に、項目(1),(2)を共有研究課題として採択がされた。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究は、アーカイブズ機関に所蔵されるアーカイブ文書を検索するシステムの構築及び評価を目的とする。今年度は、次の三つの研究を行なった。
(1)歴史分野の学術文献を対象に、アーカイブ引用文の収集、引用文についての正解作成、複数の機械学習を用いて引用文の自動特定器を構築及びそのための一連の方法を確立・提案した。この研究により、学術文献中のアーカイブ資料の引用は非常に少ないが、その中からアーカイブ資料の情報を含む文の特定が可能となり、Finding Aidsを補うことが期待できる。この成果は、国際会議 (International Conference on Asia-Pacific Digital Libraries, ICADL2023)で発表した。
(2)アーカイブズ機関に所蔵されるアーカイブ資料の多くは電子化が進んでいなく、アーカイブリポジトリコンテナと呼ばれる箱に格納されている。資料探索者は、アーカイブ図機関で閲覧希望のコンテナを請求する必要があり、時間・コストを要する。所望の資料が格納されるコンテナを、文書とコンテナ格納関係、資料に付与されたメタデータ(作成日、関連機関など)の関係をグラフとしてモデル化を提案し、グラフニューラルネットワークを用いた検索手法を提案した。Known-Item 検索課題として評価実験を行い、有効性を確認した。この成果は、国際会議(International ACM SIGIR Conference on Research and Development in Information Retrieval)に採択が決定した。
(3)アーカイブ検索システムの研究を推進するために、検索システムについての課題共有型、国際ワークショップ(NTCIR-18)に、項目(1),(2)を共有研究課題として採択がされた。

Strategy for Future Research Activity

本研究課題の目的は、アーカイブズ機関での資料探索者の検索に有用な高度な検索システムの実現である。対して、今年度までの研究では、既知文書の格納コンテナを検索するアーカイブ資料検索システムのプロトタイプの構築を行なった。目的である高度な検索システムの実現には、(a) アーカイブズ機関での熟練の資料探索者は、文書をどのよう探索するか、コンテナを請求するか、(b) 今年度に構築したプロトタイプシステムを用いて、資料を探索するときに、検索結果のコンテナは、実際に請求するコンテナに近いかどうかを調査検討することが必要になる。(a) (b) については、次年度にアーカイブズ機関での利用者調査を行い、分析を進める。

Report

(1 results)
  • 2023 Research-status Report
  • Research Products

    (2 results)

All 2023 Other

All Int'l Joint Research (1 results) Journal Article (1 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 1 results)

  • [Int'l Joint Research] University of Maryland(米国)

    • Related Report
      2023 Research-status Report
  • [Journal Article] Automatically Detecting References from the Scholarly Literature to Records in Archives2023

    • Author(s)
      Suzuki Tokinori、Oard Douglas W.、Ishita Emi、Tomiura Yoichi
    • Journal Title

      Leveraging Generative Intelligence in Digital Libraries: Towards Human-Machine Collaboration

      Volume: 14458 Pages: 100-107

    • DOI

      10.1007/978-981-99-8088-8_9

    • ISBN
      9789819980871, 9789819980888
    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Int'l Joint Research

URL: 

Published: 2023-09-12   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi