• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

検索に有用な情報の計算表現を統合したアーカイブ内文書の高度な検索システムの開発

研究課題

研究課題/領域番号 23KK0005
研究種目

国際共同研究加速基金(海外連携研究)

配分区分基金
審査区分 中区分2:文学、言語学およびその関連分野
研究機関九州大学

研究代表者

鈴木 釈規  九州大学, システム情報科学研究院, 助教 (60910213)

研究分担者 冨浦 洋一  九州大学, システム情報科学研究院, 教授 (10217523)
石田 栄美  九州大学, データ駆動イノベーション推進本部, 教授 (50364815)
清水 敏之  九州大学, 附属図書館, 准教授 (60402468)
研究期間 (年度) 2023-09-08 – 2026-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
18,850千円 (直接経費: 14,500千円、間接経費: 4,350千円)
2025年度: 8,060千円 (直接経費: 6,200千円、間接経費: 1,860千円)
2024年度: 8,190千円 (直接経費: 6,300千円、間接経費: 1,890千円)
2023年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
キーワードアーカイブズ / 検索システム / 文書検索システム / 計算可能表現 / 文書探索行動
研究開始時の研究の概要

特定の組織が作成した特定の主題に関わる文書群を管理・保存するアーカイブズ機関では、高度な文書検索システムが整備されていない。本研究では、アーカイブズ機関で管理される文書を引用している学術文献や、一部電子化されている文書群から検索システムに有益な情報を観察調査により特定を行い、自動抽出手法の構築を行う。それらの情報から順序づけ・類似度計算を可能にする計算可能表現として変換し統合することで、アーカイブズ文書検索システム構築をする。またアーカイブズ機関における文献利用者の支援を達成できるかについて評価を行う。

研究実績の概要

本研究は、アーカイブズ機関に所蔵されるアーカイブ文書を検索するシステムの構築及び評価を目的とする。今年度は、次の三つの研究を行なった。
(1)アーカイブ資料の引用は非常に少ない。歴史分野の学術文献を対象に、アーカイブ引用文の収集、引用文についての正解作成、複数の機械学習を用いて引用文の自動特定器を構築及びそのための一連の方法を提案した。この研究により、アーカイブ資料の情報を含む文の特定が可能となり、Finding Aidsを補うことが期待できる。この成果は、国際会議 (International Conference on Asia-Pacific Digital Libraries, ICADL2023)で発表した。
(2)アーカイブズ機関に所蔵されるアーカイブ資料の多くは電子化が進んでいなく、アーカイブリポジトリコンテナと呼ばれる箱に格納されている。資料探索者は、アーカイブ図機関で閲覧希望のコンテナを請求する必要があり、時間・コストを要する。所望の資料が格納されるコンテナを、文書とコンテナ格納関係、資料に付与されたメタデータ(作成日、関連機関など)の関係をグラフとしてモデル化し、グラフニューラルネットワークを用いた検索手法を提案した。Known-Item 検索として評価実験を行い、有効性を確認した。この成果は、国際会議(International ACM SIGIR Conference on Research and Development in Information Retrieval)に採択が決定した。
(3)アーカイブ検索システムの研究を推進するために、検索システムについての課題共有型、国際ワークショップ(NTCIR-18)に、項目(1),(2)を共有研究課題として採択がされた。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本研究は、アーカイブズ機関に所蔵されるアーカイブ文書を検索するシステムの構築及び評価を目的とする。今年度は、次の三つの研究を行なった。
(1)歴史分野の学術文献を対象に、アーカイブ引用文の収集、引用文についての正解作成、複数の機械学習を用いて引用文の自動特定器を構築及びそのための一連の方法を確立・提案した。この研究により、学術文献中のアーカイブ資料の引用は非常に少ないが、その中からアーカイブ資料の情報を含む文の特定が可能となり、Finding Aidsを補うことが期待できる。この成果は、国際会議 (International Conference on Asia-Pacific Digital Libraries, ICADL2023)で発表した。
(2)アーカイブズ機関に所蔵されるアーカイブ資料の多くは電子化が進んでいなく、アーカイブリポジトリコンテナと呼ばれる箱に格納されている。資料探索者は、アーカイブ図機関で閲覧希望のコンテナを請求する必要があり、時間・コストを要する。所望の資料が格納されるコンテナを、文書とコンテナ格納関係、資料に付与されたメタデータ(作成日、関連機関など)の関係をグラフとしてモデル化を提案し、グラフニューラルネットワークを用いた検索手法を提案した。Known-Item 検索課題として評価実験を行い、有効性を確認した。この成果は、国際会議(International ACM SIGIR Conference on Research and Development in Information Retrieval)に採択が決定した。
(3)アーカイブ検索システムの研究を推進するために、検索システムについての課題共有型、国際ワークショップ(NTCIR-18)に、項目(1),(2)を共有研究課題として採択がされた。

今後の研究の推進方策

本研究課題の目的は、アーカイブズ機関での資料探索者の検索に有用な高度な検索システムの実現である。対して、今年度までの研究では、既知文書の格納コンテナを検索するアーカイブ資料検索システムのプロトタイプの構築を行なった。目的である高度な検索システムの実現には、(a) アーカイブズ機関での熟練の資料探索者は、文書をどのよう探索するか、コンテナを請求するか、(b) 今年度に構築したプロトタイプシステムを用いて、資料を探索するときに、検索結果のコンテナは、実際に請求するコンテナに近いかどうかを調査検討することが必要になる。(a) (b) については、次年度にアーカイブズ機関での利用者調査を行い、分析を進める。

報告書

(1件)
  • 2023 実施状況報告書
  • 研究成果

    (2件)

すべて 2023 その他

すべて 国際共同研究 (1件) 雑誌論文 (1件) (うち国際共著 1件、 査読あり 1件)

  • [国際共同研究] University of Maryland(米国)

    • 関連する報告書
      2023 実施状況報告書
  • [雑誌論文] Automatically Detecting References from the Scholarly Literature to Records in Archives2023

    • 著者名/発表者名
      Suzuki Tokinori、Oard Douglas W.、Ishita Emi、Tomiura Yoichi
    • 雑誌名

      Leveraging Generative Intelligence in Digital Libraries: Towards Human-Machine Collaboration

      巻: 14458 ページ: 100-107

    • DOI

      10.1007/978-981-99-8088-8_9

    • ISBN
      9789819980871, 9789819980888
    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / 国際共著

URL: 

公開日: 2023-09-12   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi