• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

汎用検索モデルに基づく低資源下における情報検索システム構築技術の開発

Research Project

Project/Area Number 23K28090
Project/Area Number (Other) 23H03400 (2023)
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeMulti-year Fund (2024)
Single-year Grants (2023)
Section一般
Review Section Basic Section 60080:Database-related
Basic Section 62020:Web informatics and service informatics-related
Sections That Are Subject to Joint Review: Basic Section60080:Database-related , Basic Section62020:Web informatics and service informatics-related
Research InstitutionUniversity of Tsukuba

Principal Investigator

加藤 誠  筑波大学, 図書館情報メディア系, 准教授 (00646911)

Project Period (FY) 2023-04-01 – 2027-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥18,070,000 (Direct Cost: ¥13,900,000、Indirect Cost: ¥4,170,000)
Fiscal Year 2026: ¥3,510,000 (Direct Cost: ¥2,700,000、Indirect Cost: ¥810,000)
Fiscal Year 2025: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2023: ¥6,240,000 (Direct Cost: ¥4,800,000、Indirect Cost: ¥1,440,000)
Keywords情報検索 / 機械学習 / ランキング学習 / エンティティ検索
Outline of Research at the Start

近年の情報検索研究の多くは大量の利用者データおよび専門の検索チームを前提に行われており,十分なデータや人的資源を持たない検索サービスでは情報検索の先端技術が活かされていない.本研究課題の目的は,資源の多寡による検索システムの性能格差を是正するために,(1)汎用検索アルゴリズムを開発することで利用者データを用いることなく検索システムの性能を向上させ,(2)汎用ユーザモデルを開発することで低資源下においても検索システムの評価を可能にし,(3)汎用検索アルゴリズムと汎用ユーザモデルを利用して検索システムを構築するシステ ム(AutoIR)によって高性能な検索システムの構築を容易にすることである.

Outline of Annual Research Achievements

本年度は,「1. 汎用検索アルゴリズムの開発」の課題である「1-1. ランキング学習モデルの汎化」および「2. 汎用ユーザモデルの開発」の 課題である「2-1. 汎用ユーザクエリモデルの構築」に取り組んだ.
1-1. ランキング学習モデルの汎化: 本研究課題では,特徴の特徴,すなわち,「メタ特徴」から,ランキングモデルにおける特徴の重みを回帰モデルによって推定し,多量の学習データを用いることなく特徴のみからモデルを学習する方法を提案した.これは従来の「サービス固有のデータからランキング方法を学習する」 というアプローチではなく,「複数サービスからランキング方法を構築する方法を学習する」というアプローチとなっている.実験によって提案手法の効果を検証し,他のサービスで学習されたモデルをそのまま利用する場合に比べて,統計的有意に提案手法が優れた性能を示すことを確認した.
2-1. 汎用ユーザクエリモデルの構築: 情報検索システムの評価にはオンライン評価とオフライン評価があるが,どちらにおいても十分な資源が必要となる.オンライン評価には十分 な利用者データが必要であって,オフライン評価には評価用クエリの選定や適合性判定など人手による作業が必要となる.そこで,本研究課題 では,サービスに対して入力される可能性の高いクエリを人工的に生成し,適合と判定される結果をクリックするような汎用ユーザモデルの開発を目指す.2023年度は特にクエリ生成に取り組み,ユーザからプロファイリングを行う方法,また,サービス中の文書からクエリを生成する方法について提案および検証を行った.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

研究課題「1. 汎用検索アルゴリズムの開発」の課題である「1-1. ランキング学習モデルの汎化」は当初2023年度から2024年度にかけて行う予定であったが,2023年度時点において学会論文にまとめられる段階にあり,2024年においては主に検証を行う予定である.そのため,「1. 汎用検索アルゴリズムの開発」という研究課題については当初の計画以上に進展していると言える.
研究課題「2. 汎用ユーザモデルの開発」については当初の計画通りの進捗がある.
2023年度に取り組む予定の2つの研究課題の進捗から,当初の計画以上に進展していると言える.

Strategy for Future Research Activity

研究課題「1. 汎用検索アルゴリズムの開発」については2023年度において多くの進捗が得られたため,2025年度に実施予定の「エンティティ検索モデルの汎化」について,前倒しをして実施することを検討している.

Report

(1 results)
  • 2023 Annual Research Report
  • Research Products

    (6 results)

All 2024

All Presentation (6 results)

  • [Presentation] 大規模言語モデルに基づく検索手法の日本語文書検索への適用2024

    • Author(s)
      阿部 健也, 薄羽 皐太, 加藤 誠
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • Related Report
      2023 Annual Research Report
  • [Presentation] ゼロショットエンティティリンキングに寄与するエンティティ記述の分析2024

    • Author(s)
      瀬谷 浩樹, 加藤 誠
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • Related Report
      2023 Annual Research Report
  • [Presentation] 系列変換モデルを利用したフィールド検索のためのクエリ書き換え2024

    • Author(s)
      仲地 優登, 加藤 誠, 百合草 陽介
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • Related Report
      2023 Annual Research Report
  • [Presentation] ドメイン特徴に基づくランキング学習モデルのドメイン適応2024

    • Author(s)
      伊藤 拓誠, 丸田 敦貴, 加藤 誠
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • Related Report
      2023 Annual Research Report
  • [Presentation] クエリ自動補完のための文書コレクションからのクエリログ生成2024

    • Author(s)
      染谷 瑛進, 加藤 誠
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • Related Report
      2023 Annual Research Report
  • [Presentation] 大規模言語モデルを用いた検索モデルの中間学習のためのコーパス作成手法2024

    • Author(s)
      柴田 幸輝, 加藤 誠, 百合草 陽介
    • Organizer
      言語処理学会第30回年次大会(NLP2024)
    • Related Report
      2023 Annual Research Report

URL: 

Published: 2023-04-18   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi