• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

汎用検索モデルに基づく低資源下における情報検索システム構築技術の開発

研究課題

研究課題/領域番号 23K28090
補助金の研究課題番号 23H03400 (2023)
研究種目

基盤研究(B)

配分区分基金 (2024)
補助金 (2023)
応募区分一般
審査区分 小区分60080:データベース関連
小区分62020:ウェブ情報学およびサービス情報学関連
合同審査対象区分:小区分60080:データベース関連、小区分62020:ウェブ情報学およびサービス情報学関連
研究機関筑波大学

研究代表者

加藤 誠  筑波大学, 図書館情報メディア系, 准教授 (00646911)

研究期間 (年度) 2023-04-01 – 2027-03-31
研究課題ステータス 交付 (2024年度)
配分額 *注記
18,070千円 (直接経費: 13,900千円、間接経費: 4,170千円)
2026年度: 3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2025年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
キーワード情報検索 / 機械学習 / ランキング学習 / エンティティ検索
研究開始時の研究の概要

近年の情報検索研究の多くは大量の利用者データおよび専門の検索チームを前提に行われており,十分なデータや人的資源を持たない検索サービスでは情報検索の先端技術が活かされていない.本研究課題の目的は,資源の多寡による検索システムの性能格差を是正するために,(1)汎用検索アルゴリズムを開発することで利用者データを用いることなく検索システムの性能を向上させ,(2)汎用ユーザモデルを開発することで低資源下においても検索システムの評価を可能にし,(3)汎用検索アルゴリズムと汎用ユーザモデルを利用して検索システムを構築するシステ ム(AutoIR)によって高性能な検索システムの構築を容易にすることである.

研究実績の概要

本年度は,「1. 汎用検索アルゴリズムの開発」の課題である「1-1. ランキング学習モデルの汎化」および「2. 汎用ユーザモデルの開発」の 課題である「2-1. 汎用ユーザクエリモデルの構築」に取り組んだ.
1-1. ランキング学習モデルの汎化: 本研究課題では,特徴の特徴,すなわち,「メタ特徴」から,ランキングモデルにおける特徴の重みを回帰モデルによって推定し,多量の学習データを用いることなく特徴のみからモデルを学習する方法を提案した.これは従来の「サービス固有のデータからランキング方法を学習する」 というアプローチではなく,「複数サービスからランキング方法を構築する方法を学習する」というアプローチとなっている.実験によって提案手法の効果を検証し,他のサービスで学習されたモデルをそのまま利用する場合に比べて,統計的有意に提案手法が優れた性能を示すことを確認した.
2-1. 汎用ユーザクエリモデルの構築: 情報検索システムの評価にはオンライン評価とオフライン評価があるが,どちらにおいても十分な資源が必要となる.オンライン評価には十分 な利用者データが必要であって,オフライン評価には評価用クエリの選定や適合性判定など人手による作業が必要となる.そこで,本研究課題 では,サービスに対して入力される可能性の高いクエリを人工的に生成し,適合と判定される結果をクリックするような汎用ユーザモデルの開発を目指す.2023年度は特にクエリ生成に取り組み,ユーザからプロファイリングを行う方法,また,サービス中の文書からクエリを生成する方法について提案および検証を行った.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

研究課題「1. 汎用検索アルゴリズムの開発」の課題である「1-1. ランキング学習モデルの汎化」は当初2023年度から2024年度にかけて行う予定であったが,2023年度時点において学会論文にまとめられる段階にあり,2024年においては主に検証を行う予定である.そのため,「1. 汎用検索アルゴリズムの開発」という研究課題については当初の計画以上に進展していると言える.
研究課題「2. 汎用ユーザモデルの開発」については当初の計画通りの進捗がある.
2023年度に取り組む予定の2つの研究課題の進捗から,当初の計画以上に進展していると言える.

今後の研究の推進方策

研究課題「1. 汎用検索アルゴリズムの開発」については2023年度において多くの進捗が得られたため,2025年度に実施予定の「エンティティ検索モデルの汎化」について,前倒しをして実施することを検討している.

報告書

(1件)
  • 2023 実績報告書
  • 研究成果

    (6件)

すべて 2024

すべて 学会発表 (6件)

  • [学会発表] 大規模言語モデルに基づく検索手法の日本語文書検索への適用2024

    • 著者名/発表者名
      阿部 健也, 薄羽 皐太, 加藤 誠
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] ゼロショットエンティティリンキングに寄与するエンティティ記述の分析2024

    • 著者名/発表者名
      瀬谷 浩樹, 加藤 誠
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 系列変換モデルを利用したフィールド検索のためのクエリ書き換え2024

    • 著者名/発表者名
      仲地 優登, 加藤 誠, 百合草 陽介
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] ドメイン特徴に基づくランキング学習モデルのドメイン適応2024

    • 著者名/発表者名
      伊藤 拓誠, 丸田 敦貴, 加藤 誠
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] クエリ自動補完のための文書コレクションからのクエリログ生成2024

    • 著者名/発表者名
      染谷 瑛進, 加藤 誠
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 大規模言語モデルを用いた検索モデルの中間学習のためのコーパス作成手法2024

    • 著者名/発表者名
      柴田 幸輝, 加藤 誠, 百合草 陽介
    • 学会等名
      言語処理学会第30回年次大会(NLP2024)
    • 関連する報告書
      2023 実績報告書

URL: 

公開日: 2023-04-18   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi