学術論文検索におけるユーザの視点に基づいたブーリアン型検索クエリ作成支援の研究
Project/Area Number |
19K20629
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 90020:Library and information science, humanistic and social informatics-related
|
Research Institution | Chuo University (2021-2023) Kyushu University (2019-2020) |
Principal Investigator |
福田 悟志 中央大学, 理工学部, 助教 (10817555)
|
Project Period (FY) |
2019-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥3,510,000 (Direct Cost: ¥2,700,000、Indirect Cost: ¥810,000)
Fiscal Year 2021: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2020: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2019: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | 論文検索 / クラスタリング / 検索クエリ / 情報検索 / 学術論文検索 / 高再現率 / 学術論文 / ブーリアン検索 / 網羅性 / クエリ推薦 / クエリ拡張 / クエリマイニング |
Outline of Research at the Start |
学術論文検索では,情報要求に関連する論文を網羅的に収集することが重要である.多くの検索エンジンにおいて,ユーザはブーリアン型検索クエリを入力して論文を検索する.しかし,最初に作成されたクエリで関連論文を満足に収集できることは稀であり,検索結果を検証して新たなクエリを作成・修正するという負荷の高い作業が繰り返し行わなければならない.本研究では,ユーザに対して,作成した検索クエリを効果的に洗練できるような支援を提供するためのシステム開発に向けた調査および技術開発を行う.
|
Outline of Annual Research Achievements |
本年度は,論文集合から情報要求と関連するグループを発見し,効果的に論文を探索するためのアプローチの開発を試みた.具体的に,まず,検索対象となる論文集合に対して,Bertopicによるクラスタリングを適用する.次に,ユーザが考案した検索クエリを完全に満たす論文を含むクラスタを,情報要求と関連するグループとみなし,クエリベースの検索モデルによるランキング結果から,それらのグループに含まれる論文のみを残す,すなわち,情報要求と関連しない論文を削除した.そして,NTCIR-1, -2データセットを用いた実験において,検索クエリに基づいたランキングモデルによる比較的の上位ランクにおいて,再現率の改善を確認した. また,本アプローチを実装したシステムを実現するにあたり,ユーザにとってより有益な結果を提供するための方法も検討した.具体的に,Bertopicによる論文の分類結果をユーザに提示し,ユーザ自身に情報要求と関連すると判断したグループを選択してもらうことを考えている.このとき,適切に情報要求と関連するグループを選択してもらうために,各グループを表す単語群や検索クエリを完全に満たす論文の数と本文情報や各グループを代表する論文などを提示する.これにより,情報要求と関連するとみなされているが関連論文を含まないグループや情報要求と関連するが検索クエリを完全に満たす論文が含まれていないグループを適切に選択することができると考えられる.また,各グループを表す単語情報の提示は,ユーザにとって,検索クエリの考案の段階では想像できなかった情報要求と関連する論文を発見し,検索クエリを再考案する際の情報として役立つといえる.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度で提案したアプローチを実装したシステムを構築しており,被験者を通じて,本システムの有用性や利便性,システムの改善につながる調査を行う予定である.
|
Strategy for Future Research Activity |
上記で述べた調査の実施に加え,検索クエリに基づいた検索システムの性能を向上させるための新たな手法を提案しており,その研究成果をまとめる予定である.
|
Report
(5 results)
Research Products
(4 results)