本研究では、大学などの学校図書館において学びたい分野やテーマの専門用語を知らない初学者の図書探索を支援することを目的としている。図書館司書との対話のようにシステムとの対話の中で資料の綴り込みを実現するには、利用者から得た漠然としたキーワードから概念的に関連するキーワードや分野を類推し、利用者にフィードバックする必要がある。そこで、図書の目次データに着目して学術用語の分散表現と図書の分散表現を実現することで、図書探索に必要なクエリーの拡張と関連する図書探索の実現手法を検討した。 今年度は、概念的に内容構成が類似する図書の探索を実現するために、文脈の関係をより捉えることのできる大規模言語モデルである事前学習済みSentence-BERTモデルを用いた。目次データを用いて事前学習済みモデルをファインチューニングすることで、図書の目次を文脈と見立てた分散表現モデルを構築した。また、この分散表現モデルを用いて図書探索を行い、図書の類似関係を可視化することで、目次の構成が類似する図書の関係の把握および探索が可能になることを示した。また、研究成果として、対話形式によるキーワードの拡張と類似図書探索によって図書の綴り込みを支援する図書探索手法を提案した。これにより、曖昧なクエリーからのキーワード抽出と、クエリーに関連する分野および関連語の概念関係の把握が可能になり、従来のキーワードマッチングによる全文検索では得られにくい関連分野を含む資料探索が可能になることを確認している。学習者の資料探索の支援の実現に向けては、探索結果の提示方法やGUIの改善などの課題が残っているが、提案手法は図書館司書の業務支援などへの活用も期待できると考えている。
|