研究課題/領域番号 |
21K12585
|
研究機関 | 日本大学 |
研究代表者 |
関 亜紀子 日本大学, 生産工学部, 講師 (60386670)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 分散表現 / 図書 / 推薦 |
研究実績の概要 |
本研究課題では、対話形式での図書の推薦を実現するために、目次に含まれる特徴語を用いて図書の特徴をベクトル表現し、図書に関する知識構造を作成することを目的としています。また、ここから得られる知識構造を用いて、対話内容から利用者が求める分野およびテーマを類推する図書の探索を支援するための推薦手法を確立することを目的としています。 本年度は、対話形式での図書推薦に向けて、ユーザが発した曖昧なクエリーから検索語を拡張するための検討と、対話形式で探索時の図書の絞り込みを実現するためのシステム構成を検討しました。その取り組みとして、書誌情報に含まれるタイトル、目次、概要を用いて、それらに含まれる単語の分散表現モデルと、文書の分散表現モデルを試作しました。また、書誌情報から生成した単語の分散表現モデルと、日本語Wikipediaを利用して生成した一般的な単語の分散表現モデルを用いて、クエリーの検索語の拡張を検討しました。その結果、書誌情報を用いて文書の分散表現モデルを構築し類似図書を探索することの一定の有用性を確認しました。また、目次を用いた文書の分散表現により、対象分野や図書の類似関係をある程度分類できることを確認しました。一方で、単年度に出版された書誌情報と、10年分の書誌情報を用いて各モデルを構築し、同様の分析を行った結果、歴史学や数学などに対して、情報学や社会学などの学術分野によっては、得られる結果に違いがあり、その語彙が用いられた時代背景を考慮する必要があるとの着想を得ました。次年度以降は、まずこの点について検討していきたいと考えています。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
初年度の検討は、当初の計画通りに進めることができ、単年度の書誌情報を用いた基礎的な検討を終えることができました。また、研究計画時に使用を予定していた書誌データセットが、研究者向け価格での提供が開始されたことで、計画当初より安価により多くのデータを予算内で購入することが可能になりました。 そこで、次年度以降に予定していたデータを今年度中に追加して検討を始めました。その過程で、新たな視点でのモデルの拡張が必要になる可能性があることがわかり、次年度以降は当初の計画内容の修正の必要性が予想されることから、おおむね順調に進展しているとしました。
|
今後の研究の推進方策 |
初年度の検討では2000年から2009年に出版された書誌データと、2018年と2019年に出版された書誌データを用いて分析を行いました。この検討の中で、時間的な要素を考慮することで、クエリーの抽出や類似図書探索の精度が向上する可能性があるという着想を得ました。まずは、この点を検証するために、空期間となっている2010年以降のデータを追加して、再度、分散表現モデルや類似図書の探索手法について現状のモデルでの精度を比較検討し、時系列的な要素の必要性の有無について早い段階で検証を行いたいと考えています。その後、結果に応じて、時系列を考慮したモデルの拡張、あるいは、対話形式での探索支援の実現手法の検討を進める計画でおります。
|
次年度使用額が生じた理由 |
研究成果の発表のために旅費の使用を計画していましたが、オンライン開催となりましたので、旅費の使用がなくなりました。一方で、研究に使用する書誌データの研究用データの販売が開始され、当初の計画より安価に大量のデータを使用できるようになっため、旅費での計画分をデータ購入の物品費として使用しましたが、残額が生じました。 翌年度は、今回購入できなかったデータの追加を予定しており、差額はそこに使用する計画です。
|