Research on Federated Search Support Method for Diverse LOD Datasets
Project/Area Number |
23K11761
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 90020:Library and information science, humanistic and social informatics-related
|
Research Institution | University of Tsukuba |
Principal Investigator |
高久 雅生 筑波大学, 図書館情報メディア系, 准教授 (00399271)
|
Co-Investigator(Kenkyū-buntansha) |
江草 由佳 国立教育政策研究所, 研究企画開発部教育研究情報推進室, 総括研究官 (60413902)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2025: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Fiscal Year 2024: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
|
Keywords | Linked Open Data / 情報探索 / 統合検索 / LOD / 情報検索 |
Outline of Research at the Start |
本研究は、多種多様なLOD データセット統合検索サービス構築のための支援に関する手法の研究開発を行う。近年、多種多様なLOD データセットが大量に提供されるようになってきたが、それらの中から所望のものを探しだし、適切に組み合わせて活用するためのプラットフォームが必要とされている。単なるキーワード検索にとどまらず、探索したデータセット内の類似リソースや同一リソースを識別したうえで、ファセット型検索などを使って概観ブラウジングできるようにすることを目指す。
|
Outline of Annual Research Achievements |
本研究は、多種多様な LOD データセット統合検索サービス構築手法の研究開発を行うものである。多種多様な LOD データセットが大量に提供されるようになってきたことを踏まえ、それらの中から所望のものを探しだし、必要に応じて組み合わせた情報を抽出するなど探索結果を活用するための検索プラットフォームのための方法論を開発し、その評価を行うことを目指している。 本年度は、本研究課題の初年度にあたり、統合検索プラットフォームの前提となる、諸条件の設定にかかわる検討、対象となりうる初期プロトタイプのためのデータセット選定と収集、プロトタイプ構築手法の検討を進めた。 特に、手元で構築済みの教育分野のデータセットとして、「教科書LOD」「学習指導要領LOD」「教科書単元LOD」を基に、相互結合を進める方法論の検討、各データセット中のリソースURIだけでなく学習指導要領コード等のキーとなる識別子を元とした横断的な検索・探索ツールの試作を進めてきた。 また、外部サービスとの連携方式として、ウェブAPIを活用して、NHK for SchoolやSUxLAMなどの適切な教育コンテンツを提供するツール群をまとめて探せるような試作ツールも開発した。 今後、具体的な検索シナリオの抽出や索引付けのための統合手法、エンティティ同定手法などの開発を進め、統合検索プラットフォームの構築に向けて進めていく予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題の初年度として、統合検索プラットフォームの全体像の検討、対象となりうる初期プロトタイプのためのデータセット選定と収集、統合検索の一部となりうるデータセット横断型の検索機能の検討を進め、さらに、一部のデータセットについてはSPARQLエンドポイントに対してプロトタイプ的な横断検索ツールを試作しているなど、一部はプロトタイプ構築の段階まで進んでおり、おおむね順調に進行している。 一方、当初、並行して行う予定であった、統合検索プラットフォームそのものの構築などには手がついておらず、そちらの検討も引き続き進める必要がある。
|
Strategy for Future Research Activity |
まず、個別のデータセットから、いくつかの検索シナリオを抽出して、統合検索に役立つエンティティの抽出方法や同定方法を検討する必要がある。さらに、そうした方法論の検討と並行して、そうしたエンティティを自動抽出するための方法論についても引き続き議論と検討を進める。 今後、特に、固有の分野での検索手法を詰めていくことに加えて、複数の分野を横断したデータセット同士をまとめて統合検索する際の方法論を開発する必要があり、そうした取り組みを加速したい。
|
Report
(1 results)
Research Products
(5 results)