2016 Fiscal Year Annual Research Report
Linked Open Data 利活用のためのクエリ共有手法に関する研究
Project/Area Number |
15H02781
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
濱崎 雅弘 国立研究開発法人産業技術総合研究所, 情報技術研究部門, 研究グループ長 (50419016)
|
Co-Investigator(Kenkyū-buntansha) |
的野 晃整 国立研究開発法人産業技術総合研究所, 人工知能研究センター, 主任研究員 (10443227)
大向 一輝 国立情報学研究所, コンテンツ科学研究系, 准教授 (30413925)
Lynden Steven 国立研究開発法人産業技術総合研究所, 人工知能研究センター, 研究員 (30528279)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 情報システム / Linked Open Data / クエリ共有 / 情報推薦 / セマンティックウェブ / RDF / SPARQL |
Outline of Annual Research Achievements |
本研究では,Linked Open Data(LOD)の利活用を阻害する最大の要因であるLOD検索の困難さに対して,クエリ共有が有効であることを明らかにする.具体的は,(課題1)クエリ生成の支援に有効な共有クエリ推薦技術の研究開発,(課題2)クエリ実行の高速化に有効なクエリキャッシュ技術の研究開発,の二つの研究を実施する.
今年度は,昨年度に研究開発したクエリキャッシュの基盤技術(RDF問い合わせ最適化技術)の改良に着手した.本手法は結合選択率の間接的見積もりを用いることにより精度改善を達成したものである.本成果は高く評価され国内学会にて表彰された(情報処理学会 2016年度山下記念研究賞).また,統合クエリ(Federated Query)のキャッシュ技術についても研究開発を進めた.提案手法では完全な検索結果を返すのではなく,類似した検索結果を返すというアプローチを取る.Coverage(より多くの検索結果が含まれる),Freshness(より新しい情報が含まれる),Diversity(より多くの情報源から取得する)の三つの観点から評価した結果,既存手法と比較して最大30%の向上を達成した.さらに,実際にWeb上で公開されているLODデータセットおよびSPARQLエンドポイントについて調査を行った.これは統合クエリを活用するには複数のLODデータセットおよびSPARQLエンドポイントが必要となるが,それらについての情報の整備が特に国内においては不十分だからである.可用性や処理性能,他のLODとの接続性といった点について,国内50件以上のLODデータセットおよびSPARQLエンドポイントに対して調査を行った.調査結果についてはWeb公開する予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では,クエリ共有により複数のSPARQLエンドポイントを横断的に利用したLODのアプリケーションの開発の支援を目標の一つとしている.LOD は本質的に複雑性,異種性,分散性および大規模性を有しているが,これらの特徴を活かした横断的データ活用こそがLODアプリケーションの魅力であると考える.しかしそのためには横断的に利用可能な複数のLODデータセットおよびSPARQLエンドポイントを把握していること,さらにそれらを横断的に検索できる統合クエリ(Federated Query)を活用できることが必要となる.そこで今年度は,国内50件以上のLODデータセットおよびSPARQLエンドポイントについて調査を行った.さらに,キャッシュを利用した統合クエリの問合わせ処理技術について研究開発を進め,既存手法よりも最大30%の性能向上を達成した新手法を提案した.
|
Strategy for Future Research Activity |
本研究では,(課題1)クエリ推薦と,(課題2)クエリキャッシュの二つの研究を実施する.本プロジェクトでは全体計画として,当該予算を勘案し,各課題を解決するアルゴリズムの研究と,そのアルゴリズムをクエリ共有システムに組み込むためのモジュール開発を目標として設定した.プロジェクト最終年度にあたる今年度は,各課題をそれぞれ深化させると共に,各アルゴリズムのモジュール化を進め,将来的にクエリ共有システムのコアとなるパーツを構築することを目指す.
|
Research Products
(4 results)