2015 Fiscal Year Annual Research Report
Linked Open Data 利活用のためのクエリ共有手法に関する研究
Project/Area Number |
15H02781
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
濱崎 雅弘 国立研究開発法人産業技術総合研究所, 情報技術研究部門, 主任研究員 (50419016)
|
Co-Investigator(Kenkyū-buntansha) |
的野 晃整 国立研究開発法人産業技術総合研究所, 人工知能研究センター, 主任研究員 (10443227)
大向 一輝 国立情報学研究所, 大学共同利用機関等の部局等, 准教授 (30413925)
Lynden Steven 国立研究開発法人産業技術総合研究所, 人工知能研究センター, 研究員 (30528279)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 情報システム / Linked Open Data / クエリ共有 / 情報推薦 / セマンティックウェブ / RDF / SPARQL |
Outline of Annual Research Achievements |
本研究では,Linked Open Data(LOD)の利活用を阻害する最大の要因であるLOD検索の困難さに対して,クエリ共有が有効であることを明らかにする.具体的には,(課題1)クエリ生成の支援に有効な共有クエリ推薦技術の研究開発,(課題2)クエリ実行の高速化に有効なクエリキャッシュ技術の研究開発,の二つの研究を実施する.
今年度は,クエリ推薦に資する知見を得るために,SPARQLクエリの利用状況について調査を行った.具体的には日本語 LOD の SPARQL クエリログを分析した.分析にあたっては日本語 DBpedia の 1300 万件のアクセスログを利用した.分析結果からは,日本語 DBpedia は利用者数は増加傾向にあること,SPARQL キーワード,参照 URI いずれも人気のものとそうでないものが存在していること,クエリの文字列長やクエリで利用される URI が時間経過とともに増えていることがわかった.クエリキャッシュの基盤技術として,RDF 問合せ最適化技術を研究開発した.具体的には,結合選択率の間接的見積り手法を新たに提案した.実データを用いた実験を通じて,提案手法と従来の手法を比べた結果,提案した手法は改善の余地は残されているものの,従来手法と比べ大幅な (最大 11 桁) 精度改善を確認した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では、二つの課題設定をしているが、(課題1)クエリ生成の支援に有効な共有クエリ推薦技術の研究開発については、既存のSPARQLエンドポイントのアクセスログ解析により、クエリ推薦に必要なSPARQLクエリ利用者のクエリパターンに関する知見が得られた。(課題2)クエリ実行の高速化に有効なクエリキャッシュ技術の研究開発については、結合選択率の間接的見積り手法を新たに提案し、RDF 問合せ最適化のための基礎技術の開発を行った。二つの課題設定についてそれぞれ順調に成果を上げることができた。
|
Strategy for Future Research Activity |
昨年度のクエリ間の類似度計算アルゴリズムの研究開発,および,エンドポイントの利用ログを用いたユーザが作成したクエリのパターン調査結果を踏まえて,課題1 と2 のそれぞれを深化させるよう研究を進める.具体的にはクエリ推薦ではユーザ適応に,クエリキャッシュでは結合選択率の見積もりアルゴリズムの精度向上に取り組む.
|
Research Products
(4 results)