グラフデータにおける問合せ式充足可能性問題の計算複雑さおよび判定アルゴリズム
Project/Area Number |
21K11900
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60080:Database-related
|
Research Institution | University of Tsukuba |
Principal Investigator |
鈴木 伸崇 筑波大学, 図書館情報メディア系, 教授 (60305779)
|
Co-Investigator(Kenkyū-buntansha) |
權 娟大 国立研究開発法人農業・食品産業技術総合研究機構, 農業情報研究センター, 研究員 (80597097)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥3,120,000 (Direct Cost: ¥2,400,000、Indirect Cost: ¥720,000)
Fiscal Year 2023: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2022: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2021: ¥260,000 (Direct Cost: ¥200,000、Indirect Cost: ¥60,000)
|
Keywords | グラフデータ / スキーマ / 充足可能性問題 |
Outline of Research at the Start |
近年,RDF/グラフデータに対する記述力の高いスキーマ言語が策定されており,主なものとしてShape Expression (ShEx)がある.ShExスキーマSと問合せ式qに対して,もしSに妥当かつqの実行結果が空でないデータが存在するならば,qは充足可能であるという.本研究では,ShExスキーマ下での問合せ式充足可能性問題に着目する.まず,本問題の計算複雑さを明らかにし,その上で本問題を効率よく解くためのアルゴリズムを設計する.次に,得られたアルゴリズムを計算機上に実装して評価実験を行い,提案アルゴリズムの有効性を明らかにする.
|
Outline of Annual Research Achievements |
近年,RDF/グラフデータ(以下,単にグラフデータ)に対する記述力の高いスキーマ言語が策定され,その利用が進みつつある.本研究ではグラフデータを対象に,この分野において基本的かつ重要な問題であるスキーマ下での問合せ式充足可能性問題を中心に考察している.ここで,スキーマSと問合せ式qに対して,もしSに妥当なグラフデータでqの検索結果が空でないものが存在するならば,qはSの下で充足可能であるといい,そうでなければ充足不能であるという.本研究では,スキーマ言語として表現力の高いShape Expression (ShEx)を採用した.2022年度においては,問合せ式の包含性判定問題を解くためのアルゴリズムを考案し,実装を行った.ここで,包含性判定問題は充足可能性問題をより一般化した問題であり,問合せ式q1,q2およびスキーマSに対して,Sに妥当などのデータに対してもq2の解がq1の解に含まれるか否かを判定する問題である.提案アルゴリズムでは,まず,q1とq2との間のノードの対応関係をSを利用して求める.次に,この得られたノードの対応関係に基づいて,q2の辺eでq1に対応するものが存在せず,かつ,eをq1に追加してもq1の解に影響がない場合,eをq1に追加するという操作を繰り返す.最終的にq1がq2の部分グラフであれば,q1はq2を包含していると判定する.提案アルゴリズムをPythonを用いて実装し,予備的な評価実験を行った.その結果,提案アルゴリズムは使用データ全てに対して正しい判定を行なっており,動作効率も概ね良好であることがわかった.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2022年度の目標は,充足可能性問題を解くためのアルゴリズムを実装し,評価実験に向けての準備を整えることであった.2022年度においては,評価実験用のデータはやや不十分であるものの,包含性判定問題を解くためのアルゴリズムを実装した上で予備的な評価実験を行っている.このため,本研究はおおむね順調に進展していると考えられる.
|
Strategy for Future Research Activity |
今後は,提案アルゴリズムに関する評価実験を進めていき,その過程でアルゴリズムに修正の必要性が生じた場合は,アルゴリズムの修正等を行っていく.評価実験では,使用データが現状ではやや少ないため,より多くのデータを揃えた上で評価実験を進めていき,提案アルゴリズムの有効性を評価する予定である.
|
Report
(2 results)
Research Products
(6 results)