研究課題/領域番号 |
21K11900
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60080:データベース関連
|
研究機関 | 筑波大学 |
研究代表者 |
鈴木 伸崇 筑波大学, 図書館情報メディア系, 教授 (60305779)
|
研究分担者 |
權 娟大 国立研究開発法人農業・食品産業技術総合研究機構, 農業情報研究センター, 研究員 (80597097)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2021年度: 260千円 (直接経費: 200千円、間接経費: 60千円)
|
キーワード | グラフデータ / スキーマ / 充足可能性問題 |
研究開始時の研究の概要 |
近年,RDF/グラフデータに対する記述力の高いスキーマ言語が策定されており,主なものとしてShape Expression (ShEx)がある.ShExスキーマSと問合せ式qに対して,もしSに妥当かつqの実行結果が空でないデータが存在するならば,qは充足可能であるという.本研究では,ShExスキーマ下での問合せ式充足可能性問題に着目する.まず,本問題の計算複雑さを明らかにし,その上で本問題を効率よく解くためのアルゴリズムを設計する.次に,得られたアルゴリズムを計算機上に実装して評価実験を行い,提案アルゴリズムの有効性を明らかにする.
|
研究実績の概要 |
近年,RDF/グラフデータ(以下,単にグラフデータ)に対する記述力の高いスキーマ言語が策定され,その利用が進みつつある.本研究ではグラフデータを対象に,この分野において基本的かつ重要な問題であるスキーマ下での問合せ式充足可能性問題を中心に考察している.ここで,スキーマSと問合せ式qに対して,もしSに妥当なグラフデータでqの検索結果が空でないものが存在するならば,qはSの下で充足可能であるといい,そうでなければ充足不能であるという.本研究では,スキーマ言語として表現力の高いShape Expression (ShEx)を採用した.2022年度においては,問合せ式の包含性判定問題を解くためのアルゴリズムを考案し,実装を行った.ここで,包含性判定問題は充足可能性問題をより一般化した問題であり,問合せ式q1,q2およびスキーマSに対して,Sに妥当などのデータに対してもq2の解がq1の解に含まれるか否かを判定する問題である.提案アルゴリズムでは,まず,q1とq2との間のノードの対応関係をSを利用して求める.次に,この得られたノードの対応関係に基づいて,q2の辺eでq1に対応するものが存在せず,かつ,eをq1に追加してもq1の解に影響がない場合,eをq1に追加するという操作を繰り返す.最終的にq1がq2の部分グラフであれば,q1はq2を包含していると判定する.提案アルゴリズムをPythonを用いて実装し,予備的な評価実験を行った.その結果,提案アルゴリズムは使用データ全てに対して正しい判定を行なっており,動作効率も概ね良好であることがわかった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2022年度の目標は,充足可能性問題を解くためのアルゴリズムを実装し,評価実験に向けての準備を整えることであった.2022年度においては,評価実験用のデータはやや不十分であるものの,包含性判定問題を解くためのアルゴリズムを実装した上で予備的な評価実験を行っている.このため,本研究はおおむね順調に進展していると考えられる.
|
今後の研究の推進方策 |
今後は,提案アルゴリズムに関する評価実験を進めていき,その過程でアルゴリズムに修正の必要性が生じた場合は,アルゴリズムの修正等を行っていく.評価実験では,使用データが現状ではやや少ないため,より多くのデータを揃えた上で評価実験を進めていき,提案アルゴリズムの有効性を評価する予定である.
|