2018 Fiscal Year Research-status Report
大規模グラフデータからスキーマを抽出するための外部記憶アルゴリズムの開発
Project/Area Number |
17K00150
|
Research Institution | University of Tsukuba |
Principal Investigator |
鈴木 伸崇 筑波大学, 図書館情報メディア系, 准教授 (60305779)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | グラフデータ / スキーマ抽出 |
Outline of Annual Research Achievements |
本研究課題の目的は,グラフデータからスキーマを抽出するためのアルゴリズムを構成し,その評価を行うことである.特に,大規模なグラフデータであっても効率よくスキーマを抽出できることも含めて検討を行う.なお,本研究課題では,スキーマとはクラスの集合であり,類似した構造をもつノードが同じクラスに属するものとする.当該年度では,前年度に構成した,グラフデータからのスキーマ抽出アルゴリズムに基づいて,そのアルゴリズムの実装を行い,さらに予備的な評価実験を行なった.アルゴリズムの実装には,開発効率が高いとされるRuby言語を用いている.なお,グラフデータからスキーマを抽出するには,それぞれのノードをどのクラスに属するかを評価・決定するための判定処理が必要であり,この部分を効率化することが重要となる.提案アルゴリズムは,新たな効用関数と処理の並列化を併用することで,大規模なグラフデータに対しても効率よくスキーマ抽出が行えることを目指している.そこで,この評価実験では,従来の効用関数を用いたスキーマ抽出アルゴリズムと提案アルゴリズムの比較を行うことを主要な目的とする.予備的な評価実験の結果,提案アルゴリズムは,従来の効用関数を用いたアルゴリズムよりも効率よくスキーマを抽出することが可能であり,また,抽出されたスキーマの品質も両者でおおむね同程度であることが示唆された.なお,ここで構成されたアルゴリズムは,スキーマとしてクラス集合を前提としているが,今後はより表現力の高いスキーマを視野に入れて考察していくことも含めて検討中である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の予定通りスキーマ抽出アルゴリズムの実装を行い,加えて予備的な評価実験まで行っている.そのため,本研究課題はおおむね順調に進展していると考えている.
|
Strategy for Future Research Activity |
今後は,実装された提案アルゴリズムを用いて評価実験をさらに進展させ,提案アルゴリズムの有効性などについて引き続き評価を行なっていく予定である.また,提案アルゴリズムをより表現力の高いスキーマに対応させることについても考察していく予定である.
|