Linked Dataは,データのWebとも呼ばれ,急速に普及しつつあるが,データ間のリンク(関係付け)が不十分なため,実用上で大きな問題となっている.本研究では,大規模で様々な種類のデータが分散して提供されているLinked Dataに対して,意味的な関係付けを高速かつ高精度に行う手法を開発することが目的である.そのために,オントロジー・アライメントで使われる機械学習技術とインスタンス・マッチングで使われるブロッキング技術を融合することで新たな意味的な関係付け技術を開発する.2013年度は,研究の開始年に当たるため,主に研究に必要な環境の整備に焦点を当て,下記の2つに分けて研究開発を実施した. 1. Linked Data分析基盤の構築 本研究では,インターネット上で分散して公開されているLinked Dataを研究の対象としている.そのため,最初にデータを収集し,研究用の環境の構築を行う.研究に使うためには,収集したデータを適切なフォーマットに変換したり,不要な部分を除去したりするなどの前処理が必要となる.そのような作業を施した上で,研究用のLinked Dataのデータベースを構築した.さらに,構築したデータベースを利用して,データの特性を分析するために,類似度を視覚化するシステムや検索システムの作成を行った. 2. 単体技術による性能評価とその拡張手法の開発 オントロジー・アライメント手法を適用し,2つのデータの関係の発見を試みた.その過程だけでは,直接の対応関係が見つからない場合に,近傍を効果的に探索することで,新たな関係を発見するアルゴリズムの開発を行った.
|