研究概要 |
意思決定に必要な情報の収集,統合などの自動化のために,セマンティックWebにおいて,様々なデータを結合データ(Linked Data)と呼ばれる形式で公開する試みが急速に広がっている.しかし,これらのデータは,各々,独立に作られているため,意味のある情報検索,情報統合をするには,お互いの結合データ同士を意味的に関係付ける手法が必要となる.本研究の目的は,大量の結合データに対して,お互いの意味的な関係づけを自動的に行う手法の開発である.そのために,言語の類似性などを利用したオントロジー・アライメント技術と,大規模なグラフを取り扱うリンク・マイニング技術の組み合わせにより,結合データの高精度な自動関係付け手法を新たに開発することで,結合データ同士を意味的に関連付けする問題の解決を図る.本年度は,主に研究に必要な環境の整備に焦点を当て,下記の2つに分けて研究開発を実施した. ●結合データの収集と研究用大規模データセットの開発 本研究を開始するに当たり,あらかじめ,分散して存在する結合データを収集し,手元の計算機において,研究ができるような環境の整備を行う.そのための結合データの収集,および,結合データを容易に利用できるようなデータベース環境,データセットの開発を行った. ●オントロジー・アライメント手法,リンク・マイニング手法の適用による意味関係の解析 これまでに,開発してきた機械学習技術に基づくオントロジー・アライメント手法,リンク・マイニング手法を適用することによって,データの意味に関する特性を明らかにした.これにより,オントロジー・アライメント手法,リンク・マイニング手法を組み合わせた効果的な手法を開発するための基礎データを得た.
|