研究概要 |
本研究では,既存リソースを活用したセマンティックWebにおける領域オントロジー構築支援方法論の提案および構築支援ツールの開発を研究目的とする.20年度は,即時更新性,語彙網羅性に優れたオンライン百科事典Wikipediaから汎用オントロジー(Wikipedia Ontology)を構築する方法を考案し,構築支援ツールの開発を行った.Wikipedia Ontologyの構成要素は,関連関係,同義語,クラス-インスタンス関係,Is-a関係,プロパティおよびプロパティ定義域である.Wikipediaマイニングを行い,Wikipedia記事のリンク構造を解析することで記事間の関連度を求め,関連度の高い記事間の関係を関連関係として抽出する.Wikipediaリダイレクトリンクを用いて,リダイレクト元の記事名とリダイレクト先の記事名との関係を同義語の関係として抽出する.Wikipedia一覧記事に対するスクレイピングを行いクラス-インスタンス関係を抽出する.Wikipediaカテゴリツリーに対して後方文字列照合および前方文字列照合部除去という2種類の文字列照合を行いIs-a関係を抽出する.また,Infoboxテンプレート名とカテゴリ名の照合を行うことで,文字列照合では獲得できないIs-a関係を抽出する.Infoboxの項目をプロパティとみなして抽出し,そのInfoboxを有する記事が属するカテゴリをプロパティの定義域として定義する.以上の方法で構築したWikipedia OntologyはOWL形式で記述され,前年度までに開発を行った領域オントロジー構築支援環境DODDLE-OWLにおける参照オントロジーとして利用可能となっている.Wikipedia Ontologyは,検索の精度向上,統計処理,ソーシャルタギングにおけるタグの概念化など,新しいWebサービスの展開に貢献することが期待できる.開発したWikipedia Ontologyおよびその構築支援ツールは,SourceForge.jpにて,フリーソフトウェアとして公開した(URL:http://wikipedia-ont.sourceforge.jp/).
|