研究概要 |
オントロジーはデータ検索やデータ統合等に有用であるが,大規模なオントロジーの手動構築は保守や更新が難しいため,オントロジーの自動構築(学習)が注目されている.本研究は日本語Wikipediaを情報資源として大規模なオントロジー学習を行い,構築したオントロジー(日本語Wikipediaオントロジー)を利用することでオントロジーを普及させることを目的とする.本年度は有用性を考慮し,これまでに構築した日本語Wikipediaオントロジーのプロパティ及びクラス階層を洗練することで,より利便性の高いクラススキーマ階層の構築を行った.加えて,dc:title・foafmadeのような標準語彙と日本語Wikipediaオントロジーのプロパティの対応関係を構築し,日本語標準語彙としての利用可能性を示した.こうした有用性の向上はLinked Open Data(LOD)が国内でも普及しはじめている現状に起因している.LODとは,コンピュータが利用可能な構造化されたデータを公開・共有させる取り組みであり,欧米で普及しているが,国内でも,次第に普及しはじめている.DBpediaはWikipediaから半自動的に構築されたデータベースであるが,海外のLODのハブとして広く利用されている.このDBpediaのように,我々の日本語Wikipediaオントロジーを日本語LODのハブとして利用してもらうことで,本研究の目的であるオントロジーの普及を目指すとともに,次年度の研究計画である日本語Wikipediaオントロジーを利用した質問応答システムを構築する際に必要となるデータ規模の拡大を目指す. 本研究のホームページを公開しており、LODとして利用することが可能である. 日本語Wikipediaオントロジープロジェクトページ:http://www.wikipediaontology.org
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
ほぼ年次計画通りに研究が進んでおり,日本語Wikipediaオントロジーの関係数が拡大し,有用性の向上を図れた.また,Linked Open DataチャレンジJapan2012において,データセット部門優秀賞を受賞し,LODのハブとしての認知も向上した.
|
今後の研究の推進方策 |
今後も有用性の向上を図る一方,質問応答システムの構築を目指す.具体的には,Linked Open Dataにおけるハブとして,更なる普及を目指す一方,日本語の標準語彙として日本語Wikipediaオントロジーのプロパティを利用してもらうように,プロパティの表記揺れ問題の対策を試みる.このプロパティの表記揺れ問題を解決することで,質問応答システムを構築する際に,応答精度を上げることが可能になると考えている.
|