2012 Fiscal Year Annual Research Report
日本語Wikipediaからの大規模オントロジー学習
Project/Area Number |
12J00003
|
Research Institution | Keio University |
Principal Investigator |
玉川 奨 慶應義塾大学, 理工学研究科, 特別研究員(DC2)
|
Keywords | オントロジー / オントロジー構築 / オントロジー学習 / Linked Open Data / 質問応答 |
Research Abstract |
オントロジーはデータ検索やデータ統合等に有用であるが,大規模なオントロジーの手動構築は保守や更新が難しいため,オントロジーの自動構築(学習)が注目されている.本研究は日本語Wikipediaを情報資源として大規模なオントロジー学習を行い,構築したオントロジー(日本語Wikipediaオントロジー)を利用することでオントロジーを普及させることを目的とする.本年度は有用性を考慮し,これまでに構築した日本語Wikipediaオントロジーのプロパティ及びクラス階層を洗練することで,より利便性の高いクラススキーマ階層の構築を行った.加えて,dc:title・foafmadeのような標準語彙と日本語Wikipediaオントロジーのプロパティの対応関係を構築し,日本語標準語彙としての利用可能性を示した.こうした有用性の向上はLinked Open Data(LOD)が国内でも普及しはじめている現状に起因している.LODとは,コンピュータが利用可能な構造化されたデータを公開・共有させる取り組みであり,欧米で普及しているが,国内でも,次第に普及しはじめている.DBpediaはWikipediaから半自動的に構築されたデータベースであるが,海外のLODのハブとして広く利用されている.このDBpediaのように,我々の日本語Wikipediaオントロジーを日本語LODのハブとして利用してもらうことで,本研究の目的であるオントロジーの普及を目指すとともに,次年度の研究計画である日本語Wikipediaオントロジーを利用した質問応答システムを構築する際に必要となるデータ規模の拡大を目指す. 本研究のホームページを公開しており、LODとして利用することが可能である. 日本語Wikipediaオントロジープロジェクトページ:http://www.wikipediaontology.org
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ほぼ年次計画通りに研究が進んでおり,日本語Wikipediaオントロジーの関係数が拡大し,有用性の向上を図れた.また,Linked Open DataチャレンジJapan2012において,データセット部門優秀賞を受賞し,LODのハブとしての認知も向上した.
|
Strategy for Future Research Activity |
今後も有用性の向上を図る一方,質問応答システムの構築を目指す.具体的には,Linked Open Dataにおけるハブとして,更なる普及を目指す一方,日本語の標準語彙として日本語Wikipediaオントロジーのプロパティを利用してもらうように,プロパティの表記揺れ問題の対策を試みる.このプロパティの表記揺れ問題を解決することで,質問応答システムを構築する際に,応答精度を上げることが可能になると考えている.
|
Research Products
(6 results)