本研究では、Wikipedia上のメタデータとして整理したDBPediaの情報を利用した固有名詞とそのタイプ(人名・地名・組織名など)の抽出を行うとともに、そのタイプの情報を考慮した情報検索に有用なインデックスについて検討を行い、固有名詞のタイプを観点(facet)として扱い、複数の観点の存在を考慮したfacet-biasedトピックモデルを提案した。また、Wikipediaの情報の一貫性をDBPediaの情報を用いて分析するためのツールであるWC3を作成し、具体的に、Wikipedia中に存在するメタデータのエラーや、カテゴリ付与の一貫性がかける事例などを指摘できることを確認した。
|