研究課題/領域番号 |
15K16090
|
研究機関 | 慶應義塾大学 |
研究代表者 |
森田 武史 慶應義塾大学, 理工学部(矢上), 講師 (50590171)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | セマンティックWeb / オントロジー / Wikipedia / Linked Data / オントロジーアライメント / オントロジー学習 / WordNet |
研究実績の概要 |
本研究では,大規模多言語RDFグラフからクラススキーマ階層を構築することを目的とする.これまでに,日本語Wikipediaからオントロジー(JWO)を自動構築し,日本語WordNetと統合することにより,クラススキーマ階層を構築手法を提案してきた.本研究では,大規模多言語RDFグラフ(DBpediaおよびBabelNet)に先行研究で提案した手法を適用する.多言語に対応したクラススキーマ階層構築を試みている研究は,国内外の関連研究には見受けられないため,独創的であると考えられる.本研究で構築するクラススキーマ階層は,RDFグラフを活用した質問応答システム,ドメインオントロジーを構築するための参照リソース,RDFグラフの推論を用いた検索等への活用が期待できる. 平成28年度は,JWOのオントロジー構築手法を英語版Wikipediaに適用し,英語版のWikipediaオントロジーを構築した.また,既存の英語版Wikipediaから構築されたオントロジーであるYAGOとの比較評価を行った.その結果,YAGOでは抽出できていない関係を抽出可能であることが確認できた.また,これまでJWOではWikipediaの記事本文は情報源として利用してこなかったが,記事本文からword2vecにより構築した分散表現と既存のJWOにおけるクラスーインスタンス関係から,新たなクラスーインスタンス関係を抽出する手法の開発を試みた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
当初の計画では,平成28年度は,DBpedia(YAGO)とBabelNetのクラス階層およびクラスーインスタンス関係から,クラススキーマ階層の構築と洗練を行う予定であった.しかしながら,DBpediaおよびBabelNetは,非常に大規模であるため,計画通りにクラススキーマ階層の構築を行うことができていない.多言語版に展開する前に,英語版のWikipediaから構築されたオントロジーである,JWOとDBpediaおよびYAGOに対して,クラススキーマ階層の構築と洗練を試みることに当面は注力したい.また,分散表現を利用した新しいオントロジー学習手法が最近,注目を集めているため,Wikipediaの記事本文を活用可能な新たな手法の利用についても検討していきたい.
|
今後の研究の推進方策 |
先行研究で開発してきた半自動的にクラスーインスタンス関係の洗練やクラススキーマ階層を構築する方法では,リソース数が膨大なDBpediaやBabelNetに適用することは困難であるため,人手を介さずに,自動的にクラススキーマ階層を構築する方法を検討したい. 当初は大規模多言語RDFグラフを対象とすることを想定していたが,英語版のWikipediaから構築されたオントロジーおよびLODである,YAGOおよびDBpediaを対象にクラススキーマ階層とその洗練を行うことでさえ困難であるため,研究計画を変更し,BabelNetからのクラススキーマ階層構築は断念したい. 平成29年度は,平成28年度に構築した英語版Wikipediaから構築したオントロジーに対してクラススキーマ階層の構築を試みた後に,YAGOおよびDBpediaに対してクラススキーマ階層の構築を試みる予定である.また,英語版Wikipediaの記事本文をword2vecにより分散表現に変換し,それらと英語版Wikipediaにおける半構造情報から抽出した関係を利用して,機械学習的なアプローチにより,自動的にクラススキーマ階層を含む新たな関係を抽出する手法の開発も検討したい.
|
次年度使用額が生じた理由 |
ノートPC等の開発環境は整っていたため,研究計画の時に想定していたよりも物品を購入する必要がなくなったため.
|
次年度使用額の使用計画 |
国際会議やワークショップに論文を投稿し,旅費や参加費として使用する予定である.
|