本年度ではエンティティ間の意味的関係抽出の分野適応に関して次のように研究計画通り研究を進めることができました.Wikipediaにあるエンティティ関する情報を分析し,それらを三組として表現しているデータセットを使ってグラフを構築しました.このグラフでは頂点はエンティティに対応しており,頂点を結ぶ枝はそれぞれのエンティティがウェブ上で共起する場合にそれらの間の意味的関係を表す語彙パターンにしました.2つの分野(例えば,企業の世界と政治の世界)をそれぞれについて上記の方法を使って別々にグラフを構築しました.次に,各グラフでお互い密に連結しているエンティティを探索しました.簡便のため本研究では3個のエンティティからなる組み合わせのみを考慮しました.今後の研究では,3個以上のエンティティからなる部分構造も考慮していく予定です.次に,それぞれのグラフから生成した3個組のエンティティ間の類似度を計測するために2種類のカーネル関数を提案しました.まず,頂点カーネルではそれぞれのエンティティが持つ属性を比較します.一方の枝カーネルでは2つのエンティティ間の意味的関係を表現する語彙パターンを比較します.提案手法を評価するため,2つのグラフから関係が類似している3個のエンティティを複数の人間によって選択し,標準データセットとして公開しました.このデータセットを用い,先行研究で提案されている関係類似性計測手法と比較したところ提案手法では先行研究を上回る精度が得られることが分かりました.本研究の成果を人工知能分野の最高峰の国際会議であるInternational Joint Conferences on Artificial Intelligence (IJCAI)2013に採録され,論文として発表しました.
|