研究課題/領域番号 |
24700133
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 |
研究代表者 |
ボレガラ ダヌシカ 東京大学, 情報理工学(系)研究科, 講師 (10581712)
|
研究期間 (年度) |
2012-04-01 – 2014-03-31
|
研究課題ステータス |
中途終了 (2012年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2014年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2013年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2012年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
|
キーワード | 関係抽出 / 分野適応 / 人工知能 / 自然言語処理 / ウェブマイニング / 転移学習 / 類似尺度 / カーネル関数 / 意味的関係 / 関係類似性 / エンティティ / グラフ構造 / 類推 / 構造同値 |
研究概要 |
本年度ではエンティティ間の意味的関係抽出の分野適応に関して次のように研究計画通り研究を進めることができました.Wikipediaにあるエンティティ関する情報を分析し,それらを三組として表現しているデータセットを使ってグラフを構築しました.このグラフでは頂点はエンティティに対応しており,頂点を結ぶ枝はそれぞれのエンティティがウェブ上で共起する場合にそれらの間の意味的関係を表す語彙パターンにしました.2つの分野(例えば,企業の世界と政治の世界)をそれぞれについて上記の方法を使って別々にグラフを構築しました.次に,各グラフでお互い密に連結しているエンティティを探索しました.簡便のため本研究では3個のエンティティからなる組み合わせのみを考慮しました.今後の研究では,3個以上のエンティティからなる部分構造も考慮していく予定です.次に,それぞれのグラフから生成した3個組のエンティティ間の類似度を計測するために2種類のカーネル関数を提案しました.まず,頂点カーネルではそれぞれのエンティティが持つ属性を比較します.一方の枝カーネルでは2つのエンティティ間の意味的関係を表現する語彙パターンを比較します.提案手法を評価するため,2つのグラフから関係が類似している3個のエンティティを複数の人間によって選択し,標準データセットとして公開しました.このデータセットを用い,先行研究で提案されている関係類似性計測手法と比較したところ提案手法では先行研究を上回る精度が得られることが分かりました.本研究の成果を人工知能分野の最高峰の国際会議であるInternational Joint Conferences on Artificial Intelligence (IJCAI)2013に採録され,論文として発表しました.
|