2010 年度実績報告書

ウェブにおけるエンティティ間の関係検索に関する研究

研究課題

研究課題/領域番号	22800010
研究機関	東京大学
研究代表者	ボレガラダヌシカ東京大学, 大学院・情報理工学系研究科, 講師 (10581712)
キーワード	関係抽出 / ウェブ工学 / データマイニング / ドメイン適応 / 転移学習 / 自然言語処理 / 人工知能 / 機械学習
研究概要	本研究課題の第一年度目であった平成22年度ではエンティティ間の関係抽出に関する研究を展開した。関係抽出を行う際に教師あり学習が教師なし学習に比べ、より良い精度を出しているが、ウェブのような多様な関係が膨大な数存在するドメインに関してはその全ての関係に関する学習データを人手で作成することは不可能であり、教師あり学習を使うには限界がある。そこで、本研究では対象とする関係に関するエンティティペアをいくつかのみ(シードという)を与えることで関係抽出を行う方法を考案した。提案手法により関係Aを抽出するために学習させた関係抽出器を別の関係Bを抽出するために適応できることが可能となった。提案手法ではまずエンティティペアに含まれる2つのエンティティ間の関係を語彙パターンを使って表現する。語彙パターンはその2つのエンティティが共起する文脈から部分シーケンスとして抽出する。次に、一つの関係についてのみ出現する語彙パターンと様々な関係について出現する語彙パターンをパターンのエントロピーを用いて分類する。パターンのエントロピーはあるパターンがどのようなエンティティペアと一緒に出現するかというパターンの出現頻度分布から計算できる.あるパターンが沢山のエンティティペアと一緒に出現すればその出現頻度分布が平らになり,エントロピーが高くなる.このことを利用し,語彙パターンを分類することができる.数多くのエンティティペアと共起する語彙パターンは様々な意味的関係をカバーできていると考えられるため,そのようなパターンをピボットとして使い,転移学習を行うことができる.次に、同一エンティティペアについて抽出される異なる語彙パターンをエッジで繋げることによりパターンをノードとする2部グラフを構築する。2つの語彙パターン(グラフ上ではノード)はある同一のエンティティペアに対して共起していればそれらのノードをエッジで繋ぐことにする.尚,本提案手法ではエッジの重みはそのエッジが繋ぐ2つの語彙パターンを同時に満たす異なるエンティティペアの数にした.この2部グラフは関係に依存する語彙パターンと関係に依存しない語彙パターンの間の対応関係を示しているものだと考えられる。最後にこの2部グラフのグラフラプラシアンを計算することでどの関係に依存するパターンがどの関係に依存しないパターンに対応しているかを計算する。この対応関係が分かると例えばある関係Aを抽出するために学習させた学習器を別の関係Bを抽出するために使うことができる。評価実験では20種類の異なる関係について評価を行い、様々なベースライン手法と先行研究と比較した。本研究成果はウェブの分野の最高蜂の国際会議であるInternational World Wide Webや人工知能分野の最高峰の国際会議であるInternational Joint Conference on Artificial Intelligenceにて論文として採択されており国外でも高く評価された。

研究成果
(9件)

すべて 2011 その他

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (7件) 備考 (1件)

[雑誌論文] 高速・高精度ウェブ潜在関係エンジンの索引作成と関係表現手法2011
- 著者名/発表者名
  ドウク、ボレガラ、石塚
- 雑誌名
  
  人工知能学会論文誌
  
  巻: 26 ページ: 307-312
- 査読あり
[学会発表] Cross-Language Latent Relational Search : Mapping Knowledge across Languages2011
- 著者名/発表者名
  Duc, Bollegala, Ishizuka
- 学会等名
  National Conf.on Artificial Intelligence (AAAI)
- 発表場所
  San Francisco, USA
- 年月日
  2011-08-07
[学会発表] Exploiting user interest on Social Media for Aggregating Diverse Data2011
- 著者名/発表者名
  Nori, Bollegala, Ishizuka
- 学会等名
  Int'l. AAAI Conf.on Weblogs and Social Media (ICWSM)
- 発表場所
  Barcelona, Spain
- 年月日
  2011-07-20
[学会発表] Relation Adaptation : Learning to Extract Novel Relations with Minimum Supervision2011
- 著者名/発表者名
  Bollegala, Matuso, Ishizuka
- 学会等名
  Int'l Joint Conf.on Artificial Intelligence (IJCAI)
- 発表場所
  Barcelona, Spain
- 年月日
  2011-07-16
[学会発表] Interest Prediction on Multinomal, Time-Evolving Social Graphs2011
- 著者名/発表者名
  Nori, Bollegala, Ishizuka
- 学会等名
  Int'l Joint Conf.on Artificial Intelligence (IJCAI)
- 発表場所
  Barcelona, Spain
- 年月日
  2011-07-16
[学会発表] RankDE : Learning a Ranking Function for IR using DE2011
- 著者名/発表者名
  Bollegala, Noman, Iba
- 学会等名
  Genetic and Evolutionary Computation Conf.(GECCO)
- 発表場所
  Dublin, Ireland
- 年月日
  2011-07-12
[学会発表] Differential Evolution with Self-Adaptive Local Search2011
- 著者名/発表者名
  Noman, Bollegala, Iba
- 学会等名
  Genetic and Evolutionary Computation Conf.(GECCO)
- 発表場所
  Dublin, Ireland
- 年月日
  2011-07-12
[学会発表] Domain Adaptation of Relation Extractors using a Latent Relational Mapping2011
- 著者名/発表者名
  Bollegala, Matuso, Ishizuka
- 学会等名
  International World Wide Web Conference (WWW)
- 発表場所
  Hyderabad, India
- 年月日
  2011-03-28
[備考]
- URL
  http://www.iba.t.u-tokyo.ac.jp/~danushka/publications.html

2010 年度 実績報告書

ウェブにおけるエンティティ間の関係検索に関する研究

研究代表者

ボレガラ ダヌシカ 東京大学, 大学院・情報理工学系研究科, 講師 (10581712)

研究成果

[雑誌論文] 高速・高精度ウェブ潜在関係エンジンの索引作成と関係表現手法2011

著者名/発表者名

雑誌名

[学会発表] Cross-Language Latent Relational Search : Mapping Knowledge across Languages2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Exploiting user interest on Social Media for Aggregating Diverse Data2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Relation Adaptation : Learning to Extract Novel Relations with Minimum Supervision2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Interest Prediction on Multinomal, Time-Evolving Social Graphs2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] RankDE : Learning a Ranking Function for IR using DE2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Differential Evolution with Self-Adaptive Local Search2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Domain Adaptation of Relation Extractors using a Latent Relational Mapping2011

著者名/発表者名

学会等名

発表場所

年月日

[備考]

URL

2010 年度実績報告書

ボレガラダヌシカ東京大学, 大学院・情報理工学系研究科, 講師 (10581712)