情報信頼性を考慮したWikipediaからの知識抽出に関する研究

研究課題

研究課題/領域番号	09J04675
研究種目	特別研究員奨励費
配分区分	補助金
応募区分	国内
研究分野	メディア情報学・データベース
研究機関	大阪大学
研究代表者	伊藤雅弘大阪大学, 大学院・情報科学研究科, 特別研究員(DC2)
研究期間 (年度)	2009 – 2010
研究課題ステータス	完了 (2010年度)
配分額 *注記	1,400千円 (直接経費: 1,400千円) 2010年度: 700千円 (直接経費: 700千円) 2009年度: 700千円 (直接経費: 700千円)
キーワード	Wikipedia / マイニング / 知識抽出 / 概念間関連度 / シソーラス / 情報信頼性 / テストコレクション / 概念構造
研究概要	Wikipediaは,「群集の叡智」と呼ばれる形式の新しいソーシャルメディアであり,知識抽出のためのコーパスとして,その有用性が研究者の間でも急速に注目を集めはじめている.このため,「誰でも編集可能である」という特性が大規模なコンテンツの構築を可能にしている一方で,情報の信頼性を如何に確保するかが大きな課題となっている.本研究では,Wikipediaにおける情報の質向上や関係性に影響を与える要素を調査し利用することによって,精度の高い意味抽出を目指す. 本年度では,Wikipediaに存在する概念構造の分野による偏りに着目し,ある程度整理された情報源であるWikipediaと大量の情報を持つWebを融合することにより,Wikipedia中の概念構造において欠落した概念を同定する手法を設計し,評価した.評価の結果,Wikipediaには存在しないが,実際には存在する概念をWeb上の膨大な情報の中から発見できることを確認した.しかし,同義語判別処理の精度向上が必要であることも分かった. また,昨年度に構築したWikipediaの概念を元にしたテストコレクションである「WikiSimi Test Collection」を用い,学習データとして機械学習手法に適用することにより,記事内のリンク数やカテゴリへの所属情報などWikipediaの記事から取得可能な情報や,これまで提案されてきた概念間関連度の測定手法の値などで,どのような要素が概念間関連度の測定に影響を与えているかを調査した.さらに,回帰問題を解くことができる機械学習手法によって,それら種々の情報(条件)を考慮した概念間関連度の測定を行った.評価実験の結果,提案手法はほとんどの概念間で従来手法よりも高精度に概念間関連度を測定できていることが分かった.本研究成果は,概念間の関連度という汎用性の高い知識源を提供することを可能とし,情報検索や文書分類,連想支援などの研究やアプリケーションで利用することができる.

報告書

(2件)

2010 実績報告書
2009 実績報告書

研究成果

(7件)

すべて 2011 2010 2009

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (4件)

[雑誌論文] Semantic Relatedness Measurement based on Wikipedia Link Co-occurrence Analysis2011
- 著者名/発表者名
  Masahiro Ito
- 雑誌名
  
  International Journal of Web Information Systems (IJWIS)
- 関連する報告書
  2010 実績報告書
- 査読あり
[雑誌論文] Wikipedia マイニング近未来チャレンジキックオフ編2009
- 著者名/発表者名
  中山浩太郎, 伊藤雅弘, Erdmann Maike, 白川真澄, 道下智之, 原隆浩, 西尾章治郎
- 雑誌名
  
  人工知能学会論文誌 Vol.24, No.6
  
  ページ: 549-557
- 関連する報告書
  2009 実績報告書
- 査読あり
[雑誌論文] Wikipedia マイニング:Wikipedia 研究のサーベイ2009
- 著者名/発表者名
  中山浩太郎, 伊藤雅弘, Erdmann Maike, 白川真澄, 道下智之, 原隆浩, 西尾章治郎
- 雑誌名
  
  情報処理学会論文誌:データベース Vol.2 No.4
  
  ページ: 49-60
- NAID
  110007990066
- 関連する報告書
  2009 実績報告書
- 査読あり
[学会発表] Wikipediaの多様な特徴を利用した概念間関連度と有用な特徴の調査2010
- 著者名/発表者名
  伊藤雅弘
- 学会等名
  電子情報通信学会技術研究報告 (データ工学研究会DE2010-26)
- 発表場所
  産業技術総合研究所秋葉原事業所(ダイビル)
- 年月日
  2010-12-06
- 関連する報告書
  2010 実績報告書
[学会発表] Web上の情報を用いたWikipedia記事の信頼性評価に関する検討2010
- 著者名/発表者名
  伊藤雅弘
- 学会等名
  第24回人工知能学会全国大会 (JSAI 2010)
- 発表場所
  長崎ブリックホール(長崎県長崎市)
- 年月日
  2010-06-10
- 関連する報告書
  2010 実績報告書
[学会発表] Wikipedia の概念に基づく連想関係テストコレクション「WikiSimi3000」2009
- 著者名/発表者名
  伊藤雅弘
- 学会等名
  第23回人工知能学会全国大会
- 発表場所
  香川県高松市
- 年月日
  2009-06-18
- 関連する報告書
  2009 実績報告書
[学会発表] Wikipedia Relatedness Measurement Methods and Influential Features2009
- 著者名/発表者名
  伊藤雅弘
- 学会等名
  IEEE Int'l Symposium on Mining And Web(MAW 2009)
- 発表場所
  Bradford, UK
- 年月日
  2009-05-29
- 関連する報告書
  2009 実績報告書

情報信頼性を考慮したWikipediaからの知識抽出に関する研究

研究代表者

伊藤 雅弘 大阪大学, 大学院・情報科学研究科, 特別研究員(DC2)

1,400千円 (直接経費: 1,400千円)

報告書

研究成果

[雑誌論文] Semantic Relatedness Measurement based on Wikipedia Link Co-occurrence Analysis2011

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Wikipedia マイニング近未来チャレンジキックオフ編2009

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Wikipedia マイニング:Wikipedia 研究のサーベイ2009

著者名/発表者名

雑誌名

NAID

関連する報告書

[学会発表] Wikipediaの多様な特徴を利用した概念間関連度と有用な特徴の調査2010

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Web上の情報を用いたWikipedia記事の信頼性評価に関する検討2010

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Wikipedia の概念に基づく連想関係テストコレクション「WikiSimi3000」2009

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Wikipedia Relatedness Measurement Methods and Influential Features2009

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

伊藤雅弘大阪大学, 大学院・情報科学研究科, 特別研究員(DC2)