2009 年度実績報告書

情報信頼性を考慮したWikipediaからの知識抽出に関する研究

研究課題

研究課題/領域番号	09J04675
研究機関	大阪大学
研究代表者	伊藤雅弘大阪大学, 大学院・情報科学研究科, 特別研究員(DC2)
キーワード	Wikipedia / マイニング / 知識抽出 / シソーラス / 情報信頼性 / テストコレクション / 概念構造
研究概要	Wikipediaは,「群集の叡智」と呼ばれる形式の新しいソーシャルメディアであり,知識抽出のためのコーパスとして,その有用性が研究者の間でも急速に注目を集めはじめている.一方で,Wikipediaの情報には内容に偏りがあったり,また虚偽の情報が記載されているケースも存在する.このため,「誰でも編集可能である」という特性が大規模なコンテンツの構築を可能にしている一方で,情報の信頼性を如何に確保するかが大きな課題となっている。そこで本研究ではWikipediaにおいて情報の信頼性を評価し向上するための技術を開発することによって,Wikipediaの情報の質や精度の高い意味情報の抽出を目指す.本年度では,どのような因子が情報の信頼性に影響を及ぼすのかを多角的に調査した.その中で特に注目した点は,Wikipediaは概念構造が分野により偏りがあるということである.例えば,日本語版Wikipedia場合,サブカルチャーに関する項目は非常に充実している一方,手薄な分野も存在する.これは,ユーザの文化的背景の影響という意味では興味深い現象ではあるが,百科事典的情報源としては網羅性の確保が重要である.そこで,ある程度整理された情報源であるWikipediaと大量の情報を持つWebを融合することにより,Wikipedia中の欠落する概念を同定し,提示及び自動的に概念構造に追加する手法を設計している.また,同時にWikipediaから概念の関連構造を構築する手法の有効性を評価するためのテストコレクション「WikiSimi Test Collection」を構築した.これは,複数の被験者に約2000ペアの概念の関連度をスコアリングしてもらうことによって構築した.これは来年度以降,設計中の手法の評価に用いることができるだけでなく,他の研究者にも利用価値の高いテストコレクションである.

研究成果

(4件)

すべて 2009

すべて雑誌論文 (2件) (うち査読あり 2件) 学会発表 (2件)

[雑誌論文] Wikipedia マイニング近未来チャレンジキックオフ編2009
- 著者名/発表者名
  中山浩太郎, 伊藤雅弘, Erdmann Maike, 白川真澄, 道下智之, 原隆浩, 西尾章治郎
- 雑誌名
  
  人工知能学会論文誌 Vol.24, No.6
  
  ページ: 549-557
- 査読あり
[雑誌論文] Wikipedia マイニング:Wikipedia 研究のサーベイ2009
- 著者名/発表者名
  中山浩太郎, 伊藤雅弘, Erdmann Maike, 白川真澄, 道下智之, 原隆浩, 西尾章治郎
- 雑誌名
  
  情報処理学会論文誌:データベース Vol.2 No.4
  
  ページ: 49-60
- 査読あり
[学会発表] Wikipedia の概念に基づく連想関係テストコレクション「WikiSimi3000」2009
- 著者名/発表者名
  伊藤雅弘
- 学会等名
  第23回人工知能学会全国大会
- 発表場所
  香川県高松市
- 年月日
  2009-06-18
[学会発表] Wikipedia Relatedness Measurement Methods and Influential Features2009
- 著者名/発表者名
  伊藤雅弘
- 学会等名
  IEEE Int'l Symposium on Mining And Web(MAW 2009)
- 発表場所
  Bradford, UK
- 年月日
  2009-05-29

2009 年度 実績報告書

情報信頼性を考慮したWikipediaからの知識抽出に関する研究

研究代表者

伊藤 雅弘 大阪大学, 大学院・情報科学研究科, 特別研究員(DC2)

研究成果

[雑誌論文] Wikipedia マイニング近未来チャレンジキックオフ編2009

著者名/発表者名

雑誌名

[雑誌論文] Wikipedia マイニング:Wikipedia 研究のサーベイ2009

著者名/発表者名

雑誌名

[学会発表] Wikipedia の概念に基づく連想関係テストコレクション「WikiSimi3000」2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Wikipedia Relatedness Measurement Methods and Influential Features2009

著者名/発表者名

学会等名

発表場所

年月日

2009 年度実績報告書

伊藤雅弘大阪大学, 大学院・情報科学研究科, 特別研究員(DC2)