研究分担者 |
岩井原 瑞穂 早稲田大学, 理工学術院(情報生産システム研究科), 教授 (40253538)
馬 強 京都大学, 情報学研究科, 助教 (30415856)
浅野 泰仁 京都大学, 情報学研究科, 特定准教授 (20361157)
清水 敏之 京都大学, 情報学研究科, 特定助教 (60402468)
鈴木 優 京都大学, 情報学研究科, 特定研究員 (40388111)
|
研究概要 |
本課題では,Web上で公開されている多様な集合知を体系化して,より品質の高い情報を効率良く探索するための基盤技術について研究を行い,今年度は主に以下の結果を得た. 実世界の事象には複雑な関係がある.これらの関係を整理して知識化することは,我々の実世界に対する理解を支援するための有効な手段である.本研究では,事象間の因果関係に着目した.特にニュース記事を対象として事象の同定と因果関係の抽出を行いその体系化を行うための研究開発行った.我々の手法では,日々新たに追加されるニュース記事から増分的に因果関係を抽出することができる,現在,様々な知識サーチの研究が盛んになってきているが,重要なテーマとして「関係に関する知識の検索」がある.例としては、「石油とアメリカの関係を成り立たせているのは何か?」などの問合せが考えられる.関係に関する知識検索は,社会的に重要なものが多いにもかかわらず、既存のキーワード型検索エンジンでは極めて困難である.本研究では,集合知として構築されているWikipediaを対象とし,Wikipediaのリンク構造と減衰流を用いてオブジェクトや事象の間の関係をモデル化し,その強さを求める手法や,関係を説明する手法を構築した.また,Wikipediaの複数個の記事間の関連度を数値化してする手法を開発した. Wikipediaにおいて記事の信頼度を推定する方法として,書かれた記事がその後,削除されなかった期間を用いる手法がある.信頼度を算出する際に,重要となる著者であるキーパーソンを特定し,それら重要な著者の情報だけを利用して記事の信頼度を算出することによって,全ての著者を利用して信頼度を算出する方法よりも精度の高い信頼度を算出する手法を開発した. また,大量の分布データから問合せと類似した分布を検索するために,多段順次走査などの手法を用いた高速アルゴリズムを開発した.
|