研究概要 |
新聞記事に対して,各新聞社では大規模なカテゴリを定義しており,さらに分類の大きさにより階層を成している.一般的に知られているように,カテゴリによっては分類精度を著しく悪化させるものがあるため,カテゴリおよびカテゴリ階層と文書分類手法との分類精度の関係の調査研究を行った.それにより,カテゴリ階層を用いて動的に自動分類を行うことで,分類精度を向上させることが可能であることを示した.また,自動分類した分類結果を学習データとして用いて,自動分類を時系列に沿って行う時系列再帰学習を行うことにより,適合率を低下させることなく再現率を向上させることが可能であることも示すことができた.これらは,山梨日日新聞社から提供を受けた8年間におよぶ実際の新聞記事に対して評価実験を行うことにより検証を行った. 一方,新聞記事をコンテンツとして扱う場合,コンテンツ配信にかかわる情報流通ネットワークの構築を考える必要があり,それをピアツーピアネットワークを用いて大規模かつ超分散環境における情報検索を行う手法を示した.ピアツーピアネットワーク上における有用なコンテンツを見つけ出すために,Web技術でスコアリングの基準として用いられる分類子や抽出子の概念を,ピアツーピアネットワーク情報検索に導入することにより,超分散環境下においても情報検索が可能とした.また,検索対象とする情報に概念階層を導入することにより,ネットワークのトラヒックを効果的に抑制できることも示した.
|