Web上のデータは,多様性の増大と情報量の爆発が起きている.これは主に,UGC(User Generated Contents) が容易に生成可能となったことに起因する.一般に UGC の情報は質の点で玉石混淆であるが,書籍のように十分推敲された情報と比較すると質が相対的に低下している点が問題である.本研究課題では,Web上で公開されている情報の外部要因,内部要因を用いることによって,爆発的に増大し続けているWeb上のデータから質の高い情報を抽出するための基盤技術として,外部要因,内部要因の分析,体系化技術,統合利活用技術について実用的な時間で計算可能であるアルゴリズムの開発を行った.
|