2008 Fiscal Year Annual Research Report
Webアーカイブにおけるストリームマイニングに関する研究
Project/Area Number |
19500098
|
Research Institution | Nanzan University |
Principal Investigator |
河野 浩之 Nanzan University, 数理情報学部, 教授 (70224813)
|
Keywords | デジタルアーカイブ / コンテンツ流通 / 評判モデル / Webアーカイブ / Webクローリング |
Research Abstract |
「研究の目的」に述べたように,官民をあげたデジタルコンテンツ保存のための取組みが,世界各国で開始されている.特に,膨大なデジタルコンテンツを,どのような基準で収集し保存するための資源を割り当てるべきかという問題は重要である.そこで,「研究実施計画」において記したように,デジタルアーカイブに関わる研究の構成要素を,アーカイブ対象となるデータの「収集」「蓄積」「検索」に分け,本年もこれら三要素と密接に関わる研究を遂行した. 発表論文は,Webクローリングを必要とする多数のサーバー群において,より意味の有る内容をクローリングする戦略を,ハイパーリンク等によるグラフ構造に基づいて求めることと関係する.これは,P2Pシステム設計における重要な課題である各種リソースを一方的に利用のみを行う「ただ乗り問題」を,我々が提案したP2Pシステムの信頼機構により各種サービスの貢献度に応じた格差サービスを評判モデル(reputation model)として実現するアルゴリズムを拡張したものである. すなわち,アーカイブシステムの収集蓄積対象となるコンテンツを,どのような基準によつて各種資源(ネットワーク帯域,ディスク容量,蓄積時間等)を割り当てれば良いかというクローリング戦略の基本的指針を与えるものとなっている.
|