研究実績の概要 |
本研究では、Web検索におけるランキングで用いられるWebページの重要度尺度の改良を目的としている。既存の手法は現時点でのWebグラフを解析するものがほとんどであるが、本研究では過去のWebグラフの履歴も用いてその時系列を解析することにより、既存の手法では獲得できない新たな知識を獲得する手法の構築を目指している。この目的を達成するため、26,27年度は、25年度に構築した時系列データのWebクローラにより実データの蓄積を行うとともに、そのデータの解析を行った。時系列リンク解析を行うためには、それぞれのWebページが時間の経過とともにどのように入リンク数・出リンク数を変化させたかを知る必要がある。27年度は新たにそのための機構を構築し、ページの蓄積を実施した。 また、Webの重要度尺度についての検討も26年度より継続して行った。リンク解析についてはこれまでにもさまざまな手法が提案されているが、それらは主として現時点でのWebグラフのみを解析の対象としている。本研究ではこれまで、過去のWeb グラフの履歴を用いて、各Webページの入リンク数等の増減の経緯に基づく新たな重要度尺度を定義するべく検討を続けている。これまでの検討により、時系列リンク解析において重要な要素としては入リンク数の増減と重要度のスコアの増減だけでなく、その継続性、特に加速度的な増減が一定期間に渡ってみられるかどうかに意味があることが明らかになっている。一度にスコアを上げるページよりは、少しずつ長期間にスコアを上げ、かつ、その上げ幅が加速度的に増加するページの方が、その後のスコアが安定的である可能性が高い。26年度はこの知見に基づきモデル化や定式化に取り組み、実験により一定の効果を確認したところであるが、27年度には引き続き一層の検討により手法の改良を行なっている。なお、この点については今後の研究プロジェクトにおいて更なる検討を加える予定である。
|