2014 Fiscal Year Research-status Report
Project/Area Number |
24500105
|
Research Institution | University of Tsukuba |
Principal Investigator |
古瀬 一隆 筑波大学, システム情報系, 講師 (10291288)
|
Co-Investigator(Kenkyū-buntansha) |
陳 漢雄 筑波大学, システム情報系, 講師 (60251047)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | リンク解析 |
Outline of Annual Research Achievements |
本研究では、Web検索におけるランキングで用いられるWebページの重要度尺度の改良を目的としている。既存の手法は現時点でのWebグラフを解析するものがほとんどであるが、本研究では過去のWebグラフの履歴も用いてその時系列を解析することにより、既存の手法では獲得できない新たな知識を獲得する手法の構築を目指している。この目的を達成するため、26年度は、25年度に構築した時系列データのWebクローラにより実データの蓄積を行うとともに、そのデータの解析を行った。時系列リンク解析を行うためには、それぞれのWebページが時間の経過とともにどのように入リンク数・出リンク数を変化させたかを知る必要がある。そのための機構を構築し、ページの蓄積を実施した。この作業は27年度も継続する予定である。 また、Webの重要度尺度についての検討も25年度より継続して行った。リンク解析についてはこれまでにもさまざまな手法が提案されているが、それらは主として現時点でのWebグラフのみを解析の対象としている。本研究では過去のWeb グラフの履歴を用いて、各Webページの入リンク数等の増減の経緯に基づく新たな重要度尺度を定義するべく検討を続けている。これまでの検討により、時系列リンク解析において重要な要素としては入リンク数の増減と重要度のスコアの増減だけでなく、その継続性、特に加速度的な増減が一定期間に渡ってみられるかどうかに意味があることが明らかになっている。一度にスコアを上げるページよりは、少しずつ長期間にスコアを上げ、かつ、その上げ幅が加速度的に増加するページの方が、その後のスコアが安定的である可能性が高い。26年度はこの知見に基づきモデル化や定式化に取り組み、実験により一定の効果を確認したが、より一層の検討が必要であるため、27年度に引き続き改良を目指すこととしている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
これまでのところ、当初計画通りにデータ蓄積やモデル化や定式化を行ない、また、26年度にはクローラを改良して新たなデータの蓄積の実施とモデルの再検討を行ったところであるが、実用上十分な精度を得るには一層の改良が必要である。その理由の一つには、改良型時系列クローラによりより蓄積可能となった多様なWebページを解析したところ、これまでに検討してきたモデル化や定式化ではすべてのWebページの指標の動きを十分に捉えることができず、その結果として期待していたほどには精度が向上しないという新たな問題が明らかになったことにある。 また、26年度には25年度から引き続き、時系列リンク解析に基づく重要度尺度の問い合わせ依存型ランキング手法への応用に取り組んだ。この応用において実用上の課題となる問い合わせが与えられてから結果を得るまでの処理の高速化について、ランキングに必要となる処理のうち、問い合わせが与えられる前に計算が可能となる部分を事前に前処理として解析することで、精度を落とさずに高速化する手法の改良を検討した。この改良手法については、高速化を犠牲にせずに精度をある程度向上させることができた。しかし、この精度についてはより一層の改良の余地があるので、27年度も引き続き検討を行う予定である。
|
Strategy for Future Research Activity |
27年度は、前年度から継続して実施している改良型時系列Webクローラを用いたデータの蓄積と解析を継続するとともに、これまでに構築したモデル化や定式化に一層の改良を加えることで、精度の向上を目指す。具体的には、さまざまな実データを対象に実験を行うことによって精度や計算時間などの特性について、本研究の手法と既存の重要度尺度を詳細に比較・調査し、それに基づく評価を行う。 また、時系列リンク解析に基づく重要度尺度の問い合わせ依存型ランキング手法の高速化については、26年度に構築した手法において高速化を維持しつつ精度を上げる手法を構築したが、この改良にも取り組む。 以上のような取り組みの後、国際会議等での成果発表を予定している。
|
Causes of Carryover |
本研究課題は予定通り取り組みを続けていたところであるが、本年度に入って追加の実験が必要となり、そのためのシステム開発等に予想以上の時間を要することとなった。また、現在、この実験結果を元に国際学会等での成果発表の準備を進めているところであるが、発表が次年度になるため、未使用額が生じることとなった。
|
Expenditure Plan for Carryover Budget |
未使用額は、現在準備を進めている国際学会等における成果発表に関する費用に充てる予定である。
|
-
[Presentation] Efficient Reverse Far Neighbors Search2014
Author(s)
Atsuhiro Ishikawa, Hanxiong Chen, and Kazutaka Furuse.
Organizer
Proceedings of the 9th International Conference on Digital Information Management, pp. 214--219
Place of Presentation
Bangkok, Thailand
Year and Date
2014-09-29 – 2014-10-01