研究概要 |
近年の急速なネットワーク速度とメモリやディスクの記憶容量の増大により, 膨大な量のデータから必要な情報を効率良く短時間で抽出する仕組みは, 情報科学的な研究基盤のみならず, 情報社会における社会基盤としてなくてはならないものとなってきている. こうした膨大な量のデータを如何に有効に活用できるかは, 今後の我が国の科学技術研究ポテンシャルにとって大きな重要性を持っている. 本研究がターゲットとする検索問題は情報抽出のための基礎技術であり, 内外で精力的に研究が行われてきており, メモリアクセスにかかる時間を一定と仮定するモデルの元では理論的にほぼ下限値であるアルゴリズムが開発されている. しかしインターネット上のWebデータや有機化合物反応データベースといった超大規模データからの任意のオブジェクトの高速検索はいまだ困難であり, さらなる性能向上が望まれている.大規模検索システムの本質的な難しさは, 記憶装置の階層構造の取り扱いにあると言っても過言ではない. メモリと二次記憶のアクセス速度を区別する計算モデルでのアルゴリズムは従来から存在するが, 現在のシステムにはオンチップキャッシュ・キャッシュ・メモリ・キャッシュディスク・ハードディスク・ネットワークデータといった, それぞれレイテンシーが一桁違うメモリ階層が存在し, これらを考慮した高速化が必要となってきている. こうした現状を踏まえ, 本研究では記憶装置の階層構造を考慮しながら大容量ストレージやネットワーク上に蓄積された膨大なデータを活用するための礎となる実用的高速検索システムを構築することを目標としている.
|