大容量ネットワークの普及、音楽・映像配信の一般化などにより、膨大な量のメディア情報を取得して保存する時代となっている。それに伴い、所望のメディア情報を高速かつ正確に探し出す技術の開発が各方面で進められており、検索性能は日々進化を遂げている。一方で、それらメディア情報検索技術の性能限界について、現実的な仮定の下で検討されている研究は少ない。本研究は、上記背景を踏まえ、以下の3項目について、理論と実装の両面から詳細に検討を進めることを目的とする。 (1)情報検索を情報源符号化の観点からモデル化・定式化する。 (2)上記モデル・定式化に基づいて情報検索性能の理論的限界を解明する。 (3)上記理論限界に到達する情報検索アルゴリズムを構築する。 平成20年度は、主に実証的解析に必要な理論基盤の整備を中心に下記成果を挙げた。 1.情報検索の理論限界の究明及びその限界に漸近する具体的な符号化方法の提案: メディア情報検索における重要な基本技術であるインデックスを用いた検索(インデックス検索)を情報源符号化の枠組でモデル化し、その部分モデルについて理論限界を完全に解明すると共に、その限界に漸近する具体的な符号化方法を提案した。 2.インデックス検索の理論限界の数値計算法の提案: 成果1などによって導出される理論限界は、少数の特殊なデータ分布を除くと、解析的に導出することは不可能である。本成果では、事後確率の逐次推定で用いられる粒子フィルタの考え方を導入することで、これらの倫理限界を具体的に算出する数値計算法を提案した。
|