研究概要 |
本研究の目的は,Webに代表される分散型ハイパーメディアの検索性能の一層の向上を図るための検索方式と,より効果的な情報発信を行うための動的アクセス管理方式を開発することである.具体的には,次の3項目に焦点を絞って,アルゴリズム開発と試作システム開発を通じた有効性検証を行った:(1)部分グラフを情報単位とするWeb検索と自動分類,(2)検索と再構造化にもとづく同期化コンテンツの自動生成,(3)閲覧履歴に基づくWebの動的アクセス管理.平成12年度は,(1)については,Web文書を単なるキーワード一致に基づく検索を行うのではなく,Web文書からの話題構造の抽出を行い,話題の内容や詳細度に基づく検索が行えるようなアルゴリズムおよび試作システム開発を行った.具体的には,単語の出現密度分布情報から話題の主題語となる単語を抽出し,さらに,その主題語を説明している内容語を単語の共起度および出現密度分布情報から抽出する方式を考案した.さらに,主題語群と内容語群からなる2組グラフ群によりWeb文書の話題構造を表現し,これに基づいて,Web文書を,話題の詳細さや簡潔さなどに基づいて検索の絞込みが行える機能を実現した.(2)については,Web文書に含まれる画像とその画像の説明にあたる部分を自動抽出し,これを,画像を呈示しながら該当説明文を同時に呈示するためのアルゴリズムを考案した.(3)については,Web文書の各閲覧者の閲覧履歴や閲覧状況に応じて動的にその内容を変更・自動生成する方式を開発した.この方式は,Web文書の著者が各閲覧者に対してどのようにその文書を提示したいのかを,アクティブルールという形式を用いて容易に表現でき,このルールをWeb文書と一体化して用意することで,容易に各閲覧者に対するWeb文書の個別化(パーソナライゼーション)が可能となる.
|