研究概要 |
本年度は下記の研究を行った。 (1)リンク及びページ種類の類型化 リンクの類型化は、(a)計量書誌学における引用タイプ、(b)ハイパーテキストのリンク種類と評価研究、(c)Web文書におけるリンク種別調査、(d)ディスコース言語学における修辞構造理論、(e)文章論における文の連鎖と文章構造の側面から検討した。ページの類型は、(a)コーパス言語学におけるレジスタ研究、(b)情報学におけるメディア研究、分類研究、Web文書タイプやWeb利用行動調査の側面から検討した。新たな類型を許す柔軟な構造としてグランデットセオリーとファセット分類に基づく表現形式を検討した。 (2)特定分野ページの収集とリンク分析 既存の引用索引の収録範囲と主要な研究発表メディアとのずれが大きいため、従来、引用分析の適用には問題があるといわれていた情報検索分野を例としてとりあげ、既存メディア、Web上の学術論文、その他の情報源について比較し、手法の適用可能性と問題点を検討した。 (3)情報検索・活用支援システムへの応用 CCC(Content, Context, Collaboration)モデルに基づき、引用とリンクを、従来の内容型(content-based)の情報検索やクラスタリングを補うコンテキストと利用者や作成者のcollaborationとしてのリコメンデーションと捉え、情報検索とクラスタリング・要約等の情報活用支援技術の高度化への応用を検討した。 (4)Webコミュニティの構造分析 Webページのハイパーリンクによって構成されるグラフ構造に基づいて、興味を共有するWebページ集合であるWebコミュニティを発見するシステムを既に構築しており、そのシステムをさらに発展させて当該トピックにおける中心的なページ集合を見出すような洗練手法を考案した。
|