研究概要 |
今年度は主にWebモーフィングに関する研究を行なった.Webモーフィングとは,2つのWebページのページレイアウトや見栄え,機能を混合して新しいページを作成することを意味する.準備研究で作成したプロトタイプは同一のCMSによって作成された二つのWebページを混合することができるが,本研究ではこの制限を緩和することを目指している.今年度に研究を行った,複数のWebサイトの構造を分析し,多くのサイトに共通して含まれる典型的構造を抽出する手法の流れを以下に示す. (1)Webサイトからの構造抽出:Webサイトのトップページからハイパーリンクを辿ることによりページ間のリンク構造をグラフ構造として抽出する. (2)複数Webサイト間に存在する類似内容ページの対応付け:簡易な形態素解析をタイトル文字列に行うことによって類似内容を持つページを対応付ける. (3)典型的構造の抽出:対応付けられたページを基にして,複数のサイトに共通するページ群とそのページに伴うリンクを典型的構造として抽出する. 本研究で述べる典型的構造はk個のWebサイトに対し,共通度に応じて1次から(k-1)次の次数を持つ.複数のWebサイトの中で,より共通して含まれている構造ほど次数は大きくなる.作成したプロトタイプシステムを用いて東海地区の4つの大学を対象に比較実験を行ったところ,1次と2次の典型的構造の出現率がそれぞれ平均して約56%と約83%であることを確認した. また,Webサイトの構造をモデル検査を用いて検証する手法に関する基礎的な研究を行った.
|