昨年度は、私は過去のWebページに対するインタラクション手法を提案ずることに取り組みました(HT 2009)。この研究において、私は、任意のWebページの一連の過去のバージョンをウェブアーカイブから抽出した上で、その内容の変遷を視覚化するためのアプリケーションを構築しました(WWW2009)。このアプリケーションはページの内容の変化と時間からなる2次元のグラフの中にページの過去のバージョンを配置します。同時に、過去のWebページにある原文の内容から、その時点において顕著なキーワードを抽出します。具体的には、過去のページの中に現れる頻度と掲載時間の長さを考慮することによって、そのようなキーワードを引き出します。もう一つの研究において、私はGoogle News Archiveのようなオンラインニュースアーカイブから、そしてウェブ検索エンジンから、ユーザーが検索語について将来に関連する情報を得る手法を提案しました(JCDL2009)。この手法はユーザーの検索語に関連した将来に関する情報を集めた上で不要な情報を除去することにより、将来イベントの要約を示すことができます。この手法がユーザーが検索語に関連した重要な将来イベントを理解することを助けた結果、ユーザーは得た知識を利用して自分のとるべき行動を決めることができます。なお、このアプローチの一部は、検索語に関する過去の新聞記事掲載数のピークの周期パターンを見つけ出すことを基にしています。 さらに、私はWikipediaの記事から専門用語を見つけ出すことで、専門領域ごとの知識を抽出する研究に取り組みました(DASFAA2009)。Wikipediaの記事はあらゆる事象に関する詳細な情報を含んでいて、知識を得るために利用できます。この研究では、Wikipediaの知識を、ウェブページの品質を推定するために、また、専門性と読みやすさのレベルを評価するために利用しました。
|