Research Abstract |
今年度は主に以下の項目について研究を行った. 1.ウェブからの地域情報の収集のためのウェブマイニング手法に関する研究:ある地域にとって有用な情報を有しているウェブページのことを空間情報ハブと呼ぶ.地域内の情報に対するリンク集や地域情報をコンテンツとして有するページのことを指す.このようなページをウェブから探索するための探索手法,およびページのランク付け手法を開発した.また,地域情報に関する既存のデータベースをもとに,ウェブから関連情報を探索するための能動的クローリング手法についても開発を行った.これらについては国際会議等において発表を行った. 2.ネットワーク上の文書データのための新規性に基づくインクリメンタルなクラスタリング手法の開発:ウェブ上には,ニュース記事など,時々刻々と配信される多数の文書情報が存在する.この研究では,これらの文書データの新規性に着目した.文書クラスタリングは類似した文書をグループ化し,情報を要約する手法として知られているが,本研究ではここに時間情報として新規性の概念を取り込んだ.新規性が高い文書ほど重要と考えることで,新規性の高い文書をより反映した形でのクラスタリングを実現する.また,本手法においてはインクリメンタルな処理に特に焦点を当てており,新たな文書の到着の際に,効率よくクラスタリング構造を更新することも可能としている. 3.移動オブジェクトデータベースのためのヒストグラム構築に関する研究:時空間情報の一つとして,現在移動オブジェクト(自動車や携帯機器を有する利用者など)が着目されている.本研究では,移動オブジェクトの大量の移動履歴をリアルタイムに集積し,本研究ではデータウェアハウスでしばしば用いられるデータキューブの形を有する移動ヒストグラムに加工することで,さまざまな対話的な分析へと利用可能とすることを目指している.データキューブの形式をそのまま実装すると,移動ヒストグラムの構築時間や格納サイズが非常に大きくなってしまうという欠点がある.そのため,本研究では,データキューブ形式の移動ヒストグラム論理表現に対する,木構造の物理表現を提案し,その評価を行った.提案した木構造はデータキューブに含まれるデータを近似的に表現するものであるが,ストリーム的に配信される移動軌跡データをリアルタイムに集積可能であるという利点を有している. 以上の結果は,昨年度の成果をさらに発展したものである.次年度はこれらの統合等を進めていく.
|