Research Abstract |
本年度は,主に以下の内容について研究を行った. 1.移動オブジェクトの移動状況を集約する移動ヒストグラムの構築管理手法:GPSを搭載した自動車や携帯端未を保持して移動する歩行者などを移動オブジェクトと呼ぶ.本年度は,多数の移動オブジェクトの移動状況をリアルタイムに集約して,移動パターンをコンパクトに集約するための移動ヒストグラムの手法の開発と評価を行った.移動ヒストグラムにはコンパクトさが求められるため,精度をできるだけ高く保持しつつコンパクトなヒストグラムを構築するための手法を工夫した.また,移動軌跡データはリアルタイムに多数の移動オブジェクトから送信されるため,時々刻々と訪れる移動情報をストリーム的に処理する工夫も行った. 2.新規性に基づく文書クラスタリング手法,および,それに基づくユーザインタフェースシステムの開発:インターネット上では,ニュース記事などの配信が日々大規模なスケールで行われている.そのような文書の特徴は,それが入手された新規な時点では価値が高く,時間がたつにつれその価値が減っていくということである.本研究で提案した文書クラスタリング手法は,類似しだ文書をクラスタにグルーブ化するという通常のグラスタリングの機能だけではなく,新規性の高い文書をより重視したクラスタリングを行い,古い文書を積極的に忘却していくという特徴を有する.これにより,クラスタリングの度に,最新の情報を中心にクラスタリングして提示することを可能とする.また,本年度はこの文書クラスタリングシステムを活用して,その上位にユーザインタフエースのシステムT-Scrollの開発を行った.T-Scrollでは,各時点で構築されたクラスタ集合を可視化して表示し,隣接した時点のクラスタ間に,関連度を考慮してリンクを生成する.これにより,T-Scrollのユーザはトピックの大まかな流れを容易に把握することが可能となる. 3.データベースと連携した大規模文書リポジトリからのレコード抽出手法:ウェブなどの大規模な文書情報源から,有用な情報を抽出する情報抽出の研究が盛んとなっている.本研究では,特に,データベース中に存在するデータを有効に活用するレコード抽出のアプローチを提案した.ユーザがデータベースから問合せにより選択したレコード集合をユーザの興味あるデータと捉え,トピックが関連するレコードを選択的に抽出する.これにより,ユーザの要求に合うだけでなく,無駄なレコード抽出を抑えることによる効率化を図った. これらの研究について,今年度は論文による発表だけでなく,ソフトウェアの構築・デモ発表等も行った.
|