2003 Fiscal Year Annual Research Report
ウェブおよびユビキタス知識ネットワーク上の情報の再構成による知識創成技術の開発
Project/Area Number |
03J50021
|
Research Institution | Hokkaido University |
Principal Investigator |
杉渕 剛史 北海道大学, 大学院・工学研究科, 特別研究員(DC2)
|
Keywords | 可視化技術 / 情報統合 / ウェブ情報抽出 |
Research Abstract |
1 ウェブ文書からの情報抽出技術の研究 ウェブ文書から構造化された形式の情報を抽出するラッパ技術、特にユーザによって例示された文書中の抽出対象の集合からラッパ定義を自動生成する技術を研究した。本研究ではラッパ定義作業が試行錯誤の繰り返しである点に着目し、これを改善するdynamic previewインターフェイス技術を開発した。これはユーザによる抽出例の例示操作に対して100ms以下という短い応答時間でラッパ定義を自動生成しその動作を例示することで、様々な抽出例の組み合わせによるラッパ導出を素早く試行することを実現する。本研究では短い応答時間を実現するために動的プログラミングによる簡便なラッパ導出アルゴリズムを開発し、これを利用してdynamic previewingインターフェイスを実装し優位性を確認した。 2 ウェブ上の情報の再構成モデルに関する研究 ウェブ上の情報やアプリケーションの再構成に関して、関係データベース(RDB)モデルに基づいてモデル化を行う手法について研究した。本手法においてウェブ上の文書や検索サービス等の各種アプリケーションは関係データベースにおけるビュー表としてモデル化される。これにより複数のウェブ文書上の情報を集約し検索サービスを用いて関連情報を取得する等と言ったウェブ上の情報やサービスを組み合わせた利用操作が一群のビュー表に対する関係演算として表現可能となった。本手法においてウェブ文書およびウェブアプリケーションとビュー表の関連づけはラッパを用いて行われる。 3 データベース可視化フレームワークの導入と拡張 前述1項および2項に関してこれまで研究を行ってきた関係データベースモデルに基づくデータベース可視化フレムワークへの導入を行い、ウェブ情報の可視化、データベース中の情報との結合やウェブアプリケーションの機能連係が実現されることを確認した。
|
Research Products
(1 results)