2008 Fiscal Year Annual Research Report
自動的部分情報抽出方式に基づく知識Webアプリケーションの連携・統合法の研究
Project/Area Number |
20500026
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
徳田 雄洋 Tokyo Institute of Technology, 大学院・情報理工学(系)研究科, 教授 (30111644)
|
Co-Investigator(Kenkyū-buntansha) |
野呂 智哉 東京工業大学, 大学院・情報理工学研究科, 助教 (80401553)
|
Keywords | Webアプリケーション / Webサービス関数 / 総合・連携 / 部分情報抽出 |
Research Abstract |
Webサービス関数を提供していないWebアプリケーションの情報を利用した統合を可能にするため,部分情報抽出技術を利用してWebサービス関数を作成する手法を開発した.ユーザは少量のページに対して抽出した情報の部分をGUIで指定するだけで,それ以外の類似ページからも同じ情報を自動的に抽出することができ,プログラミングやHTMLの知識を持たない人でもWebサービス関数を作成可能となった.また, Webアプリケーション統合のためのJavaクラスパッケージを開発し,統合の際のプログラミングの労力を軽減することが可能となった. ニュースサイトから収集した記事を利用してWebアプリケーション統合を行うため,我々は,ニュース検索エンジンを利用して本文抽出する手法を開発した.ニュースサイトが提供する検索機能を利用することにより,毎日の定期的なクローリングや収集したページのニュース記事ページか否かの判定の必要がなくなる.また,特定のページ構造に特化しない記事本文抽出手法により,異なるニュースサイトに対しても,突然のページ構造の変更に対しても,引き続き同じ手法を適用可能であるという特徴も持つ. さらに,携帯端末のためのWebサービス統合のためのツールの開発も行った.携帯端末は機種によって使用可能な機能が異なるが,ユーザの端末が持つ機能をチェックし,統合を行うためのツールを開発することにより,機能の限られた端末でもWebサービスの統合が可能となった.
|
Research Products
(5 results)