2002 Fiscal Year Annual Research Report
情報の新規性に基づく時系列文書データからの知識発堀手法に関する研究
Project/Area Number |
14780316
|
Research Institution | University of Tsukuba |
Principal Investigator |
石川 佳治 筑波大学, 電子・情報工学系, 講師 (80263440)
|
Keywords | 時系列文書 / クラスタリング / 新規性 / オンライン文書 / XML / 問合せ処理 / XPath / P2P |
Research Abstract |
本年度の研究実績は以下の3点にまとめることができる. 1.新規性を考慮した文書クラスタリング手法の開発:インターネット上を配信されるニュース記事などでは,文書の新規性が重要なファクターとなる.時々刻々と提供される文書データを要約し,ユーザにおおまかなトレンドの流れを提示するため,本研究では時系列的な文書のクラスタリング手法について研究を行った.忘却ファクターの導入により,古い文書は次第に忘却し新規性の高い文書を重視する仕組みを取り入れ,効率よくクラスタリングを行うという点が特徴となっている. 2.XMLデータベースのための問合せ処理技術の開発:XMLはインターネット時代の情報交換のための標準として着目を浴びているが,大量のXMLデータを効率よく処理する技術に関してはいまだ開発の余地が多い.本研究では,まず,リレーショナルデータベース内に格納されたデータをXMLデータとして提供するXML出版に焦点を当て,与えられたXML問合せに対し求められたXMLデータをリレーショナルデータベース中のデータから効率よく導出する手法を示した.特にユーザ定義の関数が問合せに含まれる場合を検討の対象とし,XPath問合せの処理方式などについても見当した.また,携帯機器におけるXML利用が始まっていることから,携帯機器の制約の中で効率的に実行可能なXML問合せ処理系の開発も行った. 3.P2P環境における情報検索技術の開発:近年,P2P技術が急速に発展しているが,P2P環境における情報検索には未だ課題が多い.本研究では,P2P環境において部分照合検索機能を提供するため,シグネチャファイルのアイデアをP2P環境に導入した索引手法を提案した.スケーラブルな点が特徴である.
|
Research Products
(6 results)
-
[Publications] 石川佳治, 北川博之: "忘却の概念に基づく文書クラスタリング手法の一般化について"電子情報通信学会研究報告. 102巻・64号. 13-18 (2002)
-
[Publications] Y.Ishikawa, T.Nagai, H.Kitagawa: "Transforming XPath Queries for Bottom-Up Query Processing"Proceedings of the IASTED International Conference on Information Systems and Databases (ISDB 2002). 136-141 (2002)
-
[Publications] Y.Ishikawa, J.Kawada, H.Kitagawa: "Processing XML View Queries Including User-defined Foreign Functions on Relational Databases"Proceedings of the 3rd International Conference on Web Information Systems Engineering (WISE 2002). 225-236 (2002)
-
[Publications] 川田純, 石川佳治, 北川博之: "リレーショナルデータベース上のXMLビューに対する外部関数を考慮した問合せ処理"情報処理学会論文誌:データベース. 43巻・SIG12(TOD16)号. 1126-1141 (2002)
-
[Publications] 宮坂集策, 石川佳治, 北川博之, 村山敏清: "携帯機器向けXPath処理系の設計と構築"情報処理学会第65回全国大会講演論文集. (掲載予定). (2003)
-
[Publications] 松下亮, 北川博之, 石川佳治: "P2P環境におけるシグネチャを用いたオブジェクト検索"電子情報通信学会第14回データ工学ワークショップ(DEWS2003). (2003)