2011 Fiscal Year Research-status Report
オンライン分析によるXMLストリームからの知識発見
Project/Area Number |
23700102
|
Research Institution | University of Tsukuba |
Principal Investigator |
天笠 俊之 筑波大学, システム情報系, 准教授 (70314531)
|
Project Period (FY) |
2011-04-28 – 2013-03-31
|
Keywords | XML / XMLストリーム / 分析処理 |
Research Abstract |
XML (Extensible Markup Language) は,誕生から10年を迎え,データフォーマットのデファクトスタンダード(事実上の標準)として広く利用されている.このため膨大なXMLデータからの情報抽出と知識発見は,情報資源の有効利用の観点から極めて重要である.XMLデータから所望の情報を抽出するには,基本的にはXQueryやXPathといった問合せ言語を用いるのが標準的な方法である.しかし,XMLデータの容量が膨大であったり,高頻度かつ連続的にXMLデータが到着するような環境においては,従来型のアプローチでは不十分である.前者の問題に対しては,この数年,(非XML)データベースを対象にした分析手法であるオンライン分析処理(OLAP)をXMLに適用する研究行われている.一方,後者の問題に対しては,ストリームXMLに対する問合せ手法がよく研究されている.しかしながら,ストリームXMLを対象にしたオンライン分析処理はこれまでほとんど研究されていない.この問題に対し,本研究ではオンライン分析によるXMLストリームからの知識発見に関する研究開発を行うことを目的とする.今年度は特に次の項目について研究を行った.1) 大規模XMLストリーム処理の高性能化:大規模なXMLストリームを処理するためには,処理基盤の高性能化が必要である.特に,XML処理においてXMLデータの構文解析が処理のボトルネックになることに着目し,不要な構文解析処理を省略し,処理系全体の性能を向上させることに成功した.さらに提案手法が処理系の消費電力削減の効果があることも確認した.2) XMLデータの対話的分析手法の開発:大規模データに対する対話的処理を可能にするファセット検索に着目し,それをXMLデータに適用するためのフレームワークを提案するとともに,その有効性を実験により示した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度は,XMLストリームからの知識発見を目的とした基礎技術の開発を主な目的とした.初年度の成果として,大規模XMLストリーム処理の高性能化とXMLデータからの対話的分析手法の開発を行った.前者については,国内学会で発表を行い,その成果が認められ,DEIM2012学生奨励賞を受賞した.後者については,国際会議(WISE2011, iiWAS2011)において発表を行った.このように,それぞれの要素技術について成果発表を行うことができたため,研究はおおむね順調に進展していると考えられる.
|
Strategy for Future Research Activity |
当初の研究計画通り,要素技術の開発を進める.具体的には,XMLストリーム処理の高性能化と対話的分析手法について,改善を進める.また,XML-OLAPをベースとした分析処理手法についても検討を行う.また,成果の取りまとめに向けて,プロトタイプシステムの開発を行う予定である.
|
Expenditure Plans for the Next FY Research Funding |
プロトタイプシステムの開発と評価実験のために,開発環境および実験環境を整備する.得られた成果を国内外の研究集会で発表するための旅費を申請する.さらに,国際会議,国際ジャーナルに論文を投稿するため,英語論文の校閲を行うための予算を申請する.
|
Research Products
(3 results)