記憶容量が乏しい組み込み計算環境上でのXML検索処理手法の研究

Research Project

Project/Area Number	15700089
Research Category	Grant-in-Aid for Young Scientists (B)
Allocation Type	Single-year Grants
Research Field	Media informatics/Database
Research Institution	Kyoto University (2005) Japan Advanced Institute of Science and Technology (2003-2004)
Principal Investigator	田島敬史京都大学, 情報学研究科, 助教授 (60283876)
Project Period (FY)	2003 – 2005
Project Status	Completed (Fiscal Year 2005)
Budget Amount *help	¥2,900,000 (Direct Cost: ¥2,900,000) Fiscal Year 2005: ¥800,000 (Direct Cost: ¥800,000) Fiscal Year 2004: ¥800,000 (Direct Cost: ¥800,000) Fiscal Year 2003: ¥1,300,000 (Direct Cost: ¥1,300,000)
Keywords	XML / データ圧縮 / 検索 / 問合せ / 組み込み環境 / クラスタリング / XPath / 問合わせ処理 / 領域計算量 / CD-ROM / DVD-ROM / 問い合わせ / 文法圧縮
Research Abstract	今年度は、これまでに研究を行ってきた、記憶容量の乏しい環境のもとで大規模XMLデータを扱うための圧縮ツールについてさらに研究を行った。われわれがこれまでに開発した圧縮ツールでは、大規模XMLデータを圧縮して保存し、その一部のみを検索によって抜き出して使用したい場合には、データ全体をいったん解凍してから検索をするのではなく、圧縮した状態のまま検索を行い、必要な部分のみを解凍することができる。これは、データを複数のコンテナと呼ばれる単位に分割して、コンテナ毎に圧縮することで実現される。このコンテナ分割を行う際、同時に抜き出して使用されることが多いデータはできるだけ同じコンテナに入れられるようにコンテナへの分割を行えば、検索時に解凍する必要があるコンテナの個数が減り、さらに効率が改善できる。このような、データの検索時に同時にアクセスされる可能性が高いデータ同士を一箇所に集めて保存する考え方は、従来のデータベース技術におけるディスク上へのデータの配置に関して、これまでに研究されており、データのクラスタリングと呼ばれる。そこで、今年度は、われわれは、このクラスタリングの手法をわれわれの圧縮ツールにも応用し、より効率のよい圧縮ツールを開発した。この手法では、データの圧縮時に、どのような検索がどの程度の頻度で行われるかの情報を与えると、この情報に基づいて、検索時に解凍される必要のあるコンテナ数の期待値が最小になるような、データのコンテナへの分割を行う。これにより、圧縮率は平均するとわずかに悪化するものの、検索時の効率が大きく向上した。

Report

(3 results)

Research Products
(4 results)

All 2005 2004

All Journal Article (4 results)

[Journal Article] ROM上のXMLデータに対するメモリ使用量の少ない検索処理2005
- Author(s)
  西川英毅, 田島敬史
- Journal Title
  
  電子情報通信学会第16回データ工学ワークショップ予稿集
- Related Report
  2004 Annual Research Report
[Journal Article] 非XMLデータに対するXPath検索のためのラッパーのインターフェイスの設計2005
- Author(s)
  渡谷賢治, 田島敬史
- Journal Title
  
  電子情報通信学会第16回データ工学ワークショップ予稿集
- Related Report
  2004 Annual Research Report
[Journal Article] Answering XPath queries over networks by sending minimal views2004
- Author(s)
  Keishi Tajima, Yoshiki Fukui
- Journal Title
  
  Proceedings of the 30^<th> International Conference on Very Large Data Bases
  
  Pages: 48-59
- Related Report
  2004 Annual Research Report
[Journal Article] Cache Design for Transcoding Proxy Caching2004
- Author(s)
  Keqiu Li, Hong Shen, Keishi Tajima
- Journal Title
  
  Network and Parallel Computing : IFIP International Conference, Lecture Notes in Computer Science 3222
  
  Pages: 187-194
- Related Report
  2004 Annual Research Report

記憶容量が乏しい組み込み計算環境上でのXML検索処理手法の研究

Principal Investigator

田島 敬史 京都大学, 情報学研究科, 助教授 (60283876)

¥2,900,000 (Direct Cost: ¥2,900,000)

Report

Research Products

[Journal Article] ROM上のXMLデータに対するメモリ使用量の少ない検索処理2005

Author(s)

Journal Title

Related Report

[Journal Article] 非XMLデータに対するXPath検索のためのラッパーのインターフェイスの設計2005

Author(s)

Journal Title

Related Report

[Journal Article] Answering XPath queries over networks by sending minimal views2004

Author(s)

Journal Title

Related Report

[Journal Article] Cache Design for Transcoding Proxy Caching2004

Author(s)

Journal Title

Related Report

田島敬史京都大学, 情報学研究科, 助教授 (60283876)