2015 Fiscal Year Research-status Report
大規模動的木構造グラフの新しい実装方式とそのXMLデータベースへの応用
Project/Area Number |
26330132
|
Research Institution | University of Fukui |
Principal Investigator |
都司 達夫 福井大学, 工学(系)研究科(研究院), シニアフェロー (80115302)
|
Co-Investigator(Kenkyū-buntansha) |
樋口 健 福井大学, 工学(系)研究科(研究院), 准教授 (50293410)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 動的木グラフ / 大規模グラフ / 木グラフエンコード / グラフ分割 / 動的再構成 |
Outline of Annual Research Achievements |
前年度において,本研究課題を遂行するために必要となる大規模多次元データセットのエンコード方式を実装した基盤システムを構築した.また,このシステム上で,大規模木グラフを実現し,検索するプロトタイプシステムを当初の予定どおり設計・構築した。しかし,木グラフ分割は静的分割にとどまっており,記憶負荷の動的変動に対する対策は今年度の課題としていた.この課題に対して,次の前提条件で取り組み,以下の(i)(ii)の成果を得た. (前提条件)対象とする木グラフTの辺にはラベルが付され,同じ親ノードから出る子ノードへの辺のラベルは重複していてもよい.Tは次の2つの木グラフに分離される:(a)Tから辺のラベルを捨象した構造木T1, (b) 辺のラベルの連接である経路式の一意性を保証した経路木T2.また,使用環境(例えば,物理スレッドの最大数)に見合う分割数kをあらかじめ設定し,構造木T1をk個の部分木とS1,S2,...,Skとこれら以外で構成されるT1のルートを含む部分木S0のk+1個の部分木に分割する.S0は部分木S1,S2,...,Skへの索引として機能する. (i)S1,S2,...,Skの各部分木のルートノードのTにおける高さレベルを可変とした場合,各部分木の任意のノードについて,そのTにおける位置を指定する経歴パターンをT1部分と当該部分木部分の2つに記憶コストと検索コストのオーバヘッドを抑制して分割する方式を提案して,実装した. (ii) (i)の方式により記憶コストのバランスを考慮して初期分割した部分木群をシステムの運用につれて発生する記憶量負荷のアンバランスを検知して部分木群を動的に再構成するアルゴリズムを考案した. 以上のシステムに関する研究発表を本年3月に開催された情報処理学会第120回「情報基礎とアクセス技術研究会」において発表した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は研究計画の2年目であり,”大規模動的木グラフの動的分割と再構成アルゴリズムの考案”について,取り組んだ,得られた成果の達成度について述べる. (1)記憶コストと検索コストのオーバヘッドを抑制して動的木グラフを分割する方式の提案と実装 申請時の計画をおおむね達成している.特に木グラフの動的分割を考慮した,各ノードの経路分割に対応する経歴・パターンエンコードの方式ほぼ,満足できる.静的分割に比べて,不可避のオーバヘッドがあるものの,今後,データ構造の工夫で改良したい. (2)システム運用時の各部分木の記憶量負荷のアンバランスを検知して部分木群を動的に再構成するアルゴリズムの考案 作業記憶量が少ないボトムアップのアルゴリズムを考案して実装した点ではおおむね順調と言える.しかし,静的分割にくらべて,初期分割の時間的コストが高くなっており,再構成のコストも含めて,改良を図りたい.
|
Strategy for Future Research Activity |
昨年度までのシステムでは分割木を同一マシンに格納して,それをマルチスレッドにより検索することを目的していたが,次年度は,ネットワーク上のマシンサイトに大規模木を分散格納し,並列検索するシステムを構築する.分散格納された各部分木を論理的に単一の木グラフTに統合する.このとき各部分木グラフをTにマウントする操作が必要となるが Tおよびマウントする部分木グラフの内部表現を一切変更しないことを基本方針とする. 続いて,このシステムの応用として,特にXML文書の「名前空間」を実現する.経路式に基づくXMLの検索言語である”XPath”を検索モデルとして,名前空間を指定した検索を可能とする.名前空間とマウント情報の効率よい管理方式を考案する必要がある.XPathの経路指定において,ホスト木グラフとホスト木グラフにマウントされるゲスト木グラフ(部分木グラフ)の間で何度も検索経路が切り替わる場合の効率的な検索処理が問題となり得るので考慮する必要がある.
|
Causes of Carryover |
(1) 支出を予定していた学会論文誌の掲載費について,28年4月に出版されることとなったため,次年度に繰り越した. (2)データ整理および分析用の高性能ノートパソコンの入手可能時期が28年4月以降となったため次年度に繰り越した.
|
Expenditure Plan for Carryover Budget |
上記(理由)において示した2つの費目を次年度早々に執行し,残高は次年度研究費の一部として使用する.
|
Research Products
(7 results)