Project/Area Number |
16092222
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Review Section |
Science and Engineering
|
Research Institution | Kyushu University |
Principal Investigator |
定兼 邦彦 Kyushu University, 大学院・システム情報科学研究院, 准教授 (20323090)
|
Co-Investigator(Kenkyū-buntansha) |
山下 雅史 九州大学, 大学院・システム情報科学研究院, 教授 (00135419)
小野 廣隆 九州大学, 大学院・システム情報科学研究院, 助教 (00346826)
|
Project Period (FY) |
2004 – 2007
|
Project Status |
Completed (Fiscal Year 2007)
|
Budget Amount *help |
¥13,000,000 (Direct Cost: ¥13,000,000)
Fiscal Year 2007: ¥3,200,000 (Direct Cost: ¥3,200,000)
Fiscal Year 2006: ¥3,400,000 (Direct Cost: ¥3,400,000)
Fiscal Year 2005: ¥3,500,000 (Direct Cost: ¥3,500,000)
Fiscal Year 2004: ¥2,900,000 (Direct Cost: ¥2,900,000)
|
Keywords | 領域計算量 / グラフ探索 / 簡潔データ構造 / データ圧縮 / エントロピー / スケールフリーグラフ / 逆探索 / 情報検索 / データ構造 / 接尾辞配列 / 圧縮接尾辞配列 / 文字列検索 / 文字列圧縮 / 省スペース / オンラインアルゴリズム / Web検索 / 並列化 |
Research Abstract |
本研究では大量データ処理のための領域効率の良いアルゴリズムの開発を行った.大量データ処理を行う際の問題点としては,処理時間だけではなく,データの格納やアルゴリズムの動作に必要な記憶領域の大きさがある.よって本研究では領域効率の良いアルゴリズムの開発に重点を置き,以下のアブローチを行った.(1)データを圧縮する:データ自身やデータ構造を圧縮して保存する簡潔データ構造を開発し,少ないメモリで大量のデータを扱えるようにした.(2)データの一部分のみをメモリに格納するアルゴリズム:全体のデータ量は多いが,同時にはその限られた部分のデータのみを使用するようなアルゴリズムならば限られたメモリでも動作する.本研究では特に,グラフの探索を行う省スペースアルゴリズムを開発した.その結果,大量データ処理のための基礎となるアルゴリズムとデータ構造を開発できた. 全てのデータは文字列とみなす事ができる.その文字列の長さをn,文字のアルファベットサイズをσとすると,データの圧縮前のサイズはnlog_2 σビットとなる.通常のデータ圧縮法ではこの文字列をnH_k+o(n log σ)ビットに圧縮するが,その一部分のみアクセスしたい場合でも圧縮されたデータ全体を復元する必要がある.本研究の圧縮法では,圧縮された文字列の任意の部分を高速に復元できる.具体的には,文字列中の位置が指定されたとき,その位置から始まる部分文字列で長さがlog nビットのものを定数時間で復元することができる.圧縮サイズはnH_k+o(n log σ)ビットであり従来法と漸近的に等しい.
|
Report
(4 results)
Research Products
(23 results)