2013 Fiscal Year Annual Research Report
グラフ構造のリサンプリングを行うブートストラップ法
Project/Area Number |
13J01933
|
Research Institution | Osaka University |
Principal Investigator |
永田 晴久 大阪大学, 基礎工学研究科, 特別研究員(DC1)
|
Keywords | ブートストラップ法 / ネットワーク解析 / クラスタリング / GPGPU |
Research Abstract |
ブートストラップ法は, 与えられたデータを確率的な操作で複製する方法であり, 単一のデータからは求められない統計量について, バラつきの推定や信頼区間の構成などに利用される. ネットワークデータなどのグラフ構造に対してブートストラップ法を適用する場合, 複製の方法は自明ではなかったため, 本研究でほこれまでにエッジ集合を標本と見なしてリサンプリングを行う方法を提案し, Wikipediaのデータのクラスタリング問題に対して適用して効果を示していた. 今年度の成果として, グラフ構造に対してブートストラップ法を適用する数理的な正当性を示した. 具体的には, グラフ構造の種頬のひとつであるランダムグラフに対して, ブートストラップ法によって求められた統計量と真の統計量の理論誤差を求め, ノード数が大きいほど誤差が小さくなることを示した. これらの成果を踏まえ, データの複製方法としてエッジリサンプリングとノードペアリサンプリングの2つの方法を提案した. また, ブートストラップ法と階層型クラスタリングの計算を高速化するために, 近年ハイパフォーマンスコンピューティングの分野で注目を集めているGPGPUを用いたプログラムの実装を行った. 実装に当たっては, 計算機の性能を最大限に利用するために, SIMD最適化, CPU/GPUハイブリッド演算などの技法を用いた. その結果, 従来の方法に対して最大で29倍の計算速度向上を達成した. これによって, 従来では難しかった大規模なデータへの分析が容易になるといえる.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度の研究計画のうち数理的側面については, 特殊な場合においてではあるが正当性の証明ができ, 新しい手法も提案することができた, また, 大規模並列計算機上での実装については, 実験結果においての成果が明確に示されただけでなく, プログラミングの経験やノウハウの蓄積という点でも進歩があった.
|
Strategy for Future Research Activity |
今後の研究については, 当初の計画通りブートストラップ法の数理的解析を継続する. 本年度の研究において, ある特殊な条件の下でブートストラップ法の正当性を示すことができたが, より一般的な場合については証明が非常に難しいこともわかった. したがって, 正当性を壊さない範囲での条件の拡張のほか, グラフ構造に確率モデルを導入して解析を行うことを検討している. 並列計算機上でのプログラムの実装に関しては, 計算速度の向上については成果が得られたので, 今後は実データに対して適用した際の効果や問題点を探っていきたい.
|
Research Products
(5 results)