大規模複雑グラフ上の発火グループ情報活用のための高速高精度アルゴリズムの開発
Project/Area Number |
15H06828
|
Research Category |
Grant-in-Aid for Research Activity Start-up
|
Allocation Type | Single-year Grants |
Research Field |
Web informatics, Service informatics
|
Research Institution | National Institute of Informatics |
Principal Investigator |
秋葉 拓哉 国立情報学研究所, 情報学プリンシプル研究系, 特任助教 (90756967)
|
Project Period (FY) |
2015-08-28 – 2017-03-31
|
Project Status |
Granted (Fiscal Year 2016)
|
Budget Amount *help |
¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Fiscal Year 2016: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2015: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
|
Keywords | アルゴリズム / ネットワーク / ソーシャルグラフ / ウェブグラフ / ウェブマイニング / データマイニング |
Outline of Annual Research Achievements |
【コンパクトでスケーラブルな全距離近傍関数スケッチ(KDD'16採択)】グラフに対するスケッチデータ構造として, All-Distances Sketches (ADS) は,様々な指標の推定を,理論的保証付きで可能にするため,注目されている.特に,本研究課題としては,ADS は group closeness centrality の推定も行うことができる点が重要である.理論的には非常に優れた性質を持っているため,実用化が強く期待される技術だが,実用的には,定数項の影響でデータ構造のサイズが非常に大きくなってしまい,大規模なグラフで使うことができないことが分かってきた.そこで,本研究では,ADS に潜む冗長性に注目し,冗長性を取り除いたスケッチデータ構造である Sketch Retrieval Shortcuts (SRS) を提案する.SRS は ADS から 10 倍以上サイズが小さいが,SRS を計算しておけば,瞬時に ADS と全く同じ精度での任意の推定を行うことができる.また,group closeness centrality 推定のために必要な combined ADS も,SRS より高速に復元できる.
【Temporal Network におけるシュタイナー木の高速計算アルゴリズム(NDA'16採択)】辺に出現・消滅の時刻がついたネットワークを Temporal Network と呼ぶ.Temporal Network 上の全域木問題の拡張として,発火頂点集合の関係を時系列を考慮し表現するための定式化としてのシュタイナー木問題を定義し,それに対する高速かつ厳密なアルゴリズムを与えた.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
本課題で研究を行う指標の最有力候補の1つであった Group closeness centrality について,All-Distances Sketches (ADS) により高速に計算できることがわかった.そして,ADS の実用的な問題点であるメモリ使用量について,その課題を解決するデータ構造である SRS を提案できた.SRS は億スケールのグラフを処理可能な,実用的な性能を持っており,Group closeness centrality の推定は一気に大規模グラフへの適用可能な状況へと持っていくことができた.これは当初の計画以上の進展である.
|
Strategy for Future Research Activity |
【グループの関連性・類似性やその他の特徴量】中心性・重要性と同様に,グループ間の関連性や類似性の指標の設計に取り組む.グラフにおけるグループ間の関連性・類似性の指標は現在存在していない.グループの関連性や類似性を推定できるようになることで,例えば,ウェブページの関連性を,言及しているユーザ集合の関連性により,より正確に推定することができるようになると考えられる. ここでも頂点対に対する指標の拡張を検討する.小中規模の実データを用いた予備実験や,高速高精度アルゴリズム設計についても,中心性・重要性指標の場合と同様に取り組む.
【大規模の実データでの実応用を通じた検証実験】 大規模の実データを用いる実際の応用に開発した指標やアルゴリズムを組み込み,グラフのデータを活用した提案アプローチがグループとその発火条件について有用な情報をもたらすことを検証する.既存の応用の精度の向上や,新たな応用の実現に取り組む.この検証実験では,大規模実データの収集やデータマイニングを専門とする研究協力者と共同で取り組むことを考えている.
|
Report
(1 results)
Research Products
(10 results)