Skip to content

2022 01 10

GNN Sampling

Quiver

  • 图采样是一个latency critical problem,高性能的采样核心在于通过大量并行掩盖访问延迟。
  • 特征提取是一个bandwidth critical problem,高性能的特征提取在于优化聚合带宽。

Quiver中向用户提供UVA-Based(Unified Virtual Addressing Based)图采样算子,支持用户在图拓扑数据较大时选择将图存储在CPU内存中的同时使用GPU进行采样。这样我们不仅获得了远高于CPU采样的性能收益,同时能够处理的图的大小从GPU显存大小限制扩展到了CPU内存大小(一般远远大于GPU显存)。我们在ogbn-productsreddit上的两个数据集上进行采样性能测试显示,UVA-Based的采样性能远远高于CPU采样性能(CPU采样使用Pyg的采样实现为基线),我们衡量采样性能的指标为单位时间内的采样边数(Sampled Edges Per Second, SEPS)。我们可以看到在同样不需要存储图在GPU显存中的情况下,Quiver的采样在真实数据集上提供大约20倍的性能加速