# Graph500数据集
# 简介
随着计算机水平的进步,之前的业内的各种数据标准已经无法用于测试以图计算为分析工作核心的数据密集型的应用。
为解决这一问题,来自学术界与工业界的50位高能计算专家联合建立了Graph500测试标准,它是一套用来测试高性能集群的图计算性能的标准,可以根据用户的需求生成任意量级的数据用以测试产品的图计算能力。
# 数据指标
Graph500数据集是一个无属性有向图,图上有一种类型的点与一种类型的边,边没有唯一索引,部分点与点之间存在多条边,存在自环边。
具体数据指标如下:
指标项 | 数量 | 描述 |
---|---|---|
点数 | 2,396,019 | |
边数 | 67,108,864 | |
源数据大小 | 1.04G | 源数据为csv文件 |
点类型数 | 1 | |
边类型数 | 1 | |
点边比 | 0.35 | 常用于评估图密度 |
超级点数量 | 255 | 以出度大于20000为标准 |
最大出度 | 163500 | 点id: 2982970 |
最大入度 | 67227 | 点id: 1442203 |