NVIDIA V100 Tensor Core GPU 是深度学习、机器学习、高性能计算 (HPC) 和图形计算的强力加速器。V100 Tensor Core GPU 采用 NVIDIA Volta™ 架构,可在单个 GPU 中提供近 32 个 CPU 的性能,助力研究人员攻克以前无法应对的挑战。
V100 是 NVIDIA 数据中心平台在深度学习、HPC 和图形领域的强大产品。该平台可为 600 余款 HPC 应用和各大深度学习框架提供加速。此平台适用于桌面、服务器以及云服务,不仅能显著提升性能,还能节省成本。
V100 PCle | V100 SXM2 | V100S PCle | |
GPU 架构 | NVIDIA Volta | ||
NVIDIA Tensor核心数量 | 640 | ||
NVIDIA CUDA®核心数量 | 5120 | ||
双精度浮点运算性能 | 7 TFLOPS | 7.8 TFLOPS | 8.2 TFLOPS |
单精度浮点运算性能 | 14 TFLOPS | 15.7 TFLOPS | 16.4 TFLOPS |
Tensor 性能 | 112 TFLOPS | 125 TFLOPS | 130 TFLOPS |
GPU 显存 | 32 GB 或 16 GB HBM2 | 32 GB HBM2 | |
显存带宽 | 900 GB/s | 1134 GB/s | |
纠错码 | 支持 | ||
互联带宽 | 32 GB/s | 300 GB/s | 32 GB/s |
系统接口 | PCIe 3.0 | NVIDIA NVLink™ | PCIe 3.0 |
外形尺寸 | PCIe 全高/ 全长 | SXM2 | PCIe 全高/ 全长 |
最大功耗 | 250 瓦 | 300 瓦 | 250 瓦 |
散热解决方案 | 被动式 | ||
计算 API | CUDA、DirectCompute、OpenCL™、OpenACC® |