Nome GPU | GF100 | GP100 |
---|---|---|
Variante GPU | GF100-850-A3 | GP100-893-A1 |
Architettura | Fermi | Pascal |
Fonderia | TSMC | TSMC |
Dimensione del processo | 40 nm | 16 nm |
Transistor | 3,100 million | 15,300 million |
Dimensione stampo | 529 mm² | 610 mm² |
Data di rilascio | Jul 25th, 2011 | Jun 20th, 2016 |
---|---|---|
Generazione | Tesla | Tesla |
Produzione | End-of-life | End-of-life |
Interfaccia bus | PCIe 2.0 x16 | PCIe 3.0 x16 |
Prezzo di lancio | — | 5,699 USD |
Clock GPU | 574 MHz | — |
---|---|---|
Shader clock | 1147 MHz | — |
Clock memoria | 750 MHz 3 Gbps effective | 715 MHz 1430 Mbps effective |
Clock di base | — | 1190 MHz |
Incremento clock | — | 1329 MHz |
Dimensione memoria | 3 GB | 16 GB |
---|---|---|
Tipo memoria | GDDR5 | HBM2 |
Bus di memoria | 384 bit | 4096 bit |
Larghezza di banda | 144.0 GB/s | 732.2 GB/s |
Unità di ombreggiamento | 448 | 3584 |
---|---|---|
TMUs | 56 | 224 |
ROPs | 48 | 96 |
Conteggio SM | 14 | 56 |
Cache L1 | 64 KB (per SM) | 24 KB (per SM) |
Cache L2 | 768 KB | 4 MB |
Tasso di pixel | 16.07 GPixel/s | 127.6 GPixel/s |
---|---|---|
Tasso di tessitura | 32.14 GTexel/s | 297.7 GTexel/s |
Prestazioni FP32 (piatte) | 1,028 GFLOPS | 9.526 TFLOPS |
Prestazioni FP64 (doppie) | 513.9 GFLOPS (1:2) | 4.763 TFLOPS (1:2) |
Prestazioni FP16 (metà) | — | 19.05 TFLOPS (2:1) |
Larghezza dello slot | Dual-slot | Dual-slot |
---|---|---|
Lunghezza | 248 mm 9.8 inches | 267 mm 10.5 inches |
TDP | 238 W | 250 W |
PSU suggerito | 550 W | 600 W |
Uscite | 1x DVI | No outputs |
Connettori di alimentazione | 1x 6-pin + 1x 8-pin | 1x 8-pin |
DirectX | 12 (11_0) | 12 (12_1) |
---|---|---|
OpenGL | 4.6 | 4.6 |
OpenCL | 1.1 | 3.0 |
Vulkan | — | 1.2 |
CUDA | 2.0 | 6.0 |
Modello shader | 5.1 | 6.4 |