Nazwa GPU | GA106 | TU117 |
---|---|---|
Wariant GPU | GA106-150-A1 | — |
Architektura | Ampere | Turing |
Producent | Samsung | TSMC |
Rozmiar procesu | 8 nm | 12 nm |
Tranzystory | 13,250 million | 4,700 million |
Rozmiar matrycy | 276 mm² | 200 mm² |
Data wydania | 2022 | Apr 12th, 2021 |
---|---|---|
gpu.details.availability | 2022 | — |
Generacja | GeForce 30 | Quadro |
Poprzednik | GeForce 20 | — |
Produkcja | Unreleased | Active |
Interfejs magistrali | PCIe 4.0 x16 | PCIe 3.0 x16 |
Zegar bazowy | 1552 MHz | 735 MHz |
---|---|---|
Ulepsz zegar | 1777 MHz | 1335 MHz |
Zegar pamięci | 1750 MHz 14 Gbps effective | 1250 MHz 10 Gbps effective |
Rozmiar pamięci | 8 GB | 4 GB |
---|---|---|
Typ pamięci | GDDR6 | GDDR6 |
Magistrala pamięci | 128 bit | 128 bit |
Przepustowość | 224.0 GB/s | 160.0 GB/s |
Jednostki cieniujące | 2560 | 640 |
---|---|---|
TMUs | 80 | 40 |
RPOs | 48 | 32 |
Liczba SM | 20 | 10 |
Rdzenie tensorowe | 80 | — |
Rdzenie RT | 20 | — |
Cache L1 | 128 KB (per SM) | 64 KB (per SM) |
Cache L2 | 2 MB | 1024 KB |
Częstotliwość pikseli | 85.30 GPixel/s | 42.72 GPixel/s |
---|---|---|
Stopień teksturowania | 142.2 GTexel/s | 53.40 GTexel/s |
Wydajność FP16 (połowa) | 9.098 TFLOPS (1:1) | 3.418 TFLOPS (2:1) |
Wydajność FP32 (płynna) | 9.098 TFLOPS | 1.709 TFLOPS |
Wydajność FP64 (podwójna) | 142.2 GFLOPS (1:64) | 53.40 GFLOPS (1:32) |
Szerokość slotu | Dual-slot | Single-slot |
---|---|---|
Długość | 242 mm 9.5 inches | — |
Szerokość | 112 mm 4.4 inches | — |
TDP | 90 W | 40 W |
Sugerowany PSU | 250 W | 200 W |
Wyjścia | 1x HDMI3x DisplayPort | 4x mini-DisplayPort |
Złącza zasilania | 1x 6-pin | None |
DirectX | 12 Ultimate (12_2) | 12 (12_1) |
---|---|---|
OpenGL | 4.6 | 4.6 |
OpenCL | 3.0 | 3.0 |
Vulkan | 1.2 | 1.2 |
CUDA | 8.6 | 7.5 |
Model shadera | 6.6 | 6.6 |