NVIDIA A100 PCIe vs NVIDIA GeForce3 Ti500
グラフィックスプロセッサ
| GPU名 | GA100 | NV20 |
|---|---|---|
| 建築 | Ampere | Kelvin |
| メーカー | TSMC | TSMC |
| プロセスサイズ | 7 nm | 150 nm |
| トランジスタ | 54,200 million | 57 million |
| ダイサイズ | 826 mm² | 128 mm² |
| GPUバリアント | — | NV20 Ti500 |
グラフィックカード
| リリース日 | Jun 22nd, 2020 | Oct 1st, 2001 |
|---|---|---|
| 世代 | Tesla | GeForce 3 |
| 生産 | Active | End-of-life |
| バスインターフェース | PCIe 4.0 x16 | AGP 4x |
| 立ち上げ価格 | — | 349 USD |
| 前任者 | — | GeForce 2 |
| 後継 | — | GeForce 4 MX |
クロック速度
| GPUクロック | 1410 MHz | 240 MHz |
|---|---|---|
| メモリクロック | 1215 MHz 2.4 Gbps effective | 250 MHz 500 Mbps effective |
| ベースクロック | 765 MHz | — |
| ブーストクロック | 1410 MHz | — |
メモリ
| メモリサイズ | 40 GB | 64 MB |
|---|---|---|
| メモリタイプ | HBM2E | DDR |
| メモリバス | 5120 bit | 128 bit |
| 帯域幅 | 1,555 GB/s | 8.000 GB/s |
レンダーコンフィグ
| シェーディングユニット | 6912 | — |
|---|---|---|
| TMUs | 432 | 8 |
| ROPs | 160 | 4 |
| SM カウント | 108 | — |
| テンソルコア | 432 | — |
| キャッシュ L1 | 192 KB (per SM) | — |
| キャッシュ L2 | 40 MB | — |
| ピクセル シェーダ | — | 4 |
| 頂点シェーダ | — | 1 |
理論性能
| ピクセルレート | 225.6 GPixel/s | 960.0 MPixel/s |
|---|---|---|
| テクスチャ レート | 609.1 GTexel/s | 1.920 GTexel/s |
| FP16(ハーフ)の性能 | 77.97 TFLOPS (4:1) | — |
| FP32(フロート)性能 | 19.49 TFLOPS | — |
| FP64(ダブル)性能 | 9.746 TFLOPS (1:2) | — |
| 頂点レート | — | 60.00 MVertices/s |
ボードデザイン
| スロット幅 | Dual-slot | Single-slot |
|---|---|---|
| 長さ | 267 mm 10.5 inches | 183 mm 7.2 inches |
| TDP | 250 W | unknown |
| 推奨される PSU | 600 W | 200 W |
| 出力 | No outputs | 1x DVI1x VGA1x S-Video |
| 電源コネクタ | 8-pin EPS | None |
| ボード番号 | P1001 SKU 200 | — |
グラフィックス機能
| DirectX | — | 8.1 |
|---|---|---|
| OpenGL | — | 1.5 |
| OpenCL | 3.0 | — |
| Vulkan | — | — |
| CUDA | 8.0 | — |
| シェーダーモデル | — | — |
| ピクセル シェーダ | — | 1.1 |
| 頂点シェーダ | — | 1.1 |