Pokud jde o GPU, Nvidia je přední odborník. Společnost Nvidia podniká od roku 1993 a vyrábí širokou škálu profesionálních a spotřebitelských GPU nejvyšší kvality. Za úspěchem jejich produktu stojí vážená architektura jejich procesorů, zejména jejich primární linie, GeForce. GPU Nvidia překročily herní prostor a rozšířily svoji přítomnost v oblasti hlubokého učení, AI (Artificial Intelligence) a zrychlené analýzy. Nvidia pronikla na trh datových center před deseti lety, počínaje čipy Fermi. Byly provedeny následné iterace a společnost neustále uvolňovala GPU, které naplňují nenasytnou poptávku po vyšší rychlosti zpracování v datových centrech. Grafické procesory Nvidia se v průběhu let vyvíjely a návrhy architektury podporují především vývoj.
Architektura Nvidia Ampere
Konkurence mezi výrobci GPU je vážně těsná, ale Nvidia nedrží nic zpět, aby se dostala na první místo. Nvidia ve skutečnosti v uplynulém desetiletí ovládla trh s umělou inteligencí. V roce 2020 přinesly zprávy o prvním 7nm (8nm pro spotřební díly) GPU společnosti Nvidia s 54 miliardami tranzistorů komprimovaných v tak malé matrici docela rozruch. S kódovým označením Ampér po francouzském matematikovi André-Marie Ampèrovi, Architektura procesoru Nvidia podporuje masivní vylepšení oproti předchůdcům Turing a Volta a slibuje více funkcí, vyšší účinnost a vyšší výkon při nižších úrovních výkonu. Ampere stojí za druhou generací grafických procesorů RTX řady Nvidia, řadou RTX 30, a říká se, že je dvakrát rychlejší než jejich protějšky řady RTX 20. Architektura Ampere je také silou GPU datového centra Nvidia A100.
Amperovy specifikace
Ampere je první GPU Nvidia 7nm / 8nm, druhá generace sledování spotřebitelských paprsků, a má třetí generaci tenzorových jader. Ampere je základní architekturou GPU GA100, GA102 a GA104, které jsou zabudovány do GeForce RTX 3090, RTX 3080, RTX 3070 a nejnověji do RTX 3060. Nvidia také plánuje vydat RTX 3050 v následujících měsících. Podnikový GPU GA100 mezitím poskytuje 20krát větší výpočetní výkon než předchozí generace GPU datových center. Zde je přehled profesionálních a spotřebitelských GPU Nvidia založených na ampérech [1]:
GPU | GA100 | GA102 | GA102 | GA104 |
---|---|---|---|---|
Grafická karta | Nvidia A100 | GeForce RTX 3090 | GeForce RTX 3080 | GeForce RTX 3070 |
Proces (nm) | TSMC N7 | Samsung 8N | Samsung 8N | Samsung 8N |
Tranzistory (miliardy) | 54 | 28.3 | 28.3 | 17.4 |
Velikost zápustky (mm ^ 2) | 826 | 628.4 | 628.4 | 392.5 |
Konfigurace GPC | 8 × 16 | 7 × 12 | 6 × 12 | 6 × 8 |
SM | 108 | 82 | 68 | 46 |
CUDA jádra | 6912 | 10496 | 8704 | 5888 |
RT jádra | Žádný | 82 | 68 | 46 |
Tenzorová jádra | 432 | 328 | 272 | 184 |
Zvýšit takt (MHz) | 1410 | 1700 | 1710 | 1730 |
Rychlost VRAM (Gb / s) | 2.43 | 19.5 (GDDR6X) | 19 (GDDR6X) | 14 (GDDR6) |
VRAM (GB) | 40 (max 48) | 24 | 10 | 8 |
Šířka sběrnice | 5120 (max. 6144) | 384 | 320 | 256 |
ROP | 128 | 112 | 96 | 96 |
TMU | 864 | 656 | 544 | 368 |
GFLOPS FP32 | 19492 | 35686 | 29768 | 20372 |
RT TFLOPS | N / A | 69 | 58 | 40 |
Tenzor TFLOPS FP16 (sparsity) | 312 (628) | 143 (285) | 119 (238) | 81 (163) |
Šířka pásma (GB / s) | 1555 | 936 | 760 | 448 |
TBP (watty) | 400 (250 PCIe) | 350 | 320 | 220 |
Nvidia A100
Nvidia A100 je první GPU, který používal architekturu Ampere. Podnikový čip je zaměřen na datová centra a je navržen pro úkoly náročné na GPU, jako je hluboké učení a AI. Je postaven pomocí 7nm procesu TSMC a obsahuje obrovské množství 54 miliard tranzistorů. Překonal předchozí generace podnikových GPU s 20násobným zvýšením výkonu s 6 912 jádry CUDA, 432 jednotkami mapování textur, 160 ROP, jádry Tensor třetí generace a 40 GB VRAM s šířkou pásma paměti, která končí na 1.6 TB / s. DGX A100 je první systém AI na světě s klastrem osmi A100 a vysokou cenou 199 000 $.
Řada GeForce RTX 30
Kromě dominance na podnikovém trhu má Nvidia vždy na mysli spotřebitele, zejména hráče a tvůrce. Architektura Ampere je také přijata v spotřebitelských grafických kartách Nvidia. Druhá generace GeForce RTX nese GPU založené na amperech a zvyšuje výkon na dvojnásobek oproti předchozí generaci.
Ve většině aspektů má Ampere více než dvojnásobnou výkonnost než Turing. Zdvojnásobil výkon shaderu Turinga s dvojnásobným počtem jader FP32 CUDA. Konkrétně má 30 Shader-TFLOPS, 2.7x více než Turing, což je pouze 11 Shader-TFLOPS. Stejně tak Turingovo jádro Tensor měří na 89 Tensor-TFLOPS, ale Ampere tuto míru více než zdvojnásobil se svými 238 Tensor-TFLOPS. Nezapomínejme na jeho Ray Tracing Core sazby, což je 58 RT-TFLOPS, 1.Čip Ampere je 7x rychlejší než Turing's 34 RT-TFLOPS a pro ještě rychlejší běh GPU se připojuje k nejrychlejší paměti Micron G6X.
Řada RTX 30 je vyrobena pomocí Samsung 8N Nvidia Custom Process s 28 miliardami tranzistorů pro GA102 a 17 miliardami tranzistorů pro GA104. RTX 3090 třídy Titan je poháněn GPU GA102 a poskytuje extrémně vysoký výkon spotřebitelských karet. Na rozdíl od předchozích generací je RTX 3090 otevřený třetím stranám pro vlastní design.
RTX 3080 také používá GPU GA102, což přináší dvojnásobný výkon oproti RTX 2080 a působivou herní schopnost 4K. RTX 3070, poháněný GPU GA104, je na stejné úrovni jako RTX 2080 Ti za poloviční cenu. Nedávno vydaná RTX 3060 také nikdy nezapomene svým ohromujícím výkonem poháněným vylepšenými jádry Ray Tracing Cores, Tensor Cores, novými streamovacími multiprocesory a vysokorychlostní pamětí G6.
Navzdory masivnímu zvýšení výkonu nové GPU RTX nezůstanou v kapse. Mnohem rychlejší grafické karty jsou snadno dostupné, pokud jde o ceny. Vlajková loď Nvidia GeForce, RTX 3080, začíná na 699 $, RTX 3070 se prodává za 499 $ a RTX 3060 má cenovku 329 $. Vyšší RTX 3090 stojí 1 499 $; stále značně levné vzhledem k výkonu na úrovni Titanu.
Jen několik měsíců po vydání údajně došlo k nedostatku grafických karet založených na Ampere a není překvapením, že Ampere je ohromující výkon za rozumnou cenu. Pro ty, kteří uvažují o upgradu GPU, je nyní nejlepší čas dostat se k GPU založeným na Ampere od Nvidia.
Zdroje
[1] Walton, Jarred. "Nvidia RTX 30-Series Ampere Architecture Deep Dive: Vše, co víme". https: // www.tomshardware.com / features / nvidia-ampere-architecture-deep-dive. 13. října 2020.