Nvidia

Co je Nvidia Ampere?

Co je Nvidia Ampere?

Pokud jde o GPU, Nvidia je přední odborník. Společnost Nvidia podniká od roku 1993 a vyrábí širokou škálu profesionálních a spotřebitelských GPU nejvyšší kvality.  Za úspěchem jejich produktu stojí vážená architektura jejich procesorů, zejména jejich primární linie, GeForce. GPU Nvidia překročily herní prostor a rozšířily svoji přítomnost v oblasti hlubokého učení, AI (Artificial Intelligence) a zrychlené analýzy. Nvidia pronikla na trh datových center před deseti lety, počínaje čipy Fermi. Byly provedeny následné iterace a společnost neustále uvolňovala GPU, které naplňují nenasytnou poptávku po vyšší rychlosti zpracování v datových centrech. Grafické procesory Nvidia se v průběhu let vyvíjely a návrhy architektury podporují především vývoj.  

Architektura Nvidia Ampere

Konkurence mezi výrobci GPU je vážně těsná, ale Nvidia nedrží nic zpět, aby se dostala na první místo. Nvidia ve skutečnosti v uplynulém desetiletí ovládla trh s umělou inteligencí. V roce 2020 přinesly zprávy o prvním 7nm (8nm pro spotřební díly) GPU společnosti Nvidia s 54 miliardami tranzistorů komprimovaných v tak malé matrici docela rozruch. S kódovým označením Ampér po francouzském matematikovi André-Marie Ampèrovi, Architektura procesoru Nvidia podporuje masivní vylepšení oproti předchůdcům Turing a Volta a slibuje více funkcí, vyšší účinnost a vyšší výkon při nižších úrovních výkonu. Ampere stojí za druhou generací grafických procesorů RTX řady Nvidia, řadou RTX 30, a říká se, že je dvakrát rychlejší než jejich protějšky řady RTX 20. Architektura Ampere je také silou GPU datového centra Nvidia A100.

Amperovy specifikace

Ampere je první GPU Nvidia 7nm / 8nm, druhá generace sledování spotřebitelských paprsků, a má třetí generaci tenzorových jader. Ampere je základní architekturou GPU GA100, GA102 a GA104, které jsou zabudovány do GeForce RTX 3090, RTX 3080, RTX 3070 a nejnověji do RTX 3060. Nvidia také plánuje vydat RTX 3050 v následujících měsících. Podnikový GPU GA100 mezitím poskytuje 20krát větší výpočetní výkon než předchozí generace GPU datových center. Zde je přehled profesionálních a spotřebitelských GPU Nvidia založených na ampérech [1]:

GPU GA100 GA102 GA102 GA104
Grafická karta Nvidia A100 GeForce RTX 3090 GeForce RTX 3080 GeForce RTX 3070
Proces (nm) TSMC N7 Samsung 8N Samsung 8N Samsung 8N
Tranzistory (miliardy) 54 28.3 28.3 17.4
Velikost zápustky (mm ^ 2) 826 628.4 628.4 392.5
Konfigurace GPC 8 × 16 7 × 12 6 × 12 6 × 8
SM 108 82 68 46
CUDA jádra 6912 10496 8704 5888
RT jádra Žádný 82 68 46
Tenzorová jádra 432 328 272 184
Zvýšit takt (MHz) 1410 1700 1710 1730
Rychlost VRAM (Gb / s) 2.43 19.5 (GDDR6X) 19 (GDDR6X) 14 (GDDR6)
VRAM (GB) 40 (max 48) 24 10 8
Šířka sběrnice 5120 (max. 6144) 384 320 256
ROP 128 112 96 96
TMU 864 656 544 368
GFLOPS FP32 19492 35686 29768 20372
RT TFLOPS N / A 69 58 40
Tenzor TFLOPS FP16 (sparsity) 312 (628) 143 (285) 119 (238) 81 (163)
Šířka pásma (GB / s) 1555 936 760 448
TBP (watty) 400 (250 PCIe) 350 320 220

Nvidia A100 

Nvidia A100 je první GPU, který používal architekturu Ampere. Podnikový čip je zaměřen na datová centra a je navržen pro úkoly náročné na GPU, jako je hluboké učení a AI. Je postaven pomocí 7nm procesu TSMC a obsahuje obrovské množství 54 miliard tranzistorů. Překonal předchozí generace podnikových GPU s 20násobným zvýšením výkonu s 6 912 jádry CUDA, 432 jednotkami mapování textur, 160 ROP, jádry Tensor třetí generace a 40 GB VRAM s šířkou pásma paměti, která končí na 1.6 TB / s. DGX A100 je první systém AI na světě s klastrem osmi A100 a vysokou cenou 199 000 $.

Řada GeForce RTX 30

Kromě dominance na podnikovém trhu má Nvidia vždy na mysli spotřebitele, zejména hráče a tvůrce. Architektura Ampere je také přijata v spotřebitelských grafických kartách Nvidia. Druhá generace GeForce RTX nese GPU založené na amperech a zvyšuje výkon na dvojnásobek oproti předchozí generaci.

Ve většině aspektů má Ampere více než dvojnásobnou výkonnost než Turing. Zdvojnásobil výkon shaderu Turinga s dvojnásobným počtem jader FP32 CUDA. Konkrétně má 30 Shader-TFLOPS, 2.7x více než Turing, což je pouze 11 Shader-TFLOPS. Stejně tak Turingovo jádro Tensor měří na 89 Tensor-TFLOPS, ale Ampere tuto míru více než zdvojnásobil se svými 238 Tensor-TFLOPS. Nezapomínejme na jeho Ray Tracing Core sazby, což je 58 RT-TFLOPS, 1.Čip Ampere je 7x rychlejší než Turing's 34 RT-TFLOPS a pro ještě rychlejší běh GPU se připojuje k nejrychlejší paměti Micron G6X.

Řada RTX 30 je vyrobena pomocí Samsung 8N Nvidia Custom Process s 28 miliardami tranzistorů pro GA102 a 17 miliardami tranzistorů pro GA104. RTX 3090 třídy Titan je poháněn GPU GA102 a poskytuje extrémně vysoký výkon spotřebitelských karet. Na rozdíl od předchozích generací je RTX 3090 otevřený třetím stranám pro vlastní design.

RTX 3080 také používá GPU GA102, což přináší dvojnásobný výkon oproti RTX 2080 a působivou herní schopnost 4K. RTX 3070, poháněný GPU GA104, je na stejné úrovni jako RTX 2080 Ti za poloviční cenu. Nedávno vydaná RTX 3060 také nikdy nezapomene svým ohromujícím výkonem poháněným vylepšenými jádry Ray Tracing Cores, Tensor Cores, novými streamovacími multiprocesory a vysokorychlostní pamětí G6.

Navzdory masivnímu zvýšení výkonu nové GPU RTX nezůstanou v kapse. Mnohem rychlejší grafické karty jsou snadno dostupné, pokud jde o ceny. Vlajková loď Nvidia GeForce, RTX 3080, začíná na 699 $, RTX 3070 se prodává za 499 $ a RTX 3060 má cenovku 329 $. Vyšší RTX 3090 stojí 1 499 $; stále značně levné vzhledem k výkonu na úrovni Titanu.

Jen několik měsíců po vydání údajně došlo k nedostatku grafických karet založených na Ampere a není překvapením, že Ampere je ohromující výkon za rozumnou cenu. Pro ty, kteří uvažují o upgradu GPU, je nyní nejlepší čas dostat se k GPU založeným na Ampere od Nvidia.

Zdroje

[1] Walton, Jarred. "Nvidia RTX 30-Series Ampere Architecture Deep Dive: Vše, co víme". https: // www.tomshardware.com / features / nvidia-ampere-architecture-deep-dive. 13. října 2020.

Hry Jak zvýšit FPS v Linuxu?
Jak zvýšit FPS v Linuxu?
FPS znamená Snímků za sekundu. Úkolem FPS je měřit snímkovou frekvenci při přehrávání videa nebo herních výkonech. Jednoduše řečeno, počet nepřerušova...
Hry Nejlepší hry Oculus App Lab
Nejlepší hry Oculus App Lab
Pokud jste vlastníkem náhlavní soupravy Oculus, musíte mít informace o bočním nakládání. Sideloading je proces instalace neukládaného obsahu do náhlav...
Hry Top 10 her k hraní na Ubuntu
Top 10 her k hraní na Ubuntu
Platforma Windows byla jednou z dominujících platforem pro hraní her kvůli velkému procentu her, které se dnes vyvíjejí, aby nativně podporovaly Windo...