Volta (mikroarkitektur) - Volta (microarchitecture)
Utgivningsdatum | 7 december 2017 |
---|---|
Kodnamn | Volta |
Tillverkningsprocess | TSMC 12 nm ( FinFET ) |
Kort | |
Entusiast | |
Historia | |
Företrädare | Pascal |
Efterträdare |
Turing (konsument) Ampere (konsument, professionell) |
Volta är kodnamnet för en GPU -mikroarkitektur utvecklad av Nvidia , efterträdande av Pascal . Det tillkännagavs först på en färdplan i mars 2013, även om den första produkten inte tillkännagavs förrän i maj 2017. Arkitekturen är uppkallad efter den italienska kemisten och fysikern Alessandro Volta från 1700–1900 -talet . Det var NVIDIA: s första chip med Tensor Cores , specialdesignade kärnor som har överlägsen djupinlärningsprestanda jämfört med vanliga CUDA -kärnor. Arkitekturen produceras med TSMC : s 12 nm FinFET -process. Den Ampere mikroarkitektur är efterföljaren till Volta.
Det första grafikkortet som använde det var datacenteret Tesla V100, t.ex. som en del av Nvidia DGX-1- systemet. Det har också använts i Quadro GV100 och Titan V. Det fanns inga vanliga GeForce -grafikkort baserade på Volta.
Detaljer
Arkitektoniska förbättringar av Volta -arkitekturen inkluderar följande:
-
CUDA -beräkningskapacitet 7.0
- samtidig körning av heltal och flytande punktoperationer
- TSMC : s 12 nm FinFET -process, som tillåter 21,1 miljarder transistorer .
- Minne med hög bandbredd 2 (HBM2),
- NVLink 2.0 : en buss med hög bandbredd mellan CPU och GPU och mellan flera GPU: er. Tillåter mycket högre överföringshastigheter än de som kan uppnås med PCI Express ; beräknas ge 25 Gbit/s per körfält. (Inaktiverad för Titan V)
- Tensorkärnor: En tensorkärna är en enhet som multiplicerar två 4 × 4 FP16 -matriser och sedan lägger till en tredje FP16- eller FP32 -matris till resultatet genom att använda smält multiply -add -operationer och får ett FP32 -resultat som valfritt kan degraderas till en FP16 resultat. Tensorkärnor är avsedda att påskynda utbildningen av neurala nätverk. Voltas Tensor -kärnor är första generationen medan Ampere har tredje generationens Tensor -kärnor.
- PureVideo Feature Set I hårdvaruvideoavkodning
Produkter
Volta har tillkännagivits som GPU-mikroarkitekturen inom Xavier- generationen av Tegra SoC med fokus på självkörande bilar .
Vid Nvidias årliga keynote för GPU Technology Conference den 10 maj 2017 tillkännagav Nvidia officiellt Volta -mikroarkitekturen tillsammans med Tesla V100. Volta GV100 GPU är byggd på en 12 nm processstorlek med HBM2 -minne med 900 GB/s bandbredd.
Nvidia tillkännagav officiellt NVIDIA TITAN V den 7 december 2017.
Nvidia tillkännagav officiellt Quadro GV100 den 27 mars 2018.
Modell | Lansera | Kodnamn (s) | Fab ( nm ) |
Transistorer (miljarder) |
Formstorlek (mm 2 ) |
Bus Interface | Kärnkonfiguration | SM- räkning |
Grafik Processing Kluster |
L2 Cache- storlek ( MiB ) |
Klockhastigheter | Fyllnadsgrad | Minne | Processorkraft ( GFLOPS ) |
TDP (watt) |
NVLink Support | Lanseringspris ( USD ) |
|||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CUDA -kärna |
tensor kärna |
Grundkärna ( MHz ) |
Öka klockan ( MHz ) |
Minne ( MT/s ) |
Pixel ( GP /s) |
Struktur ( GT / s) |
Storlek ( GiB ) |
Bandbredd ( GB /s) |
buss Typ |
Bussbredd ( bit ) |
Enkel precision (boost) |
Dubbel precision (boost) |
Halv precision (boost) |
|||||||||||||
MSRP | ||||||||||||||||||||||||||
Nvidia Titan V | 7 december 2017 | GV100-400-A1 | TSMC 12 nm | 21.1 | 815 | PCIe 3.0 × 16 | 5120: 320: 96 | 640 | 80 | 6 | 4.5 | 1200 | 1455 | 1700 | 139,7 | 465,6 | 12 | 652,8 | HBM2 | 3072 | 12288 (14899) | 6144 (7450) | 24576 (29798) | 250 | Nej | 2999 dollar |
Nvidia Quadro GV100 | 27 mars 2018 | GV100 | 5120: 320: 128 | 6 | 1132 | 1628 | 1696 | 208.4 | 521 | 32 | 868,4 | 4096 | 11592 (16671) | 5796 (8335) | 23183 (33341) | Ja | 8 999 dollar | |||||||||
Nvidia Titan V CEO Edition | 21 juni 2018 | 1200 | 1455 | 1700 | 186.2 | 465,6 | 870,4 | 12288 (14899) | 6144 (7450) | 24576 (29798) | Ej tillämpligt |
Ansökan
Volta rapporteras också ingå i Summit och Sierra superdatorer, som används för GPGPU -beräkning. Volta -GPU: er kommer att ansluta till POWER9 -processorerna via NVLink 2.0 , vilket förväntas stödja cachekoherens och därför förbättra GPGPU -prestanda.