GeForce 900 -serien - GeForce 900 series

GeForce 900 -serien
GTX 900 -serien logotyp med slogan.pngGTX980tiFE.jpg
Nvidia GeForce GTX 980 Ti Founders Edition
Utgivningsdatum 18 september 2014 ; 6 år sedan ( 18 september 2014 )
Kodnamn GM20x
Arkitektur Maxwell
Modeller GeForce -serien
Transistorer 2.94B (GM206)
Tillverkningsprocess TSMC 28 nm
Kort
Mellanklass
High-end
Entusiast
API -stöd
Direct3D Direct3D 12 ( funktionsnivå 12_1)
OpenCL OpenCL 3.0
OpenGL OpenGL 4.6
Vulkan Vulkan 1.2
SPIR-V
Historia
Företrädare
Efterträdare GeForce 10 -serien

Den GeForce 900-serien är en familj av grafikbearbetningsenheter utvecklade av Nvidia , lyckas de GeForce 700-serien och som tjänar som den avancerade introduktion till Maxwell mikroarkitektur, uppkallad efter James Clerk Maxwell . De produceras med TSMC : s 28 nm -process.

Med Maxwell, efterträdaren till Kepler , förväntade sig Nvidia tre stora resultat: förbättrade grafikfunktioner, förenklad programmering och bättre energieffektivitet jämfört med GeForce 700 -serien och GeForce 600 -serien .

Maxwell tillkännagavs i september 2010, med de första Maxwell-baserade GeForce-konsumentklassprodukterna som släpptes i början av 2014.

Arkitektur

Första generationens Maxwell (GM10x)

Första generationens Maxwell GM107/GM108 släpptes som GeForce GTX 745, GTX 750/750 Ti och GTX 850M/860M (GM107) och GT 830M/840M (GM108). Dessa nya marker ger få ytterligare funktioner som konsumenten vänder sig till. Nvidia fokuserade istället på energieffektivitet. Nvidia ökade mängden L2 -cache från 256 KiB på GK107 till 2 MiB på GM107, vilket minskar den bandbredd som behövs. Följaktligen kapade Nvidia minnesbussen från 192 bitar på GK106 till 128 bitar på GM107, vilket ytterligare sparar ström. Nvidia ändrade också designen för strömmande multiprocessorer från Kepler (SMX) och namngav den SMM. Varp -schemaläggarens struktur ärvs från Kepler, vilket gör att varje schemaläggare kan ge upp till två instruktioner som är oberoende av varandra och är i ordning från samma varp. Layouten för SMM -enheter är uppdelade så att var och en av de fyra varp -schemaläggarna i en SMM styr 1 uppsättning 32 FP32 CUDA -kärnor, 1 uppsättning med 8 last-/lagringsenheter och 1 uppsättning med 8 specialfunktionsenheter. Detta står i kontrast till Kepler, där varje SMX har 4 schemaläggare som schemalägger till en gemensam pool med 6 uppsättningar med 32 FP32 CUDA -kärnor, 2 uppsättningar med 16 last-/lagringsenheter och 2 uppsättningar med 16 specialfunktionsenheter. Dessa enheter är anslutna med en tvärstång som använder ström för att tillåta resurser att delas. Denna tvärstång tas bort i Maxwell. Texturenheter och FP64 CUDA -kärnor delas fortfarande. SMM möjliggör en finare resursfördelning än SMX, vilket sparar energi när arbetsbelastningen inte är optimal för delade resurser. Nvidia hävdar att en 128 CUDA -kärn -SMM har 86% av prestandan för en 192 CUDA -kärn -SMX. Varje grafikprocesskluster, eller GPC, innehåller också upp till 4 SMX -enheter i Kepler och upp till 5 SMM -enheter i första generationens Maxwell.

GM107 stöder CUDA Compute Capability 5.0 jämfört med 3,5 på GK110/GK208 GPU och 3.0 på GK10x GPU. Dynamic Parallelism och HyperQ, två funktioner i GK110/GK208 GPU: er, stöds också över hela Maxwell -produktlinjen.

Maxwell tillhandahåller inbyggda delade minne atomoperationer för 32-bitars heltal och inbyggt delat minne 32-bitars och 64-bitars jämför-och-byt (CAS), som kan användas för att implementera andra atomfunktioner.

Medan man en gång trodde att Maxwell använde rasterisering i omedelbart läge på kakel , korrigerade Nvidia detta vid GDC 2017 och sa att Maxwell istället använder Tile Caching.

NVENC

Maxwell-baserade GPU: er innehåller också NVENC SIP-blocket som introducerades med Kepler. Nvidias videokodare, NVENC, är 1,5 till 2 gånger snabbare än på Kepler-baserade GPU: er, vilket innebär att den kan koda video med 6 till 8 gånger uppspelningshastighet.

PureVideo

Nvidia hävdar också en 8 till 10 gånger prestandahöjning i PureVideo Feature Set E -videoavkodning på grund av videodecoder -cacheminnet i kombination med ökad minneeffektivitet. Men H.265 stöds inte för full hårdvaruavkodning, att förlita sig på en blandning av hårdvara och mjukvara avkodning. Vid avkodning av video används ett nytt lågeffektivt tillstånd "GC5" på Maxwell GPU: er för att spara ström.

Andra generationens Maxwell (GM20x)

Andra generationens Maxwell introducerade flera nya tekniker: dynamisk superupplösning, tredje generationens delta-färgkomprimering, multipixelprogrammeringsprovtagning, Nvidia VXGI (Real-Time-Voxel- Global Illumination ), VR Direct, Multi-Projection Acceleration och Multi-Frame Sampled Anti-Aliasing (MFAA) (dock stöd för Coverage-Sampling Anti-Aliasing (CSAA) togs bort). HDMI 2.0 -stöd har också lagts till.

Andra generationens Maxwell ändrade också förhållandet mellan ROP och minne från 8: 1 till 16: 1. Några av ROP: erna är emellertid i allmänhet lediga i GTX 970 eftersom det inte finns tillräckligt med aktiverade SMM: er för att ge dem arbete och därför minskar dess maximala fyllningshastighet.

Andra generationens Maxwell har också upp till 4 SMM -enheter per GPC, jämfört med 5 SMM -enheter per GPC.

GM204 stöder CUDA Compute Capability 5.2 jämfört med 5.0 på GM107/GM108 GPU, 3.5 på GK110/GK208 GPU och 3.0 på GK10x GPU.

Maxwell andra generationens GM20x -GPU: er har en uppgraderad NVENC som stöder HEVC -kodning och lägger till stöd för H.264 -kodningsupplösningar vid 1440p/60FPS och 4K/60FPS jämfört med NVENC på Maxwell första generationens GM10x -GPU: er som endast stöder H.264 1080p/60FPS -kodning.

Maxwell GM206 GPU stöder fullständig HEVC -hårdvaruavkodning med fast funktion.

Reklam kontrovers

GTX 970 hårdvaruspecifikationer

Problem med GeForce GTX 970 -specifikationerna togs först upp av användarna när de fick reda på att korten, medan de innehöll 4 GB minne, sällan nått minne över 3,5 GB -gränsen. Ytterligare tester och undersökningar ledde så småningom till att Nvidia utfärdade ett uttalande om att kortets ursprungligen tillkännagivna specifikationer hade ändrats utan föregående meddelande innan kortet gjordes kommersiellt tillgängligt och att kortet fick en prestandahit när minnet över 3,5 GB -gränsen togs i bruk.

Kortets back-end-hårdvaruspecifikationer, som ursprungligen tillkännagavs vara identiska med GeForce GTX 980, skilde sig åt i mängden L2-cache (1,75 MB kontra 2 MB i GeForce GTX 980) och antalet ROP (56 mot 64 tum 980). Dessutom avslöjades att kortet var utformat för att komma åt minnet som en 3,5 GB -sektion, plus ett 0,5 GB, en åtkomst till det senare är 7 gånger långsammare än det första. Företaget fortsatte sedan med att lova en specifik förarmodifiering för att lindra prestandaproblemen med de nedskärningar som kortet drabbats av. Men Nvidia klargjorde senare att löftet hade varit en felkommunikation och det skulle inte finnas någon specifik drivrutinsuppdatering för GTX 970. Nvidia hävdade att det skulle hjälpa kunder som ville ha återbetalning att få dem. Den 26 februari 2015 gick Nvidias VD Jen-Hsun Huang på rekord i Nvidias officiella blogg för att be om ursäkt för händelsen. I februari 2015 lämnades en grupptalan som påstod falsk reklam mot Nvidia och Gigabyte Technology i USA: s tingsrätt för norra Kalifornien.

Nvidia avslöjade att den kan inaktivera enskilda enheter, som alla innehåller 256KB L2 -cache och 8 ROP, utan att inaktivera hela minneskontroller. Detta kostar att dela upp minnesbussen i segment med hög hastighet och låg hastighet som inte kan nås samtidigt om inte ett segment läser medan det andra segmentet skriver eftersom L2/ROP -enheten som hanterar båda GDDR5 -kontrollerna delar läs returkanal och skrivdatabussen mellan de två GDDR5 -kontrollerna och sig själv. Detta används i GeForce GTX 970, som därför kan beskrivas som att ha 3,5 GB i sitt höghastighetssegment på en 224-bitars buss och 0,5 GB i ett låghastighetssegment på en 32-bitars buss.

Den 27 juli 2016 gick Nvidia med om en preliminär lösning av USA: s grupptalan och erbjöd återbetalning på $ 30 på köp av GTX 970. Den överenskomna återbetalningen representerar den del av kostnaden för lagring och prestanda som konsumenterna antog att de fick när de köpte kortet.

Async -beräkningsstöd

Medan Maxwell-serien marknadsfördes som helt DirectX 12-kompatibel, avslöjade Oxide Games, utvecklare av Ashes of the Singularity , att Maxwell-baserade kort inte fungerar bra när async-beräkning används.

Det verkar som att även om denna kärnfunktion faktiskt avslöjas av föraren, implementerade Nvidia den delvis genom en förarbaserad mellanlägg , till en hög prestandakostnad. Till skillnad från AMD: s konkurrerande GCN -baserade grafikkort som inkluderar en fullständig implementering av hårdvarubaserad asynkron beräkning, planerade Nvidia att förlita sig på föraren för att implementera en mjukvarukö och en programvarudistributör för att vidarebefordra asynkrona uppgifter till maskinvaruschemaläggarna, som kan distribuera arbetsbelastningen till rätt enheter. Asynkron beräkning på Maxwell kräver därför att både ett spel och GPU -drivrutinen specifikt kodas för asynkron beräkning på Maxwell för att möjliggöra denna funktion. 3DMark Time Spy -riktmärket visar ingen märkbar prestandaskillnad mellan asynkron beräkning som aktiveras eller inaktiveras. Asynkron beräkning inaktiveras av drivrutinen för Maxwell.

Oxide hävdar att detta ledde till att Nvidia pressade dem att inte inkludera den asynkrona beräkningsfunktionen i deras riktmärke alls, så att 900 -serien inte skulle vara i nackdel med AMD: s produkter som implementerar asynkron beräkning i hårdvara.

Maxwell kräver att GPU: n partitioneras statiskt för asynkron beräkning så att uppgifter kan köras samtidigt. Varje partition tilldelas en maskinvarukö. Om någon av köerna som tilldelas en partition tömmer eller inte kan skicka in arbete av någon anledning (t.ex. måste en uppgift i kön fördröjas tills en fara är löst), reserveras partitionen och alla resurser i den partitionen för den kön kommer att gå på tomgång. Asynkron beräkning kan därför lätt skada prestanda på Maxwell om det inte är kodat för att fungera med Maxwells statiska schemaläggare. Dessutom mättar grafikuppgifter Nvidia-GPU: er mycket lättare än de gör för AMD: s GCN-baserade GPU: er som väger mycket tyngre mot beräkningen, så Nvidia-GPU: er har färre schemaläggningshål som kan fyllas med asynkron beräkning än AMD: s. Av dessa skäl tvingar föraren en Maxwell GPU att placera alla uppgifter i en kö och utföra varje uppgift i serie och ge varje uppgift de odelade resurserna i GPU oavsett om varje uppgift kan mätta GPU eller inte.

Produkter

GeForce 900 (9xx) -serien

Modell Lansera Kodnamn Fab ( nm ) Transistorer (miljarder) Formstorlek (mm 2 ) Bus -gränssnitt Kärnkonfiguration Klockhastigheter Fyllnadsgrad Minne API -stöd (version) Processorkraft (GFLOPS) TDP (watt) SLI -stöd Startpris (USD)
Grundkärna ( MHz ) Boost core -klocka ( MHz ) Minne ( MT/s ) Pixel ( GP /s) Textur ( GT /s) Storlek ( MB ) Bandbredd ( GB /s) Typ Bussbredd ( bit ) L2 -cachestorlek ( MB ) DirectX OpenGL OpenCL Vulkan Enkel precision Dubbel precision
GeForce GTX 950 20 augusti 2015 GM206 TSMC 28 nm 2,94 227 PCIe 3.0 x16 768: 48: 32 1024 1188 6610 32.7 49.2 2048
4096
106 GDDR5 128 1 12,0 (12_1) 4.6 3.0 1.2 1572 49.1 90 2-vägs $ 159
GeForce GTX 950 (OEM) 2016 1024: 64: 32 935 1203 5010 38,5 76,99 4096 80,19 1915 76,99 Okänd Ej tillgängligt OEM
GeForce GTX 960 22 januari 2015 1127 1178 7010 39.3 72.1 2048
4096
112 2308 72.1 120 2-vägs $ 199
GeForce GTX 960 (OEM) 6 november 2015 GM204 5.2 398 1280: 80: 48 924
1176
Ej tillgängligt
1201
5010
7010
44,4
38,4
73,9
76,9
3072
4096
120
112
192
128
1.5
1
2365
2460
73,9
76,8
Okänd OEM
GeForce GTX 970 18 september 2014 1664: 104: 56 1050 1178 7010 54,6 109.2 3584+512 196+28 224+32 1,75 3494 109 145 3-vägs $ 329
GeForce GTX 980 2048: 128: 64 1126 1216 72.1 144 4096 224 256 2 4612 144 165 4-vägs $ 549
GeForce GTX 980 Ti 2 juni 2015 GM200 8.0 601 2816: 176: 96 1000 1076 96 176 6144 336 384 3 5632 176 250 $ 649
GeForce GTX Titan X 17 mars 2015 3072: 192: 96 1089 192 12288 6144 192 $ 999
Modell Lansera Kodnamn Fab ( nm ) Transistorer (miljarder) Formstorlek (mm 2 ) Bus -gränssnitt Kärnkonfiguration Klockhastigheter Fyllnadsgrad Minne API -stöd (version) Processorkraft (GFLOPS) TDP (watt) SLI -stöd Startpris (USD)
Grundkärna ( MHz ) Boost core -klocka ( MHz ) Minne ( MT/s ) Pixel ( GP /s) Textur ( GT /s) Storlek ( MB ) Bandbredd ( GB /s) Typ Bussbredd ( bit ) L2 -cachestorlek ( MB ) DirectX OpenGL OpenCL Vulkan Enkel precision Dubbel precision

GeForce 900M (9xxM) -serien

Vissa implementationer kan använda olika specifikationer.

Modell Lansera Kodnamn Fab ( nm ) Transistorer (miljoner) Formstorlek (mm 2 ) Bus -gränssnitt Kärnkonfiguration Klockhastigheter Fyllnadsgrad Minne API -stöd (version) Processorkraft (GFLOPS) TDP (watt) SLI -stöd
Grundkärna ( MHz ) Boost core -klocka ( MHz ) Minne ( MT/s ) Pixel ( GP /s) Textur ( GT /s) Storlek ( MiB ) Bandbredd ( GB /s) Typ Bussbredd ( bit ) DirectX OpenGL OpenCL Vulkan Enkel precision Dubbel precision
GeForce 910M 18 augusti 2015 GF117 28 585 116 PCIe 3.0 x8 96: 16: 8 775 1550 1800 3.1 12.4 1024 14.4 DDR3 64 12.0 (11_0) 4.6 1.1 Ej tillgängligt 297,6 1/12 av SP 33 Nej
15 mars 2015 GK208 Okänd 87 384: 16: 8 575 575 5.13 9.2 2048 1.2 1.1 441,6 18.4
GeForce 920M 13 mars 2015 GF117 585 116 96: 16: 8 775 1550 3.1 12.4 1024 1.1 Ej tillgängligt 297,6 1/12 av SP
GK208 Okänd 87 384: 32: 16 954 954 7.6 30.5 2048 1.2 1.1 732,7 22.9
GeForce 920MX Mars 2016 GM108 1870 148 256: 24: 8 1072 1176 8.58 25.7 2048 DDR3 GDDR5 549 1/32 av SP 16
GeForce 930M 13 mars 2015 384: 24: 8 928 941 7.4 22.3 2048 DDR3 712,7 22.3 33
GeForce 930MX 1 mars 2016 Okänd Okänd PCIe 3.0 x8 Okänd 952 1020 2000 Okänd Okänd 2048 Okänd DDR3 GDDR5 Okänd Okänd Okänd Okänd Okänd Okänd Okänd
GeForce 940M 13 mars 2015 GM107 1870 148 PCIe 3.0 x16 640: 40: 16 1029 1100 2002 16.5 41.2 2048 16 - 80,2 GDDR5 DDR3 128 1.2 1.1 1317 41.1 75 Nej
GM108 Okänd Okänd PCIe 3.0 x8 384: 24: 8 8.2 16.5 64 790,3 24.7 33
GeForce 940MX 10 mars 2016 1870 148 384: 24: 8 1122 1242 8,98 26,93 2048
4096
16.02 (DDR3)
40.1 (GDDR5)
861.7 Okänd 23
GeForce 945M 2015 GM107 ? 640: 40: 16 1029 1085 ? 16.46 41.2 ? ? DDR3 GDDR5 128 1317,1 ? 75 ?
GM108 ? ? PCIe 3.0 x8 384: 24: 8 1122 1242 8,98 26,93 64 861.7 23
GeForce GT 945A 13 mars 2015 Okänd Okänd 384: 24: 8 1072 1176 1800 8.58 25,73 2048 14.4 DDR3 Okänd Okänd Okänd 33 Okänd
GeForce GTX 950M 13 mars 2015 GM107 1870 148 PCIe 3.0 x16 640: 40: 16 914 1085 5012 14.6 36.6 2048 (GDDR5)
4096 (DDR3)
80 (GDDR5)
32 (DDR3)
DDR3

GDDR5

128 1.2 1.1 1170 36,56 75 Nej
GeForce GTX 960M 640: 40: 16 1029 1085 16.5 41.2 2048
4096
80 GDDR5 1317 41,16 65
GeForce GTX 965M 5 januari 2015 GM204 5200 398 1024: 64: 32 924 950 5000 30.2 60,4 12,0 (12_1) 1945 60,78 60 Ja
GeForce GTX 970M 7 oktober 2014 1280: 80: 48 924 993 5012 37,0 73,9 3072
6144
120 192 2365 73,9 75
GeForce GTX 980M 1536: 96: 64 1038 1127 49,8 99,6 4096
8192
160 256 3189 99,6 100
GeForce GTX 980 (bärbar dator) 22 september 2015 2048: 128: 64 1064 1216 7010 72.1 144 224 256 4612 144 145
Modell Lansera Kodnamn Fab ( nm ) Transistorer (miljoner) Formstorlek (mm 2 ) Bus -gränssnitt Kärnkonfiguration Klockhastigheter Fyllnadsgrad Minne API -stöd (version) Processorkraft (GFLOPS) TDP (watt) SLI -stöd
Grundkärna ( MHz ) Boost core -klocka ( MHz ) Minne ( MT/s ) Pixel ( GP /s) Textur ( GT /s) Storlek ( MiB ) Bandbredd ( GB /s) Typ Bussbredd ( bit ) DirectX OpenGL OpenCL Vulkan Enkel precision Dubbel precision

Chipset bord

Avbruten support

"Driver 368.81 är den sista drivrutinen som stöder Windows XP/Windows XP 64-bitars" .

Nvidia meddelade att det efter release 390-drivrutiner inte längre kommer att släppa 32-bitars drivrutiner för 32-bitars operativsystem.

Bärbara GPU: er baserade på Kepler -arkitekturen flyttade till äldre support i april 2019 och slutade ta emot kritiska säkerhetsuppdateringar efter april 2020. Nvidia GeForce 910M och 920M från 9xxM GPU -familjen påverkas av denna förändring.

Nvidia meddelade att efter release 470 -drivrutiner skulle det överföra drivrutinsstöd för operativsystemen Windows 7 och Windows 8.1 till äldre status och fortsätta att tillhandahålla viktiga säkerhetsuppdateringar för dessa operativsystem fram till september 2024.

Se även

Referenser

externa länkar