Recensione GeForce GTX 750 Ti: Maxwell aggiunge prestazioni utilizzando meno energia

Presentazione della GPU GM107, basata su Maxwell

  • Pagina 1: Presentazione della GPU GM107, basata su Maxwell
  • Pagina 2: scheda di riferimento GeForce GTX 750 Ti di Nvidia
  • Pagina 3: MSI GTX 750 Ti Gaming OC
  • Pagina 4: Gigabyte GTX 750 Ti Windforce OC
  • Pagina 5: Zotac GTX 750 Ti
  • Pagina 6: configurazione di prova e benchmark
  • Pagina 7: Risultati: Arma 3
  • Pagina 8: Risultati: Assassin's Creed IV: Black Flag
  • Pagina 9: Risultati: Battlefield 4
  • Pagina 10: Risultati: BioShock Infinite
  • Pagina 11: Risultati: Far Cry 3
  • Pagina 12: Risultati: griglia 2
  • Pagina 13: Risultati: Metro: Last Light
  • Pagina 14: Prestazioni medie e prestazioni per watt
  • Pagina 15: GPU Boost e overclocking
  • Pagina 16: GPGPU: prestazioni in virgola mobile
  • Pagina 17: GPGPU: Bitcoin, Litecoin, LuxMark e RatGPU
  • Pagina 18: Applicazioni professionali
  • Pagina 19: Temperature e acustica
  • Pagina 20: Consumo energetico: giochi
  • Pagina 21: Consumo energetico: inattività, elaborazione e altro
  • Pagina 22: prestazioni pazzesche per una scheda da 60 W

Presentazione della GPU GM107, basata su Maxwell

Oggigiorno, ai giocatori piacciono le loro schede grafiche robuste. I dispositivi di raffreddamento a doppio slot e le fantasiose protezioni delle ventole sono in genere ciò che suscita grugniti in stile Tim Allen e consapevoli cenni di approvazione. Dopotutto, frame rate elevati richiedono GPU complesse. Miliardi di transistor che si scatenano in Battlefield 4 si surriscaldano. E tutto quel calore deve andare da qualche parte.

Quindi, se vieni al tavolo con un PCB corto e nudo, è meglio che abbia uno o due trucchi nella manica figurativa.

Tuttavia, Nvidia, forse cercando di dimostrare un punto, ha distribuito la sua GeForce GTX 750 Ti di riferimento su una scheda da meno di sei pollici. Senza connettore di alimentazione ausiliaria. Mettendo in mostra un piccolo dissipatore di calore in stile orb imbullonato e una ventola. Ha più o meno le stesse dimensioni della GeForce GTX 650 Ti. Ma senza il grande dispositivo di raffreddamento, la GTX 750 Ti è più delicata anche di molte schede audio che abbiamo testato.

Nondimeno, Nvidia afferma che il suo primo prodotto basato su architettura Maxwell punta ai giochi a 1920x1080 negli ultimi titoli utilizzando alcune impostazioni piuttosto impegnative. Potrebbe essere questa la Prius del mondo della grafica?

Maxwell In The Middle

La storia di Maxwell è intrigante, in parte per ciò che significa per l'approccio progettuale dell'azienda andare avanti, ma anche perché Nvidia tiene per sé più dettagli architettonici del solito. Cominciamo con il design.

Nel dicembre dello scorso anno, eravamo a Santa Clara per conoscere il SoC Tegra K1 di Nvidia. Sapevamo già che il motore grafico di K1 era basato su Kepler, essenzialmente un singolo SMX con notevoli modifiche alle strutture che collegavano vari sottosistemi nel tentativo di ottimizzare la potenza. Ma Jonah Alben, vicepresidente senior dell'ingegneria GPU, ha anche chiarito che ogni nuova architettura, da Maxwell in poi, sarebbe stata costruita pensando ai dispositivi mobili. Gli ingegneri ottimizzerebbero i tessuti tra i componenti della GPU in base agli obiettivi di prestazioni e ai budget energetici. Tuttavia, gli elementi costitutivi fondamentali rimarrebbero comuni tra i segmenti e l'efficienza guiderebbe le decisioni importanti.

Tegra: da dove è venuto

L'impulso per Maxwell viene dallo sforzo di Nvidia nello spazio smartphone e tablet. Leggi Nvidia Tegra K1 in profondità: la potenza di una Xbox in un SoC mobile? per saperne di più su quell'architettura.

Questa è chiaramente una buona notizia per la famiglia Tegra, che continua a cercare una fetta di mercato più significativa. I dispositivi basati su K1 non sono ancora qui e stiamo già pensando all'affermazione di Nvidia secondo cui Maxwell offre due volte le prestazioni per watt di Kepler e cosa potrebbero significare miglioramenti così considerevoli per i giochi mobili.

Una rinnovata enfasi sull'efficienza dovrebbe essere buona anche sul desktop, a condizione che l'architettura riorganizzata dell'azienda continui a scalare da massimali di potenza a una, due e tre cifre.

Fortunatamente, non dovrai aspettare a lungo per una risposta. La GeForce GTX 750 Ti lanciata oggi dovrebbe dimostrare cosa può fare Maxwell (almeno con un TDP di 60 W). Nvidia afferma che il suo design più efficace riduce il consumo energetico e aumenta le prestazioni, anche in una GPU con meno core CUDA. Sapendo che non avrebbe avuto un nuovo nodo della tecnologia di processo su cui appoggiarsi, Nvidia ha dovuto apportare i suoi miglioramenti a Maxwell pensando alla produzione a 28 nm. In altre parole, doveva fare in modo che le sue GPU funzionassero in modo più intelligente, poiché il semplice utilizzo di più risorse non sarebbe stata un'opzione.

Maxwell Streaming Multiprocessor

I rappresentanti dell'azienda ci dicono che i maggiori guadagni di Maxwell derivano da una riprogettazione dello Streaming Multiprocessor, ora abbreviato in SMM.

In Kepler, ogni SMX riproduce l'host di 192 core CUDA, quattro pianificatori warp e un file di registro da 256 KB. Sono inoltre presenti 64 KB che fungono da memoria condivisa e cache L1, una cache delle texture separata e una cache uniforme, oltre a 16 unità texture. Il grande salto nel conteggio dei core CUDA e nella logica di controllo ha aiutato Nvidia a superare la perdita della doppia frequenza dello shader di Fermi. Ma a quanto pare l'SMX si è rivelato difficile da utilizzare appieno in questa configurazione.

Maxwell tenta di risolvere questo problema partizionando l'SMX in quattro blocchi, ciascuno con il proprio buffer di istruzioni, warp scheduler e coppia di unità di invio. Il file di registro da 256 KB di Kepler ora viene suddiviso in quattro sezioni da 64 KB. E i blocchi hanno 32 core CUDA ciascuno, per un totale di 128 attraverso l'SMM (in calo rispetto ai 192 di Kepler). Le 32 unità di carico / magazzino e 32 unità per funzioni speciali dell'architettura precedente vengono trasferite a Maxwell. Tuttavia, la matematica a doppia precisione è ulteriormente ridotta a 1/32 del tasso di FP32; quello era 1/24 nelle GPU tradizionali basate su Kepler.

Per SM: GM107GK106RatioCUDA Core1281922 / 3xSpecial Function Units32321xLoad / Store32321xTexture Units8161 / 2xWarp Schedulers441xGeometry Engines111x

Ogni coppia di blocchi è legata a una trama da 12 KB e una cache L1, aggiungendo fino a 24 KB per SMM. Le coppie di blocchi sono anche associate a quattro unità di texture, il che significa che le SMM sono armate con otto. È la metà delle unità di texture rispetto all'SMX di Kepler. E la tabella sopra fa sembrare che GM107 abbia effettivamente ceduto un po 'di terreno a GK106. Ma non preoccuparti ancora dei colli di bottiglia. Ricorda, l'architettura dovrebbe ottenere di più utilizzando meno risorse.

Infine, c'è uno spazio di memoria condivisa di 64 KB per SMM, che viene trasferito da Fermi e poi da Kepler, ma non viene più chiamato cache L1 per le attività di calcolo. In passato questo spazio poteva essere configurato come 48 KB di spazio condiviso e 16 KB di L1 e viceversa. Ora non è necessario, quindi tutti i 64 KB vengono utilizzati come spazio di indirizzi condiviso per il calcolo della GPU.

Come puoi immaginare, il taglio di 64 core CUDA e otto unità di texture dall'SMM significa che ogni blocco di costruzione consuma dimensioni di stampo significativamente inferiori. Nel frattempo, Nvidia afferma di essere in grado di resistere

90% delle prestazioni del multiprocessore mantenendo i core occupati in modo duraturo. Se stai pensando a cosa potrebbe significare per un tablet, non sei il solo. Ma in un'applicazione desktop, Nvidia è semplicemente in grado di impacchettare più SMM in una determinata quantità di spazio. La GeForce GTX 650 Ti sostituisce questa scheda con quattro blocchi SMX, mentre la GeForce GTX 750 Ti incorpora cinque SMM.

Costruire GM107

Questa è la prima volta che vediamo Nvidia introdurre una nuova architettura su una scheda grafica decisamente di fascia media. Con Fermi, era il GF100 a piena forza. Anche il GK104 basato su Kepler è stato un modo incredibilmente veloce per soddisfare quell'architettura. Quindi, la messaggistica è leggermente diversa con GM107 che guida la carica. Naturalmente, questo è perché GeForce GTX 750 Ti deve inserirsi in un portafoglio ancora dominato da Kepler, piuttosto che semplicemente salire al trono.

E così lo fa utilizzando un'implementazione completamente abilitata di GM107, composta da cinque SMM in un singolo cluster di elaborazione grafica con il proprio motore raster. GM107 può impostare una primitiva visibile per ciclo di clock, che è appena dietro il tasso primitivo di GK106 di 1,25 prim / clock e il doppio di GK107 .5 prim / clock.

Come nelle precedenti architetture Nvidia, le partizioni ROP e le slice di cache L2 sono allineate. E come il processore GK106 della GeForce GTX 650 Ti, GM107 sfoggia due partizioni con otto unità ciascuna, offrendo fino a 16 pixel interi a 32 bit per clock. Dove le due GPU davvero divergono è la loro capacità di cache L2. In GK106, stavi guardando 128 KB per slice, aggiungendo fino a 256 KB in un'implementazione con due partizioni ROP. GM107 sembra gestire 1 MB per slice, producendo 2 MB di memoria utilizzata per la gestione delle richieste di caricamento, archiviazione e texture. Secondo Nvidia, questo si traduce in un carico significativo spostato dal sistema di memoria esterna, insieme a un notevole risparmio energetico.

Andare piano con la larghezza di banda della memoria è intelligente, poiché GM107 espone una coppia di controller di memoria a 64 bit a cui sono collegati 1 o 2 GB di DRAM GDDR5 a 1350 MHz. È interessante notare che il picco di throughput è esattamente quello che abbiamo ottenuto dalla GeForce GTX 650 Ti: 86,4 GB / s. La memoria alimenta meno core CUDA, ma sono gestiti in modo più efficiente. Quindi, il grande L2 dovrebbe svolgere un ruolo fondamentale nel prevenire un collo di bottiglia.

In effetti, uno sguardo alle latenze globali della cache casuale in-page aiuta a illustrare come la gerarchia della memoria di Maxwell mantiene la GPU occupata in modo più coerente.

Oltre ai pezzi di GM107 dedicati ai giochi e alle attività di elaborazione, Nvidia afferma anche di aver migliorato il blocco NVEnc a funzione fissa. Questa è la logica responsabile per consentire a ShadowPlay di codificare il tuo frag fest con un impatto minimo sulle prestazioni. È ciò che consente lo streaming su Shield. E accelera alcune app di transcodifica per caricare rapidamente grandi film sui tuoi dispositivi portatili. Mentre Kepler era in grado di codificare contenuti basati su H.264

4 volte più veloce del tempo reale, Maxwell presumibilmente raggiunge 6-8 volte in tempo reale. Si dice che le prestazioni di decodifica H.264 siano da otto a 10 volte più veloci di prima. Nvidia ottiene questi vantaggi, dice, semplicemente accelerando i blocchi a funzioni fisse.

GTX 650GeForce GTX 650 TiGeForce GTX 750 TiGeForce GTX 660GPUGK107GK106GM107GK106ArchitectureKeplerKeplerMaxwellKeplerSMs2455GPCs1213Shader Cores384768640960Texture Units32644080ROP Units16161624Process Node28 nm28 nm28 nm28 nmCore / Boost Clock1058 MHz925 MHz1020 / 1085 MHz980 / 1033 MHzMemory Clock1250 MHz1350 MHz1350 MHz1502 MHzMemory Bus128-bit128-bit128-bit192-bitMemory Bandwidth80 GB / s86,4 GB / s86,4 GB / s144,2 GB / s RAM grafica (GDDR5) 1 o 2 GB1 o 2 GB1 o 2 GB2 Connettori di alimentazione1 x 6 pin1 x 6 pin Nessuno1 x 6 pin TDP64 massimo W110 W60 W140 W Prezzo $ 130 (2 GB) $ 150 (2 GB) $ 150 (2 GB) $ 190 (2 GB)

Nel complesso, la GPU GM107 finisce con 1,87 miliardi di transistor in un die da 148 mm². Se mantieni attivo il confronto con la GeForce GTX 650 Ti, il primo processore basato su Maxwell sostituisce GK106, che racchiude 2,54 miliardi di transistor in un die da 221 mm². Prima di arrivare ai nostri risultati sulle prestazioni, dobbiamo presumere che l'enfasi di Nvidia sull'efficienza sia abbastanza significativa da consentire all'azienda di utilizzare meno transistor su un die più piccolo, eliminare molti core CUDA e unità di texture e migliorare comunque le prestazioni complessive. Almeno, questo è quello che cercheremo ...

In alternativa, puoi confrontare il GM107 con il GK107 da 1,3 miliardi di transistor da 118 mm², se preferisci un controsoffitto termico. In tal caso, il processore basato su Maxwell è più complesso, più grande, significativamente più veloce e tuttavia dovrebbe comunque utilizzare meno energia.

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 22

Pagina corrente: Presentazione della GPU GM107, basata su Maxwell

Specifiche e benchmark di NVIDIA GeForce GTX 750 Ti trapelati

Sembra che le prime GPU Maxwell siano già in circolazione. Fortunatamente per noi, un membro dei forum PCOnline ha avuto l'opportunità di testare la prossima GTX 750 Ti di NVIDIA.

Specifiche NVIDIA GeForce GTX 750 Ti

Secondo lo screenshot trapelato dalla GPU-Z, la prima GPU basata su Maxwell avrebbe 960 core CUDA. In effetti la configurazione di questa scheda è piuttosto interessante. Pur avendo un gran numero di core CUDA, ha solo 16 ROP e un'interfaccia di memoria a 128 bit. Questo è sicuramente un collo di bottiglia.

A parte l'interfaccia da 128b, abbiamo 2 GB di memoria GDDR5, il che va bene, immagino. Tieni presente, tuttavia, che offre solo una larghezza di banda di 86,4 GB / s, proprio come 650 TI.

Videos about this topic

GTX 750Ti vs GT 1030 Gaming Benchmarks!
GTX 750 Ti Test in 10 Games in 2018
Nvidia GeForce GTX 750 Ti Review & Benchmarks (Maxwell) | Unboxholics
GTX 750 Ti 2GB vs GTX 750 Ti 4GB | New Games Benchmarks
Hats Off to The GTX 750 Ti!
Asus Nvidia GeForce GTX 750 ti OC - Unboxing, Installation and Benchmarking.