ASUS ENGTX580 DCII GeForce GTX 580 più veloce del mercato

Nuova architettura FERMI e GF110:

In maniera sostanziale il nuovo chip GF110 prodotto da Nvidia ha sostituito il vecchio GF100, il quale veniva usato per la GeForce GTX 480, ed è dotato della medesima architettura. 

Nvidia_GF110_1

Il chip grafico è dotato di 4 Graphics Processing Clusters (GPC), ognuno dei quai contiene 1 Raster Engine, 4 Stream Multiprocessors (SM). Ogni SM contiene 32 CUDA core, 16 unità Load/Store, 4 Special Function Units, 4 Texture Units, 2 Warp Schedulers ed 1 Dispatch Unit. Troviamo anche una unità  Polymorph Engine che si occupa delle operazioni di tesselazione,  48KB+16KB L1 cache,  le Unità di Registro e le ROPs.  A servizio del memory controller (6 x 64bit) abbiamo la L2 cache.

Nvidia_GF110_2

A conti fatti abbiamo un GF100 senza alcuna limitazione, vi ricordiamo infatti che nella GeForce GTX 480 un’unità SM era disabilitata per garantire alte rese produttive. Adesso Nvidia grazie agli affinamenti del processo produttivo e di altri fattori di progettazione compiuti dalle fonderie, è riuscita a restituirci un GF100 senza alcuna limitazione, migliorato inoltre in alcuni aspetti.

Nvidia_GF110_3 Nvidia_GF110_6

Troviamo in questo modo ben 512 unità CUDA core funzionanti a 1.544 MHz, 64 TMU, 48 ROPs, controller a 384bit, 1536 MB di memoria video del tipo GDDR5, funzionanti a 4.008 MHz e che garantiscono una banda passante di ben 192,4 GB/s. Naturalmente il core grafico lavora sempre in rapporto 1:2 rispetto ai CUDA core, infatti ha una frequenza di 772 MHz nella versione reference di Nvidia.  Possiamo ossservare sotto una tabella che mette in evidenza le caratteristiche architetturali di GF110:

Nvidia_GF110_7 

Vi sono state anche altre ottimizzazioni che in alcuni casi possono portare a differenze significative. In precedenza con il chip grafico Nvidia GF100, le proprie unità erano in grado di computare 1 texture address e 4 fetch a 32bit/INT8 texture samples per clock, 2 64bit/FP16 texture samples per clock, oppure 1 128bit/FP32 texture sample per clock. Già con il chip GF104 le  texture units hanno subito un miglioramento riuscendo a renderizzare 4 samples/clock per istruzioni a 32bit e 64bit. Allo stesso modo in GF 110 troviamo questa capacità di calcolo, adesso il chip è in grado di processare istruzioni 32bit (INT8) e  64bit(FP16) alla stessa velocità, vale a dire ben 4 istruzioni per ciclo di clock. Questo, anche se non ha un impatto immediato in tutti i giochi, in qualcuno specie tra i più recenti si traduce in un vantaggio sostanziale rispetto a GF100. Riassumiamo questo concetto nella tabella seguente:

istruzioni_per_clock

 

Altre modifiche, più esterne, riguardano il sistema di dissipazione, relativo alla versione reference Nvidia, che adesso è più efficace e silenzioso, grazie all’adozione della tecnologia a camera di vapore ed ad un generale restilyng del sistema di dissipazione.

Nvidia_GF110_4 Nvidia_GF110_8

In aggiunta Nvidia ha dotato sul proprio PCB ben 3 controller Hardware Monitoring Manage Power, che monitorizzano in maniera istantanea la corrente assorbita. In questo modo non appena si va oltre certe specifiche PCI-E, con particolari applicazioni come OCCT o FurMark, fanno in modo che i clock sono variati in modo da far rientrare il sistema secondo le specifiche PCI-E.

Nvidia_GF110_5

Riassumiamo brevemente le modifiche che sono state apportate al nuovo chip grafico GF110 rispetto al precedente GF100:

gf100vsgf110