Aspettando Fermi ......

Totocellux

Achille GForce ha scritto:

[............]

So che una controaccusa non avverrà mai perchè trovaranno il modo di mettere tutto a tacere però si meriterebbero una bella multa così da aumentare il debito che hanno.

è inutile al momento avventurarsi in previsioni tutto sommato avventate, c'è bisogno solo di attendere gli sviluppi che si avranno, forse, nei prossimi giorni: attualmente non è assolutamente possibile sapere cosa AMD abbia in proprio possesso per essere uscita così allo scoperto

Iantikas

GF100 graphics architecture unveiled - The Tech Report - Page 1

è uscito un nuovo articolo di techreport su fermi basato sugli ultimi dati che ha rilasciato nvidia...

...la cosa nuova che si legge da quest'articolo (oltre che son riportate più "opinioni" prese dalla conferenza) rispetto agli altri è che nvidia ha deciso nelle gpu fermi della tipologia Geforce di castrare il potenziale teorico in DP ad 1/4 del valore massimo (dicono per far si che le GeForce non andassero a rovinare il mercato alle Tesla che invece avranno tutto il potenziale in DP)...

...inoltre siccome quelli di nvidia hanno detto che fermi avrà una capaicità di filtraggio texture inferiore a GT200b ne deriva che anche se non hanno dichiarato le freq a cui GF100 uscirà, cmq GF100 non dovrebbe avere un clock degli shader superiore ai 1505mhz e quindi la metà per il "GPC clock" (altrimenti sorpasserebbe GT200b nel potenziale teorico con le texture)...

...partendo da questi hanno aggiornato la tabella con i nuovi probabili clock che avrà la top basata su Fermi...complice anche la limitazione del DP rate ad 1/4 del reale potenziale gli unici valori dove supera la HD5870 son nella bandwidth, nel potenziale delle ROP e, nella tabella non'è presente, ma lo è anche nel potenziale geometrico di quanti triangoli/s è in gtradi di processare...

...la doppia precisione in ambito gaming dovrebbe avere importanza uguale a zero ma, siccome non'è che sia una cima in queste cose, secondo voi, dato cuda e physx, può essere che la scelta di nvidia di limitare le Geforce a 64 FMA ops al secondo (anzichè le 256 di cui è realmente capace) può influire anche nel gaming se PhysX o questo genere di cose son attive?...

...cmq non ci resta che aspettare l'uscita delle schede perchè la situazione è troppo confusa per essere certi di qualcosa...l'unica cosa che è molto probabile è che sarà mediamente superiore ad una HD5870...

...ma a quel punto bisogna vedere di quanto, perchè a seconda di quanto sarà efficente l'archiettura e di quanto "piacerà ai giochi" attuali e pv, potrebbe esserlo di un 5% come di un 35%...

...ciao

gianni1879

tornando un in pò in tema:

GF100 graphics architecture unveiled - The Tech Report - Page 5

in this architecture, double-precision math should happen at half the speed of single-precision, clean and simple. However, Nvidia has made the decision to limit DP performance in the GeForce versions of the GF100 to 64 FMA ops per clock—one fourth of what the chip can do. This is presumably a product positioning decision intended to encourage serious compute customers to purchase a Tesla version of the GPU instead. Double-precision support doesn't appear to be of any use for real-time graphics, and I doubt many serious GPU-computing customers will want the peak DP rates without the ECC memory that the Tesla cards will provide. But a few poor hackers in Eastern Europe are going to be seriously bummed, and this does mean the Radeon HD 5870 will be substantially faster than any GeForce card at double-precision math, at least in terms of peak rates.

A quanto pare Nvidia intenderrà ridurre la capacità di calcolo in DoublePrecision di Fermi ad 1/4 rispetto alle reali capacità del chip, per avvantaggiare le vendite di Tesla, si passa infatti a 64 FMA per clock anzichè 256 FMA (186 gflops).

Severnaya

come disse qualcuno su hwupgrade

e meno male che dovevano già produrle in massa...

gianni1879

Achille GForce ha scritto:

Non credo sinceramente che siano andati a penalizzare la propria GPU in nessun campo del game, visto che già la situazione non è a favore, dopo i problemi che hanno avuto e il tempo che hanno ancora a disposizione lo stanno usando probabilmente per spingere quesi chip il più possibile.
I calcoli SP e DP da quanto ne so non si possono svolgere in parallelo, quindi non c'è comunque modo di usare la potenza del DP nel gaming.

Comunque se quelle freqeunze di quella tabella si avvicinassero alla realtà vorrebbe dire che avremo una GTX 360 molti simile come freqeunza al top di gamma tesla, magari con qualche piccolo ritocco ma a grandi linee penso siano quelle.

in ambito gaming ti do ragione, ma le tesla sono vga per ben altri scopi.

Ridurre la potenza di calcolo in DP ad 1/4 non è una bella cosa nelle GF, significa che i problemi ci sono eccome.

in ambito domestico non mi pare che ci siano sw in grado di sfruttare la DP. (cmq quì meglio sentire Yoss)

gianni1879

disattivate, non tagliate...

gianni1879

Achille GForce ha scritto:

quindi ?
Quel lavoro lì è comunque stato fatto su GeForce e basta non al Chip in generale da come ne parlavi tu sembrava che fosse applicato a tutti.

no la news mi pare abbastanza chiara, sono disattivate nelle GF per favorire la vendita delle tesla.

Iantikas

lo riscrivo in questo post casomai in quello più lungo uno si noia a leggere ...

...PhysX e tutte le applicazioni basate su CUDA che girano sulle Geforce sfruttano le potenzialità delle gpu in singola o doppia precisione?...

...l'aver ridotto di 1/4 da 256 a 64 FMA ops/clock le potenzialità teoriche in DP di fermi può portare qualche svantaggio in ambito consumer?...

...ciao

Totocellux

Iantikas ha scritto:

GF100 graphics architecture unveiled - The Tech Report - Page 1
...la cosa nuova che si legge da quest'articolo (oltre che son riportate più "opinioni" prese dalla conferenza) rispetto agli altri è che nvidia ha deciso nelle gpu fermi della tipologia Geforce di castrare il potenziale teorico in DP ad 1/4 del valore massimo (dicono per far si che le GeForce non andassero a rovinare il mercato alle Tesla che invece avranno tutto il potenziale in DP)...

gianni1879 ha scritto:

tornando un in pò in tema:
GF100 graphics architecture unveiled - The Tech Report - Page 5

in this architecture, double-precision math should happen at half the speed of single-precision, clean and simple. However, Nvidia has made the decision to limit DP performance in the GeForce versions of the GF100 to 64 FMA ops per clock—one fourth of what the chip can do. This is presumably a product positioning decision intended to encourage serious compute customers to purchase a Tesla version of the GPU instead. Double-precision support doesn't appear to be of any use for real-time graphics, and I doubt many serious GPU-computing customers will want the peak DP rates without the ECC memory that the Tesla cards will provide. But a few poor hackers in Eastern Europe are going to be seriously bummed, and this does mean the Radeon HD 5870 will be substantially faster than any GeForce card at double-precision math, at least in terms of peak rates.

[..........]

questo è un ottimo spunto di riflessione

Come abbiamo fin qui potuto appurare, sebbene con le limitate notizie a nostra disposizione, l'abnorme sbilanciamento a favore dell'efficienza votata al GPGPU dell'archiettura Fermi, al fine di salvaguardare l'enorme spesa da sostenere per i futuri acquirenti ed utilizzatori delle Fermi/Tesla (ma non solo ovviamente :asd: ), porta inevitabilmente come effetto una necessaria e piuttosto evidente strozzatura nelle Fermi/GeForce e sicuramente anche nelle Fermi/Quadro.

Uno sbilanciamento prestazionale intrinseco all'architettura, comune quindi ai prodotti finali delle tre aree di utilizzo (Gpu computing - Professional Graphic - Gaming) necessita alla fine di una rimodulazione globale dell'efficienza non solo per salvaguardare l'acquisto degli acquirenti che dovranno affrontare proporzionalmente il maggior esborso, ma soprattutto per evitare ad nVidia stessa di perdere verosimilmente (e in modo assai facile) il maggior introito del mercato Tesla (su cui siamo tutti d'accordo che nVidia con questa architettura ha puntato in modo assoluto), qualora gli acquirenti si rifugiassero nell'acquisto di una identica scheda dal costo sensibilmente frazionato

Questo intendevo in precedenza riguardo ai presunti manager non particolarmente attenti, oculati e lungimiranti: se avessero realmente commesso questo enorme errore di marketing, direi che è tutto sommato corretto che si trovino ora in queste difficoltà

Se è realmente accaduto tutto ciò, qualcuno starà già facendo il mea-culpa ..... e verosimilmente anche le valige, oserei dire :asd:

Totocellux

Iantikas ha scritto:

[..........]

...PhysX e tutte le applicazioni basate su CUDA che girano sulle Geforce sfruttano le potenzialità delle gpu in singola o doppia precisione?...

direi proprio di si, sia FP32 che FP64, ed in special modo in CUDA nelle applicazioni di calcolo prettamente di natura scientifica

Iantikas ha scritto:

[..........]

...l'aver ridotto di 1/4 da 256 a 64 FMA ops/clock le potenzialità teoriche in DP di fermi può portare qualche svantaggio in ambito consumer?...

direi sostanzialmente di no, a patto che la gpu non esegua calcoli sulla fisica

dj883u2

Achille GForce ha scritto:

io sapevo invece che tutto l'ambito gaming si basava solo sul SP.
come fa Physx ad essere double precision ? Il tessellation uguale suppongo vero ?

a parte che la news sarebbe da confermare, non è nulla di confermato per ora.

Aspettiamo la smentita da pate di Nvidia.

Totocellux

Achille GForce ha scritto:

io sapevo invece che tutto l'ambito gaming si basava solo sul SP.
come fa Physx ad essere double precision ? Il tessellation uguale suppongo vero ?

[..........]

Physx è predisposto alla doppia precisione a partire dall'SDK v2.8.3

anche ATI sembra andare nella stessa direzione con il suo Stream SDK v2.0:

KB88 - Preview Feature: ATI Stream SDK v2.0 Support for Double-Precision Floating Point Basic Arithmetic in OpenCL C Kernels

Detto questo, ovviamente, che poi vengano proficuamente utilizzati o meno, questo è un altro discorso

gianni1879

Achille GForce ha scritto:

FuDZilla colpisce ancora

Fudzilla - Fermi to be the hottest single chip ever

Sembra che Fermi sarà il chip più caloroso mai prodotto

Fudzilla

Quà invece buone notizie, Fermi potrebbe essere anticipato e i primi lotti potrebbero arrivare prima di Marzo

Intanto nessuna conferma oggi in nessun portale del presunto taglio nel DP su GeForce.

fudzilla lo prenderei sempre e comunque con le pinze

Taurus

si ma dico io, fare qualche scheda per delle recensioni?? non vedo dove sia il problema :cheazz:

la cosa mi puzza...

comunque ecco qui una dimostrazione di Physicità di Fermi, che potenza

p.s. non bannatemi :asd:

delly

gianni1879 ha scritto:

fudzilla lo prenderei sempre e comunque con le pinze

eh già... :asd: :asd:

Totocellux

Achille GForce ha scritto:

[.........]

MA quello che interesserebbe sono le potenzialità di calcolo geometrico ( triangoli ) e il tessellation sono in DP o no ?

seguendo direttamente le specifiche Direct3D v.11, la Tessellation Unit, è controllata da due nuovi shader, per altro di diversa tipologia:

1) Hull Shader che in buona sostanza svolge due lavori:

a) prepara da una parte le coordinate e ne calcola i Tessellation factors dei singoli punti di controllo (inviati direttamente al Domain Shader)

b) dall'altra calcola i Tessellation factors che serviranno al Tessellator vero e proprio per dividere ogni singolo triangolo in triangoli più piccoli. Il Tessellator può così inviare output (sempre al Domain Shader) le coordinate spaziali (UVW) di ogni singolo vertex

2) Domain Shader che alla fine dei conti è quello che riceve entrambi i precedenti output, e si incarica di deformare la maglia creata sia con i punti di controllo calcolati dall'Hull Shader sia tramite le coordinate spaziali dei vertex risolte dal Tessellator, in modo tale da poter finalmente sfruttare una profondità di geometria molto più fine e dettagliata.

Considerato che la Model Shader v5.0 supporta la doppia precisione (in formato IEEE-754 con piena precisione 0.5 Unit of List Precision), la mia risposta è si, le predette operazioni potrebbero essere svolte in doppia precisione.

yossarian

gianni1879 ha scritto:

in ambito gaming ti do ragione, ma le tesla sono vga per ben altri scopi.
Ridurre la potenza di calcolo in DP ad 1/4 non è una bella cosa nelle GF, significa che i problemi ci sono eccome.

in ambito domestico non mi pare che ci siano sw in grado di sfruttare la DP. (cmq quì meglio sentire Yoss)

in ambito gaming non si sfruttano i 64 bit. Si lavora a fp32, fp16, in alcuni casi addirittura INT8 (vedi MSAA box)

Iantikas ha scritto:

lo riscrivo in questo post casomai in quello più lungo uno si noia a leggere ...
...PhysX e tutte le applicazioni basate su CUDA che girano sulle Geforce sfruttano le potenzialità delle gpu in singola o doppia precisione?...

...l'aver ridotto di 1/4 da 256 a 64 FMA ops/clock le potenzialità teoriche in DP di fermi può portare qualche svantaggio in ambito consumer?...

...ciao

alcune applicazioni che girano su cuda sfruttano la dp; physx no.

La maggior parte dei sw in ambito consumer usa, al più, fp32. Ovviamente non parliamo di gpgpu nel senso stretto del termine (anche physx è un giocherello rispetto alla "vera" fisica su gpu o cpu che sia).

Totocellux ha scritto:

direi proprio di si, sia FP32 che FP64, ed in special modo in CUDA nelle applicazioni di calcolo prettamente di natura scientifica
direi sostanzialmente di no, a patto che la gpu non esegua calcoli sulla fisica

Totocellux ha scritto:

Physx è predisposto alla doppia precisione a partire dall'SDK v2.8.3
anche ATI sembra andare nella stessa direzione con il suo Stream SDK v2.0:

KB88 - Preview Feature: ATI Stream SDK v2.0 Support for Double-Precision Floating Point Basic Arithmetic in OpenCL C Kernels

Detto questo, ovviamente, che poi vengano proficuamente utilizzati o meno, questo è un altro discorso

cuda usa la dp; physx no e neppure i sw di tipo consumer "spacciati" per gpgpu (tipo badaboom e simili).

Totocellux ha scritto:

seguendo direttamente le specifiche Direct3D v.11, la Tessellation Unit, è controllata da due nuovi shader, per altro di diversa tipologia:
1) Hull Shader che in buona sostanza svolge due lavori:

a) prepara da una parte le coordinate e ne calcola i Tessellation factors dei singoli punti di controllo (inviati direttamente al Domain Shader)

b) dall'altra calcola i Tessellation factors che serviranno al Tessellator vero e proprio per dividere ogni singolo triangolo in triangoli più piccoli. Il Tessellator può così inviare output (sempre al Domain Shader) le coordinate spaziali (UVW) di ogni singolo vertex

2) Domain Shader che alla fine dei conti è quello che riceve entrambi i precedenti output, e si incarica di deformare la maglia creata sia con i punti di controllo calcolati dall'Hull Shader sia tramite le coordinate spaziali dei vertex risolte dal Tessellator, in modo tale da poter finalmente sfruttare una profondità di geometria molto più fine e dettagliata.

Considerato che la Model Shader v5.0 supporta la doppia precisione (in formato IEEE-754 con piena precisione 0.5 Unit of List Precision), la mia risposta è si, le predette operazioni potrebbero essere svolte in doppia precisione.

il tessellator lavora al massimo a fp32 (il vero e proprio tessellator è di tipo fixed function anche gli hull shader hanno una parte di tipo ff).

Darkcool

Taurus ha scritto:

p.s. non bannatemi

ot mode on:

Questo video è veramente grottesco... :2funny:

ot mode off

Severnaya

no fa paura : |

Yoss scusa una domanda, ma tu personalmente l'architettura di fermi come la vedi? ti convince? soprattutto per sbocchi futuri come nuovi nodi, o è na ciofeca da buttare?

Totocellux

yossarian ha scritto:

[..........]

alcune applicazioni che girano su cuda sfruttano la dp; physx no.

[..........]

cuda usa la dp; physx no

[..........]

sapresti allora indicarmi l'utilità della funzione nxsetfpuprecision64() all'interno della NxUtilLib presente nel Physx SDK v2.8.3?