Jump to content

Aspettando Fermi ......


Achille GForce

Recommended Posts

Ho capito, quindi dovrei aver fatto bene a prendere la 5970, anche perchè overcloccandola bene si dovrebbe distaccare ancora di più dalle future Fermi... invece riguardo la dual gpu Fermi, contando anche sulle recenti news, credi sia possibile vederla nei nostri case?

 

probabilmente alla luce degli ultimi avvenimenti passerai al crossfire!

Link to comment
Share on other sites

  • Replies 2.3k
  • Created
  • Last Reply

Top Posters In This Topic

in effetti può esser molto probabile che a marzo usciranno con GF100 "castrato" e a maggio/giugno col GF104 versione "full optional"...

 

 

...anche se quel 4 finale farebbe pensare ad un chip di fascia media (e ne avrebbero anche bisogno) le info degli ultimi giorni e ciò che si è visto al ces fanno pensare ad un lancio di questo tipo...

 

 

...se dovesse essere così cmq, a prescindere dalle prestazioni che avrà la "castrata", penso la salterò per forza di cose in favore della "full" perchè 2/3 mesi ci vuole un attimo e son già volati via (a maggior ragione se non si sta con l'acqua alla gola)...

 

 

...in un certo senso se questa sarà realmente la strategia di nvidia è un pò costretta a farlo però mi sa che l'avrebbero dovuta studiare meglio...

 

 

...cioè andrà un pò come fu ai tempi della X1800XT dopo poco soppiantata dalla X1900XTX però se ricordo bene ati in quell'occasione si tenne la bocca ben cucita sul refresh che sarebbe uscito di li a breve...boh, o almeno non ricordo si sapesse già tutto così in largo anticipo :cheazz:...mentre ora con fermi se uno a marzo vede un GT380 con 448sp ha la certezza che di li a breve si prenderà un :nutkick:da parte di nvidia (e chiaro anche dallo smiles dato che l'omino è verde :D)...

 

 

...vabbeh è meglio che mi vado a coricare che sto inziando a farneticare :uglystupid2:...

 

 

...notte :)

Link to comment
Share on other sites

probabilmente alla luce degli ultimi avvenimenti passerai al crossfire!

Già, mi sa che ci ho azzeccato parecchio a fare quella stima... ti giuro Nick se non mantiene la promessa lo spuxxano in tutti i forum del mondo!!

Mi raccomando, tu sei testimone di quanto ha detto O0

 

 

p.s: pensa che smacco sarebbe per lui... :coolsmiley:

Link to comment
Share on other sites

Ho capito, quindi dovrei aver fatto bene a prendere la 5970, anche perchè overcloccandola bene si dovrebbe distaccare ancora di più dalle future Fermi... invece riguardo la dual gpu Fermi, contando anche sulle recenti news, credi sia possibile vederla nei nostri case?

 

poco probabile

 

ma quindi tutti quelli che ipotizzavano che nvidia sarebbe andata ben piu forte di ati 5870, considerando anche i 5-6 mesi di ritardo si sbagliavano?

Si parlava di superiorità di nvidia del 20/30% su 5870....queste percentuali almeno coincidono considerando la versione non castrata del gf100?

 

dipende molto dalle frequenze definitive; al momento dubito ci siano sample a 512 alu funzionanti. In futuro si dovrà vedere quali frequenze reggeranno. Alle frequenze della tesla (1400 MHz per gli shader e 600 circa di core) considerato il diverso rapporto alu/tmu rispetto a quello esistente tra RV770 e GT200, la differenza media, a occhio, sarebbe inferiore al 10%.

Ma non credo che lo faranno uscire con le frequenze della tesla :fiufiu:

Link to comment
Share on other sites

poco probabile

 

 

 

dipende molto dalle frequenze definitive; al momento dubito ci siano sample a 512 alu funzionanti. In futuro si dovrà vedere quali frequenze reggeranno. Alle frequenze della tesla (1400 MHz per gli shader e 600 circa di core) considerato il diverso rapporto alu/tmu rispetto a quello esistente tra RV770 e GT200, la differenza media, a occhio, sarebbe inferiore al 10%.

Ma non credo che lo faranno uscire con le frequenze della tesla :fiufiu:

E cercando di fare i più vaghi possibili (:asd:) secondo te con quali frequenze potrebbero uscire? Sempre secondo te quanto andrà più forte o più piano GF100 sulla 5870?

Link to comment
Share on other sites

poco probabile

 

 

 

dipende molto dalle frequenze definitive; al momento dubito ci siano sample a 512 alu funzionanti. In futuro si dovrà vedere quali frequenze reggeranno. Alle frequenze della tesla (1400 MHz per gli shader e 600 circa di core) considerato il diverso rapporto alu/tmu rispetto a quello esistente tra RV770 e GT200, la differenza media, a occhio, sarebbe inferiore al 10%.

Ma non credo che lo faranno uscire con le frequenze della tesla :fiufiu:

 

In che senso non credi che lo faranno uscire con quelle frequenze?

 

pensi che riescano a salirle o pensi che dato lo stato attuale quelle frequenze sono già alte?

io sul fattore frequenze sono abbastanza confuso, non so piu che aspettarmi!:cheazz:

Link to comment
Share on other sites

In che senso non credi che lo faranno uscire con quelle frequenze?

 

pensi che riescano a salirle o pensi che dato lo stato attuale quelle frequenze sono già alte?

io sul fattore frequenze sono abbastanza confuso, non so piu che aspettarmi!:cheazz:

Penso che intende che non può uscire con le frequenze delle Tesla perchè sarebbero troppo basse...

posso fare il vago ma non fno a questo punto :fiufiu:

Ok ho capito... il fatto è che ho una scommessa in corso... se GF100 non suopererà più del 10% la 5870 mi ritroverò con un bel crossfire di 5970. Almeno un piccolissimo accenno tanto per mandarmi al letto contento?? :angel:

 

Prendiamo come esempio che GF100 avrà frequenze di 648/1692/4200, di quanto riuscirà a superare la 5870??

 

 

p.s: scherzo, ovviamente se puoi ;)

Edited by Rsdj
Link to comment
Share on other sites

Capito, quindi ci toccherà aspettare ancora un po di tempo, penso che almeno 1 mese e mezzo ci vorrà prima di sapere qualche altra notizia "attendibile" dai partner nvidia!!!

Beh se sarà presentata il 10 marzo qualcosa di attendibile dovremmo saperlo tra un mesetto... di solito un mese prima del lancio già si sapeva tutto, anche se non in maniera ufficiale ma era come se lo fosse :D

Link to comment
Share on other sites

Volevo soffermarmi a fare delle riflessioni un pò oltre a quanto descritto finora, e vorrei che mi diceste ciò che ne pensate :)

 

 

Se pensiamo ed immaginiamo l'obiettivo che nVidia si è prefissato con Fermi essere esclusivamente o anche solo primariamente quello dell'ambito videoludico, ci stanno tutte le giuste riflessioni fatte finora, inerentemente gli eventuali errori, di valutazione e non, che fuori dubbio nVidia avrebbe commesso sinora se si conderano limitatamnte nell'ottica dell'intrattenimento di gioco.

 

Vi invito a riflettere sulle caratteristiche peculiari che questa nuova architettura dovrebbe mettere a disposizione, e lascerò quindi a voi le considerazioni su quale potrebbe essere il reale target di nVidia, che imo essendo peraltro di tutt'altra natura rispetto al semplice videogioco, potrebbe anche più facilmente spiegare la relativa mancanza di fretta o di impazienza finora palesata in questa situazione di palese (per noi) empasse, in quanto allo stato attuale, sarebbe in assoluta mancanza di un vero competitor.

 

 

 

1) - Un set di istruzioni completamente nuovo,

molto più simile all'architettura register/register RISC (detta anche load/store) in cui le istruzioni aritmetico-logiche lavorano solo sui registri, rendendo il codice più efficiente (dovuto primariamente alla lunghezza costante delle istruzioni) con molte istruzioni elementari, facilitando il compito delle pipeline e rendendo possibile un'esecuzione completamente parallela.

 

 

2) - Istruzioni di tipo Faster Atomic di supporto ai task

Istruzioni di questo tipo leggono da locazioni di memoria condivisa, ne controllano i valori e ne scrivono di nuovi senza che nessun altro processore sia capace di modificarne i relativi valori durante le singole esecuzioni. Questo permette ai task di comunicare gli uni con gli altri tramite degli opportuni bit o flag, come vogliamo chiamarli. La cache L2 di Fermi, dove questi valori verranno prevalentemente memorizzati, renderà una sensibile accelerazione supplementare.

 

 

3) - Spazio di indirizzamento virtuale a 64bit

Il PTX (Parallel Thread eXecution layer) permetterebbe a Fermi di cambiare dalla modalità di indirizzamento a 32bit a quella a 64bit senza una negativa e deleteria interruzione di tipo software.

 

 

4) - Caches

Fermi include una caratteristica interessante per ottenere più valore dalla cache L1, cioè quella di poterne dividere il quantitativo di 64 KB o come una cache di 48 KB e 16 KB locali, o una cache da 16 KB e 48 KB locali.

Ritengo che ciò possa essere stato congegnato per consentire così al software di avere il controllo esplicito di una parte della cache, in quanto potrebbe enormemente semplificarne la programmazione, migliorandone le prestazioni e anche l'efficienza energetica della GPU stessa.

 

 

5) - Codice di Correzione di errore sia sulla memoria principale che su quella cache.

Ritengo che sia inutile spiegarne sia i concetti, i vantaggi e gli ambiti di applicazione nell'ottica di cui sopra.

 

 

6) - Formato di memoria realmente in virgola mobile a 16bit ed il supporto per i numeri de-normalizzati direttamente in hardware.

Questo consentirebbe di effettuare davvero tutti i calcoli in singola precisione.

 

 

 

7) - Spazio di indirizzi unificato

Nel passato le GPU avevano una varietà di diversi tipi di memorie (la memoria locale, la memoria grafica, e la memoria di sistema), ciascuna nel proprio spazio di indirizzamento. Questa tipologia di frazionamento rende problematico l'accesso a qualsiasi porzione di dati in memoria tramite i linguaggi di programmazione che si basano su puntatori come ad esempio C++, C e CUDA.

Fermi dovrebbe risolvere il problema di utilizzo di queste memorie separate (la memoria locale, la memoria grafica, e la memoria di sistema) raggruppandole in un unico spazio di indirizzamento a 64-bit, rendendo così molto più facile il compito di compilare ed eseguire programmi C, C++. facilitato anche dall'attivazione del meccanismo PTX in quanto, così come la cache, uno spazio unitario di indirizzi aumenta l'efficienza dei tipi di programmi che possono essere eseguiti ancora più efficeintemente sulle GPU.

 

 

8) - Fast Context Switching

Finora siamo stati abituati acché i coprocessori, come le GPU, abbiano ignorato il context switching (cambiamento di contesto), proprio perchè il loro obiettivo primario era si, quello di accelerare i programmi, ma semplicemente uno alla volta.

Con Fermi la situazione dovrebbe cambiare radicalmente, in quanto il context-switching ha frequenza di soltanto ~25 microsecondi,

accelerando così notevolmente il cambiamento del contesto.

Ciò starebbe a significare che in pratica si potrà ottenere una più efficiente utilizzazione in alcuni ambienti, in quanto questa feature consentirà ai programmi di essere eseguiti meglio e più velocemente rendendo possibile e consentendo ad un utilizzo kernel-indipendente di sovrapporre la propria esecuzione: a.e. lasciando che uno effettui dei calcoli mentre un altro inizi una comunicazione.

 

 

9) - Supporto al Debugging

Il supporto al debug nelle precedenti GPU faceva si che avvenisse il congelamento dell'intero stato della GPU stessa.

Avveniva infatti che per consentire al debugger in CPU di leggere e scrivere i registri del thread della GPU, lo stato del thread, e la memoria della GPU attraverso il collegamento tra la memoria di sistema e quella della GPU. Solamente dopo il debugger in CPU permetteva di riprendere regolarmente l'esecuzione del thread della GPU.

In FERMI tutto ciò dovrebbe avvenire direttamente in GPU ed il proprio debugger dovrebbe poter anche colloquiare con quello della CPU e quindi interagire finanche con le chiamate di sistema.

 

 

Attendo vostri riscontri di qualsiasi genere :)

Link to comment
Share on other sites

Volevo soffermarmi a fare delle riflessioni un pò oltre a quanto descritto finora, e vorrei che mi diceste ciò che ne pensate :)

 

 

Se pensiamo ed immaginiamo l'obiettivo che nVidia si è prefissato con Fermi essere esclusivamente o anche solo primariamente quello dell'ambito videoludico, ci stanno tutte le giuste riflessioni fatte finora, inerentemente gli eventuali errori, di valutazione e non, che fuori dubbio nVidia avrebbe commesso sinora se si conderano limitatamnte nell'ottica dell'intrattenimento di gioco.

 

Vi invito a riflettere sulle caratteristiche peculiari che questa nuova architettura dovrebbe mettere a disposizione, e lascerò quindi a voi le considerazioni su quale potrebbe essere il reale target di nVidia, che imo essendo peraltro di tutt'altra natura rispetto al semplice videogioco, potrebbe anche più facilmente spiegare la relativa mancanza di fretta o di impazienza finora palesata in questa situazione di palese (per noi) empasse, in quanto allo stato attuale, sarebbe in assoluta mancanza di un vero competitor.

 

 

 

1) - Un set di istruzioni completamente nuovo,

molto più simile all'architettura register/register RISC (detta anche load/store) in cui le istruzioni aritmetico-logiche lavorano solo sui registri, rendendo il codice più efficiente (dovuto primariamente alla lunghezza costante delle istruzioni) con molte istruzioni elementari, facilitando il compito delle pipeline e rendendo possibile un'esecuzione completamente parallela.

 

 

2) - Istruzioni di tipo Faster Atomic di supporto ai task

Istruzioni di questo tipo leggono da locazioni di memoria condivisa, ne controllano i valori e ne scrivono di nuovi senza che nessun altro processore sia capace di modificarne i relativi valori durante le singole esecuzioni. Questo permette ai task di comunicare gli uni con gli altri tramite degli opportuni bit o flag, come vogliamo chiamarli. La cache L2 di Fermi, dove questi valori verranno prevalentemente memorizzati, renderà una sensibile accelerazione supplementare.

 

 

3) - Spazio di indirizzamento virtuale a 64bit

Il PTX (Parallel Thread eXecution layer) permetterebbe a Fermi di cambiare dalla modalità di indirizzamento a 32bit a quella a 64bit senza una negativa e deleteria interruzione di tipo software.

 

 

4) - Caches

Fermi include una caratteristica interessante per ottenere più valore dalla cache L1, cioè quella di poterne dividere il quantitativo di 64 KB o come una cache di 48 KB e 16 KB locali, o una cache da 16 KB e 48 KB locali.

Ritengo che ciò possa essere stato congegnato per consentire così al software di avere il controllo esplicito di una parte della cache, in quanto potrebbe enormemente semplificarne la programmazione, migliorandone le prestazioni e anche l'efficienza energetica della GPU stessa.

 

 

5) - Codice di Correzione di errore sia sulla memoria principale che su quella cache.

Ritengo che sia inutile spiegarne sia i concetti, i vantaggi e gli ambiti di applicazione nell'ottica di cui sopra.

 

 

6) - Formato di memoria realmente in virgola mobile a 16bit ed il supporto per i numeri de-normalizzati direttamente in hardware.

Questo consentirebbe di effettuare davvero tutti i calcoli in singola precisione.

 

 

 

7) - Spazio di indirizzi unificato

Nel passato le GPU avevano una varietà di diversi tipi di memorie (la memoria locale, la memoria grafica, e la memoria di sistema), ciascuna nel proprio spazio di indirizzamento. Questa tipologia di frazionamento rende problematico l'accesso a qualsiasi porzione di dati in memoria tramite i linguaggi di programmazione che si basano su puntatori come ad esempio C++, C e CUDA.

Fermi dovrebbe risolvere il problema di utilizzo di queste memorie separate (la memoria locale, la memoria grafica, e la memoria di sistema) raggruppandole in un unico spazio di indirizzamento a 64-bit, rendendo così molto più facile il compito di compilare ed eseguire programmi C, C++. facilitato anche dall'attivazione del meccanismo PTX in quanto, così come la cache, uno spazio unitario di indirizzi aumenta l'efficienza dei tipi di programmi che possono essere eseguiti ancora più efficeintemente sulle GPU.

 

 

8) - Fast Context Switching

Finora siamo stati abituati acché i coprocessori, come le GPU, abbiano ignorato il context switching (cambiamento di contesto), proprio perchè il loro obiettivo primario era si, quello di accelerare i programmi, ma semplicemente uno alla volta.

Con Fermi la situazione dovrebbe cambiare radicalmente, in quanto il context-switching ha frequenza di soltanto ~25 microsecondi,

accelerando così notevolmente il cambiamento del contesto.

Ciò starebbe a significare che in pratica si potrà ottenere una più efficiente utilizzazione in alcuni ambienti, in quanto questa feature consentirà ai programmi di essere eseguiti meglio e più velocemente rendendo possibile e consentendo ad un utilizzo kernel-indipendente di sovrapporre la propria esecuzione: a.e. lasciando che uno effettui dei calcoli mentre un altro inizi una comunicazione.

 

 

9) - Supporto al Debugging

Il supporto al debug nelle precedenti GPU faceva si che avvenisse il congelamento dell'intero stato della GPU stessa.

Avveniva infatti che per consentire al debugger in CPU di leggere e scrivere i registri del thread della GPU, lo stato del thread, e la memoria della GPU attraverso il collegamento tra la memoria di sistema e quella della GPU. Solamente dopo il debugger in CPU permetteva di riprendere regolarmente l'esecuzione del thread della GPU.

In FERMI tutto ciò dovrebbe avvenire direttamente in GPU ed il proprio debugger dovrebbe poter anche colloquiare con quello della CPU e quindi interagire finanche con le chiamate di sistema.

 

 

Attendo vostri riscontri di qualsiasi genere :)

Sinceramente non saprei come risponderti ai punti da te elencati, ma sono sicuro che a questo penserà il nostro grande Stefano alias yossarian :asd:... però posso dirti che per il gpu computing ci sono le Tesla, mentre le Ge Force sono esclusivamente rivolte al mercato gaming. Allora secondo questa tesi quanto ho letto qualche mese fa su una rivista, ovvero che nVidia starebbe per abbandonare il settore gaming, sarebbe quasi confermato a questo punto... non sono fino a che punto ci sarebbe da star contenti di questa cosa, speriamo sia solo una boiata da giornalista....

Link to comment
Share on other sites

:asd: :asd:

Ma che ci fa, tanto stiamo bene qui (cmq non con molto dispiacere che Halduemilauno non viene mai toccato quando molte volte è lui stesso a generare flame...) :D

 

Cmq dicono che domani, se ho capito bene, dovrebbe esserci un evento, tipo nVidia Editor's Day... sapete mica di cosa si tratta e di cosa si parlerà??

 

evitiamo polemiche...

 

hal avrà il suo momento, e non sarà una semplice sospensione, apparte che ha perso credibilità

Link to comment
Share on other sites

incredibile ! 4% di resa produttiva e sono contenti ? :muro: Ma non era 40% ? non è che manca uno 0 ?

quindi con un wafer ci faranno solo qualche chip al posto di un centinaio ? impossibile costerebbe 1000€ a chip.

 

 

Ma questo fattore deve ripercuotersi per forza sui prezzi ? o c'è la possibilità che dato il ritardo possano usare strategie differenti e venderli a prezzi sui 350€ ?

 

 

Fatto stà però che anche se esce castrato questo non dovrebbe chiamarsi Gt360 e avere un prezzo non di punta ?

Edited by Achille GForce
Link to comment
Share on other sites

Nvidia holds clandestine Fermi briefing | TG Daily

The worst kept secret in Vegas is currently underway in the MGM Grand as Nvidia flew in a select group of hacks just as the rest of us journos jetted off home from the scintillating city of sin.

 

Only a secret elite group of media were privileged enough to get in on the Fermi fandango, which apparently delved deep into all things architectural.

 

Our secret sauces, however, didn't seem to think much of Nvidia’s organizational skills.

 

"There is no outline. We were basically told to show up," the source told TG Daily.

 

"It was all technical. But no clock speeds, power consumption or benchmarks were being shown…yet at least," the source confirmed at the time of writing.

 

"The deep dive is no longer deep," he added "Now we're just talking about developer relations and what TWIMTBP works."

 

"It is interesting actually," he conceded.

 

Interesting indeed. Wonder what else will leak out of todays secret briefing, eh Nvidia?

 

 

 

TechConnect Magazine - Nvidia GF100 to be displayed at PDXLAN 15

 

After showing up at CES 2010 for its first pre-preview, Nvidia's first Fermi-based consumer product, the GF100, is now set to make an appearance at PDXLAN 15, a LAN party which is held between January 15 and the 18th. At the even there will be several GF100-equipped systems showcased and maybe more info about the card will be provided (fingers crossed)

 

Nvidia Club SLI members attending PDXLAN 15 will have the chance to win a GF100 card in a contest where participants will have to show, in an original way, how excited they are about GF100. The lucky winner will have to wait until the card become available (in March) to get it but it should be worth the wait.

Link to comment
Share on other sites

quindi fra il 15 e il 18 potrebbe debuttare ? ad un lanparty ? bè un idea originale :angel:

speriamo che ci faccinao girare crysis :asd:

 

 

Yonariass senti una domanda ma come fai a dire che un tesla in versione geforce con le freqeunze che ha non compete con 5870 ? non dovrebbe rappresentare pur sempre una GT360 con quelle caratteristiche? Magari considerando le rops e tmu mancanti in tesla, attivati in geforce e ovviamente la GDDR5 non ecc ad alta freqeunza.

 

 

se per la GT380 originale volevano 1.7Ghz per gli shader e 650Mhz di GPU, le freqeunze del modello di punta tesla 1.4Ghz / 600Mhz potrebbe essere ottime per una eventuale GT360 no ?

Link to comment
Share on other sites

 

Nvidia Club SLI members attending PDXLAN 15 will have the chance to win a GF100 card in a contest where participants will have to show, in an original way, how excited they are about GF100. The lucky winner will have to wait until the card become available (in March) to get it but it should be worth the wait.

 

Ma daiii! Cos'è istigamento a diventare fanboy? :muro:

Link to comment
Share on other sites

incredibile ! 4% di resa produttiva e sono contenti ? :muro: Ma non era 40% ? non è che manca uno 0 ?

quindi con un wafer ci faranno solo qualche chip al posto di un centinaio ? impossibile costerebbe 1000€ a chip.

 

 

Ma questo fattore deve ripercuotersi per forza sui prezzi ? o c'è la possibilità che dato il ritardo possano usare strategie differenti e venderli a prezzi sui 350€ ?

 

 

Fatto stà però che anche se esce castrato questo non dovrebbe chiamarsi Gt360 e avere un prezzo non di punta ?

 

in effetti c'è qualcosa che non va, una resa del 4% significa un disastro altro che contenti e felici.....

Link to comment
Share on other sites

qualcuno non ha ben capito la differenza tra four e fourty :asd:

 

bè sono di THG figurati :asd:

 

4% vuol dire che su 100 chip prodotti 96 sono da buttare, e vedendo le domensioni di fermi dubito che producano moltissimi chip con un wafer, sarebbe da dividere il costo per un intero wafer per quei pochi chi fattie ogni chip costerebbe il 2500% ( 25 volte ) rispetto all'aspettativa ottimale WOW, quindi se fermi in previsione ottimale costasse 100$ a chip con una resa così costerebbe 2500$ solo la GPU LOL ! da suicidio, se fosse vero non è possibile che il progetto vada avanti, si fermerebbero di sicuro. Io comunque sapevo che era 40% e non 4, il che quadrerebbe tutto, infatti hanno detto che la resa è simile alle 5800 e sono felici quindi penso sia così.

Edited by Achille GForce
Link to comment
Share on other sites

Guest
This topic is now closed to further replies.

×
×
  • Create New...