Jump to content

[Thread Ufficiale] AMD Zacate/Ontario - Aspettando Bulldozer


capitan_crasy

Recommended Posts

[Thread Ufficiale]

AMD Zacate/Ontario

i76178_apu-ontario.jpg

 

Aspettando

AMD Bulldozer

20100528222213_Logo_bulldozer01.jpg

20100901232527_BulldozerOrochi.jpg

 

 

Premessa.

Questo Thread ha lo scopo primario di raccogliere notizie e indiscrezioni sulle nuove/attuali CPU con architettura Bulldozer e le APU Zacate/Ontario.

Per cercare di avere ordine il thread sarà diviso in 6 pagine ognuna dedicata dal riassunto di uno specifico argomento.

Il thread ufficiale delle APU Llano, Trinity e Krishna/Wichita si trova QUI!

 

Regolamento

 

* non sono ammessi notizie o commenti sull'andamento finanziario ( compreso i titoli quotati in borsa ) o di mercato da parte di AMD e/o Intel.

* non sono ammessi commenti catastrofici o comunque in grado di generare FLAME

* non sono graditi commenti stile Fanboy sia da parte AMD sia da parte Intel

* non sono ammessi post stile "consigli per gli acquisti"; in pratica niente consigli o suggerimenti per la scelta di un nuovo hardware

* non sono ammessi discussioni sulle CPU K8/K9 Athlon64/X2

* Le discussioni sull'architettura AMD K10/Intel Sandy Bridge/Intel Nehalem sarà consentita solo per confronti diretti o di paragone sulle prestazioni o differenze architetturali

* Cerchiamo di limitare al minimo gli argomenti OT, se proprio non ce la fate comunicate attraverso i messaggi privati

 

 

Prima Pagina:

Premessa, indice e regolamento del Thread

 

 

Seconda Pagina

Caratteristiche Architettura AMD Bulldozer

 

 

Terza Pagina

Caratteristiche Tecnologia AMD Zacate/Ontario (Llano/Bobcat)

 

 

Quarta Pagina

Notizie dalla rete

 

 

Quinta Pagina

Rumors e approfondimenti su Bulldozer/Fusion

 

 

Sesta Pagina

FAQ e le possibile date di uscita

Edited by capitan_crasy
Link to comment
Share on other sites



  • Replies 473
  • Created
  • Last Reply

Top Posters In This Topic

Caratteristiche Architettura AMD Bulldozer

 

Nuova architettura CPU di AMD, la quale andrà a sostituire l'attuale Tecnologia "Hammer" dove si basano gli attuali K8/K9/K10.

 

Un po di storia

 

L'architettura Bulldozer è stata progettata completamente da zero, a differenza di quanto avvenuto con Barcelona e Shanghai che rappresentano evoluzioni dell'architettura K8.

L'annuncio fu dato prima ancora che il K10 fosse presentato ufficialmente, ma questo non era una assoluta novità per AMD.

Il progetto originario del primo Bulldozer prevedeva una CPU a 4/6 core sul processo produttivo a 45nm SOI con supporto alle SSE5.

L'uscita prevista era stata annunciata per fine 2009 dallo stesso neo CEO AMD Dirk Meyer e il suo concorrente diretto era l'architettura Nehalem di Intel.

Purtroppo dopo i primi risultati da laboratorio sui primi sample, AMD decise la cancellazione della versione a 45nm SOI per passare direttamente al processo produttivo a 32nm SOI con importanti cambi architetturali, quali l'abbandono delle istruzioni SSE5 e l'adozione delle AVX di Intel.

Non sapremo mai cosa andò storto, tuttavia la tecnologia low-k presente del Six core K10 AMD è cugina del lavoro svolto su Bulldozer a 45nm SOI.

 

Bulldozer in dettaglio

 

L'architettura Bulldozer prevede due core per elaborazioni Integer, affiancati da un'unità Floating Point che è condivisa.

La scelta di AMD è quella di raddoppiare la sola parte Integer delle proprie CPU, lasciando condivisa quella Floating Point, dato che la maggior parte del calcolo riguarda proprio le unità Integer (in media per l'80%). Questo tipo di filosofia architetturale ha l'obbiettivo di ottenere il miglior rapporto tra prestazioni e consumo duplicando la parte Integer, massimizzando quindi il parallelismo delle operazioni e lasciando unificata un'unità in virgola mobile la quale avrà al suo attivo una notevole potenza di calcolo.

Le caratteristiche della Floating Point per ogni modulo Bulldozer prevede due unità Multiply and Accumulate a 128 bit, a monte delle quali troviamo anche uno scheduler in virgola mobile; mentre per quanto riguarda le ISA sono supportate tutte le principali istruzioni (tranne le 3DNow) quali SSE3, SSE 4.1 and 4.2, AVX, AES, FMA4, XOP, PCLMULQDQ.

La principale novità sono le istruzioni AVX (Advanced Vector eXtensions) a 256bit; lo sfruttamento di queste istruzioni verrà compiuto da Bulldozer mettendo in parallelo le due unità Floating Point a 128bit la quale, dal tipo di applicazione in esecuzione, possono essere configurate anche come 4x64bit, 2x128bit e 1x256bit.

Altra novità importante e il nuovo decoder a 4 vie, completamente ridisegnato rispetto al tradizionale 3 vie adottato da AMD nelle ultime precedenti architetture (al K7 in su); la conseguenza diretta e che ora si può unire istruzioni branch x86 aumentando l'ampiezza del decoder.

Sono anche presenti 3 distinti scheduler divise per le due unità Integer e uno per il Floating Point.

Ogni unità Integer è dotata di una cache L1 per i dati da 16KB, valore inferiore ai 64KB integrati per ogni core nell'architettura K10, a monte dell'unità di fetch troviamo una seconda cache L1 da 64KB a 2 vie per istruzioni.

AMD, rispetto al K10, ha allungato la pipeline interna alle unità di calcolo Integer in modo da ottenere frequenze di clock più elevate rispetto alle sue "vecchie" architetture.

La scelta di questa soluzione però potrebbe provocare un eccessiva dipendenza dalle unità di branch prediction; AMD quindi ha integrato il Branch Prediction e il Fetch Logic facendoli operare in modo indipendente l'una dall'altra, evitando spiacevoli situazioni di stallo quando una di queste si arresti per un qualsiasi motivo. Un'unità di prefetch così aggressiva accoppiata a una pipeline più lunga, richiedono maggiori prestazioni (in termini di banda) per quanto riguarda il memory controller integrato; per il momento AMD non ha rilasciato le caratteristiche di questo componente, anche se ha confermato il suo totale ridisegno per fruttare al massimo la banda messa a disposizione dalle memorie RAM DDR3.

Non si conosce quali frequenze possa gestire il controller RAM, tuttavia è ipotizzabile che possa adottare configurazioni superiori agli attuali Dual channer presenti nei controller Ram dei K10.

La quantità della cache L2 (16 vie) dovrebbe essere da 2MB (valore non confermato ufficialmente da AMD) la quale sarà unificata tra i 2 core per modulo; ci sarà una anche una cache L3 verosimilmenteda 8MB (valore non confermato ufficialmente da AMD) condivisa anch'essa da tutti i moduli/core.

AMD con Bulldozer, al contrario di Intel con la tecnologia HyperThreading o l'SMT (Simultaneous Multi Threading) che esegue per ogni core due threads in parallelo, ha scelto di integrare due unità di calcolo Integer complete affiancate da una complessa unità in virgola mobile che è condivisa.

 

 

20100824120034_bulldozerthreads.jpg

 

 

Bulldozer di fatto integra due core che condividono le risorse di elaborazione in virgola mobile, avendo pipeline dedicate per quelle Integer

AMD ha scelto la via della condivisione delle risorse, creata in modo tale da ottimizzare le prestazioni al consumo massimo ottenibile; non a caso si prevede che la presenza della sola seconda unità di calcolo Integer all'interno di ogni modulo Bulldozer, implichi un incremento della superficie complessiva del chip pari al 12%, valore particolarmente contenuto considerando il boost prestazionale ottenibile.

Sul capitolo consumi Bulldozer con i suoi moduli, potrà gestire dinamicamente e indipendentemente l'uno dall'altro il Vcore e frequenza di clock, anche se questo non può essere fatto per singolo core ma solo per coppia di core legato comunque al modulo Bulldozer.

Novità in vista anche per il Turbo Core AMD, introdotto con i K10 step E, la quale si dovrebbe avvicinare molto a quella Turbo Boost introdotta da Intel con le CPU della famiglia Nehalem.

Il socket AM3r2 o AM3+

 

AMD ha confermato l'uscita di un (nuovo?) socket chiamato molto genericamente AM3r2 o AM3+.

Al momento ci sono poche informazioni ma quello sicuro è che le CPU Bulldozer non saranno compatibili con gli attuali e future schede madri socket AM3.

La causa è da imputare ad un cambio radicale legate alla circuiteria di alimentazione; la stessa AMD ha dichiarato che adattare Bulldozer sugli attuali socket AM3 avrebbe portato ad un aumento dei costi finali e la impossibilità di utilizzare tutte le nuove caratteristiche della nuova architettura limitando eccessivamente le prestazioni finali.

Resta da confermare la compatibilità dei socket AM3+ sulle attuali CPU K10 socket AM3 attualmente presenti sul mercato.

 

Piattaforma AMD "Scorpius"

 

Con l'uscita delle CPU Bulldozer AMD presenterà una nuova piattaforma chiamata "Scorpius", la quale sarà composta da nuovi chipset AMD serie 900 modello 990FX, 990X (Crossfire ready) e 970.

Ci saranno anche dei nuovi southbridge serie 900, in particolare il modello Hudson D3 sarà in grado di supportare 4 porte USB 3.0 senza l'aiuto di chip esterni.

 

 

20100824115453_buildingbulldozer.jpg

 

 

Le prime soluzioni della famiglia Bulldozer sono attese al debutto nella prima parte del 2011 e saranno costruite da GlobalFoundries con il processo produttivo a 32nm SOI.

Le prime cpu della famiglia Bulldozer che vedremo sul mercato con tutta probabilità saranno quelle della famiglia Opteron, con versioni a 12 core e a 16 core.

Le versioni desktop della famiglia Zambezi sono attesi subito dopo con modelli 4/(forse)6 e 8 core.

AMD ha comunicato che Bulldozer sarà pronto nella prima parte del 2011.

 

 

20091007115145_20091007amd_roadmap.jpg

Edited by capitan_crasy
Link to comment
Share on other sites

 

Perchè integrare CPU e GPU in un unico elemento

 

Integrazione tra GPU e CPU: è questa la principale evoluzione tecnologica che AMD e ATI si aspettano di presentare al mercato nei prossimi 2 anni. Il nome scelto per i prodotti che integreranno GPU e CPU è quello di Fusion, che ben simboleggia l'unione tra architetture sulla carta e di fatto molto differenti tra di loro. La risultante saranno una serie di prodotti sviluppati per svariati ambiti di impiego, nei quali quindi la combinazione tra parte CPU classica e parte GPU assumerà pesi differenti tra di loro.

 

Per quale motivo si vuole giungere a fornire soluzioni che integrino al proprio interno una GPU? La principale giustificazione è legata all'elevata potenza elaborativa di cui sono capaci le GPU, in termini di Gflops, rispetto a quanto accessibile con una CPU. Merito di questo risultato è l'innata capacità delle GPU di eseguire un gran numero di elaborazioni parallele, richieste per la generazione delle scene 3D. Sfruttando un'analogia, una CPU opera come un aereo da combattimento, estremamente veloce ma in grado di trasportare solo due persone contemporaneamente; una GPU è invece paragonabile ad un aereo di linea, meno veloce in assoluto ma capace di trasportare molte più persone e quindi di svolgere complessivamente più lavoro.

 

Le GPU hanno una potenza di elaborazione massima teorica estremamente elevata, sintetizzata dai Gflops che possono processare; si tratta tuttavia di una capacità per molti versi vincolata, che può essere sfruttata solo con quelle applicazioni che richiedono l'elaborazione di un elevato numero di dati in parallelo. Per questo motivo gli ambiti di utilizzo delle GPU in elaborazioni non grafiche di calcolo generale, o più semplicemente GP-GPU, sono limitati ad alcune tipologie di elaborazione; è evidente come nel corso dei prossimi anni gli sviluppatori software, grazie all'introduzione delle OpenCL e anche alla disponibilità di GPU sempre più complesse oltre che potenti e estremamente programmabili, potranno operare ad una nuova tipologia di software dove la GPU si prenda in carico i calcoli più pesanti in modo da eseguire operazioni in minor tempo possibile.

 

 

amd_ati_cto_2.gif

 

 

Un pò di storia

 

In un intervista al vice presidente esecutivo AMD Henri Richard vengono svelati alcuni dettagli sulla tecnologia AMD Fusion.

"Penso che "Fusion" sia un processo evolutivo, piuttosto che una fusione"

In poche parole AMD pensa a questo progetto come un vero e proprio processo evolutivo delle attuali CPU.

 

Il primo tentativo in assoluto fu la creazione di un Dual core nativo K10 senza cache L3 a 45nm SOI la quale sarebbe stato accoppiato sullo stesso package una IGP della serie RV620 (cioè la stessa degli attuali chipset AMD 785G/880G) costruita a 55nm bulk; lo stile costruttivo era lo stesso dei processori Intel core Clarkdale.

Il progetto fu accantonato per problemi logistici legati alle differenti tecnologie costruttive dei due chip principali (CPU IBM SOI e GPU TSMC bulk); così il primo progetto Fusion fu cancellalo ma AMD come eredità rilasciò sul mercato il K10 Dual core nativo con il nome di Athlon2 core Regor.

 

APU Llano: il futuro di AMD!

 

AMD passò quindi allo scenario più complesso cioè un unico componente di silicio nel quale i transistor della parte CPU sono integrati con quelli della parte GPU e viceversa con tecnologia costruttiva a 32nm SOI.

 

APU (Accelerated Processing Unit) Llano sarà composto da core X86 derivanti dall'architettura K10 e una GPU DX11 costruiti e prodotti entrambi a 32nm con tecnologia SOI; questa soluzione rappresenterà la prima GPU ATI costruita con la tecnologia SOI di IBM.

Ciascuno dei core x86 implementati nella APU avrà una superficie complessive molto contenuta, pari a 9,69 millimetri quadrati, per un totale di poco più di 35 milioni di transistor; da questo conteggio è esclusa la cache L2 da 1 Mbyte, indipendente per ciascuno dei core. AMD dichiara un range di consumo variabile da un minimo di 2,5 Watt sino a 25 Watt per ciascuno dei core: questo significa, con tutta probabilità, che sarà possibile vedere sul mercato versioni di APU con valori di TDP molto diversi tra loro.

Per questi core AMD dichiara frequenze di clock uguali o superiori ai 3 GHz, con tensioni di alimentazione variabili da 0,8V a 1.3V a seconda della frequenza e del risparmio energetico.

Per le prime soluzioni Fusion AMD ha ripreso un core con architettura K10, ottimizzandone il funzionamento in contesti nei quali il contenimento dei consumi sia di primaria importanza e facendo in modo che core x86 e la GPU possano condividere lo stesso controller RAM.

Più avanti AMD utilizzerà l'architettura Bulldozer per le future soluzioni APU; questo avverrà, con tutta probabilità con il passaggio al processo produttivo a 22nm SOI previsto per il 2013.

 

Piattaforma AMD "Linx"

 

 

th_20091113192852_ScreenHunter_110.jpg

 

 

A partire dal 2011 AMD, per il mercato mainstream, presenterà la piattaforma "Linx" dove ci saranno le prime APU basate sulla tecnologia FUSION.

La APU sarà basata su 4 core X86-x64 AMD derivanti dall'architettura "Stars" o più comunemente chiamata K10; il modello di riferimento è il core Propus, naturalmente riveduto e corretto grazie anche al processo produttivo a 32nm SOI.

Llano avrà una cache L2 da 1MB per core X86, mentre la cache L3 sarà assente.

La GPU integrata nello stesso pezzo di silicio, dovrebbe avere 400/480 stream processors divisi in 6 SIMD engines con una capacità di calcolo massima classe; questa modello di APU avrà circa un 1 miliardo di transistor. "Gigaflops"; CPU e GPU condivideranno lo stesso controller di memoria DDR3 con una frequenza massima ipotizzabile massima di 1600/1866Mhz.

La nuova APU non avrà bisogno di alcun chipset o Northbridge tradizionale in quanto tale elemento sarà integrato; per quanto riguarda il Southbridge AMD presenterà la nuova serie SB900; in particolare la versione Hudson M/D3 sarà il prima a supportare lo standard USB 3.0.

 

 

th_20091111183737_ScreenHunter_116.jpg

 

 

Piattaforma AMD "Sabrine"

 

 

th_20091113193241_ScreenHunter_113.jpg

 

 

Per il mercato Mobile AMD presenterà la piattaforma "Sabine".

La APU "Llano" in versione mobile sarà presumibilmente uguale alla versione Desktop, quindi con 4 core X86-x64 AMD K10 con L2 da 1MB senza cache L3; la GPU dovrebbe avere circa 400/480 stream processors con una capacità di calcolo massima classe "Gigaflops"; CPU e GPU condivideranno lo stesso controller di memoria DDR3.

Anche in questo caso la APU non avrà bisogno di alcun chipset o Northbridge tradizionale in quanto tale elemento sarà integrato; per quanto riguarda il Southbridge AMD presenterà la nuova serie SB900 la quale la versione Hudson M/D3 sarà il prima a supportare lo standard USB 3.0.

 

 

Architettura "Bobcat"

 

 

 

slide_12.jpg

 

 

Abbiamo visto come AMD per Llano abbia adattato una GPU ATI costruita con tecnologia bulk alla tecnologia SOI di IBM; per quest'altra APU AMD ha studiato il processo inverso.

In pratica ha adattato dei core X86 AMD utilizzando tecnologia produttiva bulk wafer TSMC con lo scopo di creare una CPU senza la tecnologia SOI di IBM, in modo da adattare i due componenti (CPU AMD e GPU ATI) in un unica catena produttiva.

Tale soluzione verrà utilizzata per la piattaforma "Brazus", composta da un APU con core X86 derivanti da una nuova architettura denominata "Bobcat" e una GPU DX11, costruiti entrambi con silicio 40nm bulk provenienti dalla fonderia TSMC; questa nuova soluzione andrà nello stesso mercato delle CPU ATOM di Intel.

 

"Bobcat" è il nome dell'architettura X86 studiata per i sistemi a basso consumo, dove attualmente vede le CPU Atom come leader.

Il primo elemento distintivo dell'architettura Bobcat è la possibilità di operare con un livello di consumo inferiore a 1 Watt con alcune specifiche versioni

A differenza di Atom, Bobcat è un architettura di tipo out of order, comune alla maggior parte dei moderni processori x86, questa soluzione permette di ottenere migliori prestazioni grazie alla possibilità del processore di riorganizzare le istruzioni in modo tale che la loro esecuzione sia la più efficiente possibile in termini di prestazioni velocistiche.

L'altra faccia della medaglia è un certo dazio da pagare in termini di consumi massimi; tuttavia Bobcat dovrebbe essere l'ideale tra consumi, ridotte dimensioni e potenza elaborativa di una cpu x86 moderna.

 

L'architettura di Bobcat utilizza un design Dual issue, con due pipeline a 15 fasi contro le 16 fasi nell'architettura Atom.

L'ago delle prestazioni rimane a favore di Bobcat grazie al design out of order, la quale permetterà di avere livelli prestazionali, a parità di clock, ben più elevati delle soluzioni Atom su applicazioni single threaded; Bobcat supporta i set di istruzioni SSE sino alla release 3 comprese le tecnologie di virtualizzazione.

Per quanto riguarda la cache L1 sarà in due blocchi da 32KB ciascuno, rispettivamente per dati e istruzioni, del tipo associativa a 8 vie con latenza di 3 cicli di clock.

La cache L2 sarà di 512KB a 16 vie, con latenza di 17 cicli di clock.

I core X86 di Bobcat verrà utilizzato nelle prime soluzioni APU della famiglia Fusion, la GPU dovrebbe avere circa 80 stream processors cioè paragonabile più o meno alla GPU HD5450; anche in questo caso CPU e GPU condivideranno lo stesso controller di memoria DDR3.

Per economizzare al massimo i consumi AMD ha implementato le tecnologie clock gating, power gating e states di tipo low power; quest'ultimo consente di abbassare al massimo il livello di consumo in idle.

A completare le funzionalità una serie di innovazioni micro architetturali che riducono al minimo i trasferimenti di dati interni al chip, oltre a ridurre il numero di loro letture allo stretto indispensabile.

 

AMD non ha fornito informazioni ufficiali sul memory controller DDR3, tuttavia alcune voci parlano di un supporto massimo alle DDR3 1333Mhz a basso consumo; il controller RAM verrà condiviso tra i core X86 e GPU.

Bobcat troverà spazio nelle soluzioni APU Ontario, costruite con tecnologia produttiva a 40nm bulk prodotto da TSMC.

L'uscita di Ontario è prevista per i primi mesi del 2011.

 

Piattaforma "Brazos"

 

 

th_20091113193241_ScreenHunter_113.jpg

 

 

Attesa per il 2011 la piattaforma "Brazos" sarà composto da CPU con core "Ontario" costituito dall'architettura X86 "Bobcat" in configurazione single/dual core e una GPU DX11; il valore TDP può variare tra i 9W e i 18W a secondo dei modelli.

Ci sarà anche una versione desktop a basso consumo chiamata “Zacate” la qualè riprende tutte le caratteristiche sia di TDP sia di core, GPU della piattaforma Brazos core Ontario.

Entrambi le piattaforme avranno dei nuovi Southbridge serie SB900 modello Hudson M/D1 la quale potranno gestire porte SATA3 ma NON le USB 3.0.

 

 

 

Modelli attualmente in commercio!

 

?E-Series Socket FT1?

40nm Bulk

Core Zacate

GPU DX11

Step ??

cache L2 512KB x 2

Memoria supportata

Single channel DDR3/DDR3L-800-1066-1333Mhz

 

?AMD E-350 Dual core/HD6310

Frequenza di clock

1.60GHz

Numero Stream processor GPU

80 (40+40)

Frequenza di clock GPU

500Mhz

TDP

18W

 

?AMD E-250 Single core/HD6310

Frequenza di clock

1.50GHz

Numero Stream processor GPU

80 (40+40)

Frequenza di clock GPU

500Mhz

TDP

18W

 

 

?C-Series Socket FT1?

40nm Bulk

Core Ontario

GPU DX11

cache L2 512KB x 2

Memoria supportata

Single channel DDR3/DDR3L-800-1066-1333Mhz

 

?AMD C-50 Dual core/HD6250

Frequenza di clock

1.00GHz

Numero Stream processor GPU

80 (40+40)

Frequenza di clock GPU

280Mhz

TDP

9W

 

?AMD C-30 Single core/HD6250

Frequenza di clock

1.20GHz

Numero Stream processor GPU

80 (40+40)

Frequenza di clock GPU

280Mhz

TDP

9W

Edited by capitan_crasy
Link to comment
Share on other sites

Bulldozer/Llano/Bobcat: le notizie più importanti!

 

 

 

14.10.2010

Global Foundries: inizio sviluppo 22nm nel terzo trimestre 2012!

Clicca qui...

 

15.10.2010

Meyer: Llano in produzione nella prima parte del 2011!

Clicca qui...

 

In arrivo soluzioni mini-ITX per la piattaforma Zacate?

Clicca qui...

 

19.10.2010

AMD mostra per la prima volta un demo di Llano!

Clicca qui...

 

27.10.2010

Socket AM3+ anche con chipset serie 800?

Clicca qui...

 

04.11.2010

Le dimensioni di Llano sul Wafer!

Clicca qui...

 

05.11.2010

Produzione in volumi di Zambezi entro Aprile 2011?

Clicca qui...

 

06.11.2010

Confermato il posticipo: Llano Beavercreek, Winterpark solo a Luglio 2011!

Clicca qui...

 

09.11.2010

AMD mostra le caratteristiche di Zacate e Ontario!

Clicca qui...

 

AMD Kodiak: Piattaforma professionare con Bulldozer compatibile con CPU socket AM3!

Clicca qui...

 

16.11.2010

APU Zacate: i primi bench ufficiali!

Clicca qui...

 

17.11.2010

Zacate Fine Q4 2010, Zambezi Q2 2011, Llano Q3 2011?

Clicca qui...

 

19.11.2010

AMD sceglie GlobalFoundries per le APU Krishna/Wichita 28nm bulk HKMG!

Clicca qui...

 

22.11.2010

Nuove informazioni sui chipset AMD serie 900!

Clicca qui...

 

ISSCC 2011: Nuovi dettagli sull'architettura Bulldozer!

Clicca qui...

 

23.11.2010

Roadmap piattaforme AMD 2011: Turbocore 2.0 anche per Llano!

Clicca qui...

Edited by capitan_crasy
Link to comment
Share on other sites

Vorrei ringraziane l'immenso bjt2 per il suo contributo!

:king:

 

 

Core Llano con istruzioni Intel AVX a 256Bit???

 

th_20100422223419_AMD-LLano-analysis.jpg

 

Clicca qui...

 

 

Il caro Dresdenboy si prende una settimana di "riposo", ma prima ci lascia un post sul suo blog MOOOOOOLTO interessante:

 

A quick round of links - Patent based research regarding AMD's future MPUs

 

La cosa più interessante è la seguente:

 

Thuban e company hanno una pipeline di 22 FO4 (non 24, sorry). Mentre Bulldozer ha una pipeline di 17 FO4. Quindi una pipeline del 30% più veloce. Questo vuol dire che a parità di processo (quindi anche se buldozer fosse fatto con il 45nm low-k liscio di adesso), potrebbe andare fino al 30% più veloce in clock. Considerando il nuovo processo, questo significa frequenze MOLTO alte. Ricordo che il FO4 del Pentium 4 è stimato in 16. Quindi possiamo aspettarci anche frequenze dell'ordine del 5GHz (almeno in turbo mode)...

 

Facciamo 2 conti per un ipotetico bulldozer X6. Un X6 Phenom II attuale va a 3.2GHz. +30% per la pipeline più lunga, +40% per il processo più parco, sono 5.8 GHz. Ora non credo che arriveremo a tanto perchè penso che AMD faccia i transistors più piccoli (e quindi più lenti) per occupare meno area e comunque con una pipeline del 30% più veloce non si va il 30% più su di clock perchè i tempi di ritardo tra i vari stadi non migliorano e quindi una pipeline così corta garantisce un 15, massimo 20% in più. Questo per dire che un clock stock di oltre 4GHz come X6 e forse anche come X8 lo si può sperare...

 

Il FO4 è una misura della complessità dello stadio della pipeline. Fissata la pipeline, la complessità è data. Poi si può implementarla a 130, 90, 65, 45, 32nm ecc... A seconda del processo, sarà maggiore la frequenza a cui potrà andare... Non esiste un limite intrinseco al clock dato un processo, o meglio, esiste un limite intrinseco dato un FO4 di una architettura. La combinazione di FO4 e processo da la velocità.

 

Per esempio. Il Power 7 ha un FO4 di 17 (mi pare) ed è stato implementato con il 45nm, mi pare con il Low-k. Ora quel processore ha una caterva di transisors. Il quadcore arriva a 4.14 GHz e l'octacore a 3.96 Ghz... Un ipotetico bulldozer X4 fatto a 45nm (il processo del Thuban) sarebbe arrivato a 4.2-4.3 stock, minimo, sia perchè il Power 7 ha molti più transistors e molte più unità attive (un quad core ha 16 thread, e ogni core ha mi pare 12 unità di esecuzione), sia perchè il Power 7 è una CPU server e tradizionalmente queste hanno qualche centinaia di MHz in meno delle controparti desktop...

 

EDIT: in ogni caso, nel caso peggiore, un buldozer X4 a 4.1 Ghz e un Bulldozer X8 a 3.9 Ghz è fattibile visto il Power 7, anche con questo 45nm Low-k. Ricordiamo che IBM usa lo stesso processo di GF/AMD...

 

EDIT: Su wikipedia dice che esiste una versione quadcore da 4.25 Ghz. Il Power6 che aveva un FO4 di 13 arrivava a 5GHz e IBM aveva in laboratorio un prototipo funzionante a 6GHz...

 

EDIT: sto leggendo su google gruppi che tra Thuban e Buldozer, c'è un progetto cancellato che aveva un FO4 di 13... Sarebbe arrivato a 5GHz con il 45nm! Dice anche che BD dovrebbe avere un IPC (A PARITA' DI FREQUENZA) del 20-25% in più. Il tizio sembra essere un ex dipendente AMD che ha lavorato al progetto... Il gruppo in guestione è Bulldozer on Slashdot - comp.arch | Google Groups e il tipo si chiama Mitch_qualcosa...

 

Sandy Bridge Vs Bulldozer:

il confronto di bjt2

 

 

Allora... Per smorzare un po' i toni e per chiarire una volta per tutte parliamo del confronto Sandy bridge core vs Bulldozer module.

 

2 thread vs 2 thread. Poi vediamo un confronto alla buona 1 thread vs 1 thread considerando metà delle risorse condivise.

 

Decodifica istruzioni:

Un core SB può decodificare al massimo 3 istruzioni semplici e una complessa oppure una sola microcodificata alla velocità di 3 uop per ciclo, questo per ciclo di clock e per un dato thread, mentre un core BD può decodificare un qualsiasi mix di istruzioni semplici o moderatamente complesse (2 mops) purchè non si superi le 4 mops per ciclo, oppure una microcodificata alla velocità di 4 mop per ciclo, tutto questo per ciclo e per thread. Anche ammettendo che le uop intel siano equipotenti alle mops AMD, qui c'è un chiaro vantaggio AMD (ancora maggiore se si pensa che le MOP amd ammettono fino a 3 ingressi e una uscita, vedi FMAC, mentre quelle INTEL max 2 ingressi e una uscita, da cui le FMA3). Se il mix di istruzioni non è del tipo complessa+3 semplici, il decoder INTEL perde MOLTISSIMO in prestazioni. Per fortuna che un compilatore decentemente inteligente riordina le istruzioni quando possibile, ma il rischio ovviamente c'è... Però per compensare, SB usa una cache delle microoperazioni che può sparare fino a 18 uop/ciclo... Non si sa se anche BD la usa. E i branch prediction sono stati migliorati sia in SB che BD e non si sa quale sia meglio. L'approccio del BD con le code degli IP predetti è però interessante...

 

Dispatch:

Qui dovrebbe avvenire il micro/macro op fusion. Entrambe le architetture possono fare il dispatch di 4 uops/mops. L'architettura INTEL può fare una uop fusion per ciclo, arrivando a 5. Anche BD può fare la uop fusion, ma non si sa se una o più di una e in che casi. Comunque considerando le MOP e le uop equivalenti in potenza (anche se non è vero), siamo in situazione di parità.

 

ROB:

Qui INTEL ha un enorme ROB che deve dare spazio a due thread (160 uop). AMD ha 2 ROB (da 128 mops l'uno) per il fatto che i due cores sono fisicamente separati. Qui giacciono le istruzioni in attesa di esecuzione o di ritiro.

 

Scheduler:

Qui le differenze si fanno interessanti. AMD separa INT e FP. Ha 2x40 mops intere/memoria più 60 mops FP, condivise tra i due thread. INTEL ha un unico calderone di soli 54 elementi condivisi tra interi, memoria FP e per di più di entrambi i thread. E' inutile dire chi ha le potenzialità maggiori...

 

Esecuzione:

INTEL ha 6 porte dove sparare le micro ops. Quindi può sparare 6 uop per ogni ciclo di clock, condiviso tra due thread. 3 porte sono dedicate alla memoria: 2 per le 2 AGU e una per gli store. 3 porte sono per le operazioni. Badate bene: le 3 porte residue sono CONDIVISE tra operazioni INT e SIMD/FP di ENTRAMBI i thread. Ossia in ogni ciclo si possono al massimo fare 3 operazioni tra INT e FP/SIMD.

AMD può, per ogni ciclo di clock e per 2 thread, sparare: 4 istruzioni FP (di entrambi i thread), 4 AGU/memoria (2 per thread max) e 4 ALU/intere (2 per thread MAX).

Considerando che anche un codice fortemente FP comunque contiene istruzioni per i loop, salti, confronti, insomma contiene istruzioni INTERE che su INTEL si contendono le 3 porte (per di più i thread sono 2!) mentre su AMD corrono su binari separati. Solo le istruzioni per la memoria hanno binari separati. Ma questo anche in AMD. Ecco che il potenziale AMD è maggiore.

 

Memoria:

Su SB si possono fare 2 letture a 128 bit e una scrittura a 128 bit per ciclo. Poichè però la cache L1 ha solo 2 porte, questo può essere fatto per breve tempo. E comunque queste 3 operazioni devono essere condivise tra i due threads.

Su BD, invece, ogni thread ha la sua cache L1, le sue 2 porte, le sue due letture a 128 bit e scrittura a 128 bit, le sue code di lettura e scrittura e le sue AGU. Inutile dire chi vince in questo caso.

E' vero che SB può fare fino a 3 operazioni FP a 256 bit per ciclo (1 add, 1 mul e una shuffle), ma può farlo per molto? No.

 

Retirement:

Qui siamo 4 a 4, ma sempre presupponendo che le mops AMD non siano più potenti di quelle INTEL.

 

Frequenza operativa:

A giudicare dalle latenze delle caches, sembrerebbe che BD possa avere un clock nettamente superiore a SB. Poichè la banda memoria è maggiore, anche a parità di clock, i due thread dovrebbero scorrere più fluidamente su un BD, considerando che la velocità di ritiro è la stessa e supponendo che le unità prima dello stadio di ritiro siano veloci a sufficienza (più probabile per BD che per SB alla luce di quanto visto). Se poi consideriamo che il clock sarà probabilmente maggiore...

 

Confronto alla buona 1 thread vs 1 thread considerando metà delle risorse condivise. In realtà in INTEL alcune risorse sono condivise dinamicamente.

 

Decodifica istruzioni:

Qui valgono le stesse considerazioni del 2 vs 2 considerando che la decodifica è probabilmente fatta a cilci alterni.

 

Dispatch:

Qui valgono le stesse considerazioni del 2 vs 2 considerando che il dispatch è probabilmente fatto a cilci alterni.

 

ROB:

Qui INTEL ha un enorme ROB condiviso, quindi un thread ha da 0 a 160 uop di spazio. AMD ha ROB separati da 128 mops l'uno. A secinda del carico INTEL può essere svantaggiato o meno. In un caso medio siamo 80 vs 128.

 

Scheduler:

AMD ha 40 mops int + 0-60 mops FP. In media 40+30.

INTEL ha 0-54 uops condivise. In media 27 totali.

La differenza è alta anche nel caso peggiore.

 

Esecuzione:

INTEL ha 0-6 porte disponibili per un thread. In media 3.

AMD ha 2 ALU + 2 AGU/MEM + 0-4 FP. In media 2+2+2.

La differenza è alta anche nel caso peggiore.

 

Memoria:

INTEL da 0 a 3 operazioni memoria. In media 1.5.

AMD 3 operazioni memoria.

Inutile dire chi vince in questo caso.

 

Retirement:

Qui siamo 4 a 4, ma sempre presupponendo che le mops AMD non siano più potenti di quelle INTEL.

 

Frequenza operativa:

Entrambi qui hanno il turbo. Il leackage in AMD è di partenza più basso. Poi lo spegnimento dei core con gli NFET è più efficiente. Prevedo che per AMD la frequenza turbo core sia ancora più elevata...

 

Conclusioni:

In sostanza a parità di thread Bulldozer dovrebbe surclassare SB. A parità di cores (come li intendono INTEL e AMD) non è detto che AMD la spunti. Ma comunque c'è addirittura questa possibilità...

 

 

 

 

 

 

 

 

 

 

 

 

 

20091113194722_1255811929578.gif

Edited by capitan_crasy
Link to comment
Share on other sites

Ecco le notizie più importanti su Bulldozer, Llano e Bobcat!

 

amd fusion: Prime informazioni su socket, modelli e valore tdp!

 

anche se non confermate emergono alcune informazioni sul forum di xtremesystems sui socket, modelli e valore tdp delle apu amd sia per quanto riguarda llano sia per quanto riguarda ontario.

 

 

apu (llano) con socket fs1 destinata al campo mobile, con pieno supporto alle ddr3/ddr3l so-dimm con frequenza massima di 1866mhz.

Ci saranno modelli da quad core con tdp da 45 a 35w, triple core con tdp da 33w e dual core con tdp di 30w.

attualmente mancano informazioni sulle frequenze di clock dei core x86 e sulle caratteristiche delle gpu integrate.

 

 

apu (llano) con socket fp1 destinata al campo mobile, con pieno supporto alle ddr3/ddr3l so-dimm con frequenza massima di 1866mhz.

Ci saranno modelli quad core con tdp da 30w e dual core con tdp da 26 e 20w.

attualmente mancano informazioni sulle frequenze di clock dei core x86 e sulle caratteristiche delle gpu integrate.

 

 

20100610105242_fusionllanosocketfm1.jpgapu (llano) con socket fm1 destinato al campo desktop, con pieno supporto alle ddr3 udimm/so-dimm con frequenza massima di 1866mhz.

ci saranno modelli quad/triple core con tdp da 100w, mentre altri avranno un tdp di 70w.

spazio anche alle versioni dual core con un tdp di 70w.

attualmente mancano informazioni sulle frequenze di clock dei core x86 e sulle caratteristiche delle gpu integrate.

 

 

20100610105720_fusionbobcatsocketft1.jpgapu (ontario/bobcat) con socket ft1 destinato al campo netbook, con pieno supporto alle ddr3/ddr3l udimm/so-dimm con frequenza massima di 1333mhz.

ci saranno modelli dual core con tdp di 20w/18w/9w e single core con tdp da 9w e 5w.

attualmente mancano informazioni sulle frequenze di clock dei core x86 e sulle caratteristiche delle gpu integrate ma uno di questi modelli è stato utilizzato per la dimostrazione al computex 2010.

 

Da queste tabelle emerge che:

Amd ha pensato a 2 socket (fs1 e fp1) per il mercato notebook, un socket (fm1) per il mercato mainstream desktop e un socket (ft1) per il mercato netbook.

Ci saranno nuovamente versioni triple core eredita dell' architettura k10; i valori tdp per llano variano da un massimo di 100w ad un minimo di 20w.

Viene confermato l'utilizzo di un nuovo socket per il mercato desktop anche se mancano ancora le caratteristiche; quello sicuro è che non saranno compatibili con nessuna piattaforma amd attualmente in commercio.

 

clicca qui...

amd conferma la tecnologia fusion sui futuri modelli opteron!

 

john fruehe (direttore amd di produzione marketing per il mercato server/workstation) conferma che amd proporrà la tecnologia fusion anche per le soluzioni destinati al campo server:

 

"“i believe the push for an apu within servers is still to come. It is something amd is committed to delivering in the years ahead and when the time is right, more info on fusion apus for servers will come”

 

queste soluzioni saranno proposte nelle future evoluzione dell'architettura bulldozer.

L'unione tra cpu e gpu porterà un incremento nel calcolo generale delle soluzioni amd per il mercato server/workstation.

 

clicca qui...

i primi numeri di boinc su llano e ontario!

 

secondo alcune statistiche di boinc, due sistemi composti da apu nome in codice "llano" e altri due sistemi composti con apu nome in codice "ontario" sarebbero già in azione da un mese; ancora una volta i sistemi sono registrati sotto "amd_procval" la quale rappresenta amd stessa.

I sistemi in questione sono:

 

* amd fusion "ontario" (sistema 1) ("amd64 family 20 model 0 stepping 0")

* amd fusion "ontario" (sistema 2) ("amd64 family 20 model 0 stepping 0")

* amd fusion "llano" (sistema 1) ("amd64 family 18 model 0 stepping 0")

* amd fusion "llano" (sistema 2) ("amd64 family 18 model 0 stepping 0")

 

 

gli os utilizzati sono windows server 2008 x64 e linux.

La specifica dei core "model 0 stepping 0" presente nella descrizione di tutte le apu, indica uno step produttivo a0, 32nm soi per llano e 40nm bulk per ontario.

Sembra che tutte le apu in prova siano in esecuzione con sistemi operativi diversi, in tempi diversi.

Il numero dei core sono 2 per le apu ontario e 3 core per le apu per llano; la quantità di ram è la stessa per tutti e 4 i sistemi.

Un aspetto interessante è la cache l2 di ontario, la quale è identificata come 512kb in alcuni casi, mentre in altre situazioni il valore scende a 488kb; è probabile che i 24kb mancanti siano stati disattivati in automatico grazie ad un sistema di gestione dei consumi, la quale dovrebbe ridurre la dimensione complessiva della cache l2 quando la potenza di calcolo diminuisce al fine di risparmiare energia.

Per quanto riguarda la cache l2 di llano il valore per entrambi i sistemi è di 1mb.

I risultati in virgola mobile sono 3,1 per llano - sistema1 e 3.9 ( +26%) per llano - sistema 2 ( può darsi che su linux ci sia qualche nuovo driver ottimizzato per le apu di amd).

Facendo un confronto con le attuali cpu k10 45nm, un sistema basato su phenom2 x6 ha valori di 3,7-3,9; questi numeri possono indicare llano abbia un nuovo sistema di turbo core più efficiente.

Il confronto dei calcoli dei "numeri interi" i sistemi con llano sono paragonabili ad un phenom2 core deneb con frequenza da 1,50 a 1,90ghz.

Il risultato in virgola mobile di ontario è stato di 2,3, la quale avrebbe le stesse prestazioni di un phenom2 core deneb con frequenza di clock a 1,60ghz; mentre per i calcoli in "numeri interi" è paragonabile ad un phenom2 core deneb a 1.30ghz .

e' importante sottolineare che tutti i test di riferimento di boinc hanno misurato le prestazioni in single core e che non si conosce la frequenza di clock delle 4 apu.

 

llano tri core and ontario dual core spotted

boinc su ontario: Bobcat vs atom!

 

aggiornamento sul blog di dresdenboy sui risultato su boinc delle apu ontario.

Secondi i risultati il core x86 bobcat risulta 2 volte più veloce nel calcolo dei numeri interi e 3 volte più veloce nei calcoli in virgola mobile se paragonato ad un intel atom d510 clokkato a 1.66ghz; non si conosce invece la frequenza della apu ontario.

Inoltre, secondo l'autore ce la possibilità che le apu llano triple core utilizzate nei giorni scorsi sempre su boinc, siano delle versioni mobile a basso consumo...

 

clicca qui...

nuova roadmap southbridge serie hudson!

 

20100816104928_roadmaphudson.jpg

 

grazie per la segnalazione...

Secondo questa roadmap saranno due i southbridge della serie hudson ad avere integrato le porte usb 3.0.

Il modello hudson m3 per il mercato mobile (piattaforma sabine) e modello hudson d3 per il mercato desktop (piattaforma lynx) avranno 4 porte usb 3.0 gestiti direttamente dal southbridge.

ricordo che la prima serie hudson è quella che troviamo attualmente in commercio con il nome sb850...

[/b]

amd conferma: Bulldozer incompatibile con il socket am3!

 

nei giorni scorsi, durante la presentazione al hot chip 22 della nuova architettura bulldozer, si vociferava che amd avesse cambiato rotta sulla compatibilità di bulldozer sul socket am3.

Il sito planet 3dnow ha chiesto spiegazioni ad amd stessa e essa ha confermato che le cpu bulldozer desktop non saranno compatibili con gli attuavi socket am3.

secondo amd, come confermate dalle roadmap ufficiali, si stava lavorando per la compatibilità sui socket am3; purtroppo durante lo sviluppo della nuova architettura il vecchio socket non era in grado di supportare in maniera adeguata le nuove caratteristiche implementate nella versione desktop di bulldozer.

per evitare spiacevoli ritardi e un aumento del costo finale delle nuove cpu, amd ha deciso di puntare tutto sul socket am3+ ed abbandonare la compatibilità sul socket am3.

Ecco il comunicato di amd rilasciato al sito:

 

"when we initially set out on the path to bulldozer we were hoping for am3 compatibility, but further along the process we realized that we had a choice to make based on some of the features that we wanted to bring with bulldozer. We could either provide am3 support and lose some of the capabilities of the new bulldozer architecture or, we could choose the am3+ socket which would allow the bulldozer-base zambezi to have greater performance and capability.

 

The majority of the computer buying public will not upgrade their processors, but enthusiasts do. When we did the analysis it was clear that the customers who were most likely to upgrade an am3 motherboard to a bulldozer would want the features and capability that would only be delivered in the new am3+ sockets. A classic catch-22.

 

Why not do both you ask? Just make a second model that only works in am3? First, because that would greatly increase the cost and infrastructure of bringing the product to market, which would drive up the cost of the product (for both amd and its partners). Secondly, adding an additional product would double the time involved in many of the development steps.

 

So in the end, delivering an am3 capability would bring you a less featured product that was more expensive and later to market. Instead we chose the path of the am3+ socket, which is a path that we hope will bring you a better priced product, with greater performance and more features - on time.

 

When we looked at the market for am3 upgrades, it was clear that the folks most interested in an am3-based product were the enthusiasts. This is one set of customers that we know are not willing to settle for second best when it comes to performance, so we definitely needed to ensure that our new architecture would meet their demanding needs, for both high performance and overclockability. We believe they will see that in am3+."

 

si chiude così un lungo capitolo sulla retrocompatibilità dei socket amd iniziato con il socket am2.

Questa decisione se pur impopolare potrebbe tenere basso il costo delle nuove cpu e implementare senza compromessi le nuove caratteristiche dell'architettura bulldozer.

 

clicca qui...

la cache l2 di bulldozer per il mercato server sarà di 2mb!

 

notizia sulla cache l2 di bulldozer:

Le versioni server di bd avranno 2mb di cache l2 molto probabilmente per modulo.

L'informazione è stata erroneamente pubblicata ieri sul blob di bulldozer sulle "20 domande" alla secondo ristosta, il valore è stato rimosso poco tempo dopo (clicca qui).

 

20100831105325_l2-backup.png

 

per il momento non è sicuro che amd utilizzerà lo stesso valore anche per i bulldozer destinati al mercato desktop...

amd: Llano posticipato nell'estate del 2011, ontario/zatate a inizio 2011!

 

leslie sobon (vice president, worldwide product marketing amd) dichiara in un intervista che le soluzioni apu llano, destinate al mercato mainstream, saranno disponibili sul mercato solamente nell'estate del 2011 (più o meno 6 mesi dopo l'uscita delle prime soluzioni sandy bridge di intel), mentre le apu ontario/zacate saranno consegnati nel q4 2010 per avere i primi prodotti entro l'inizio del 2011.

 

we are shipping ontario and zacate in q4 this year, and products should hit the shelves early next year. Llano will start shipping in the first half or 2011, and products should be available in summer 2011

 

clicca qui...

zacate vs i5-m 520: Aggiornamento sui risultati!

 

anandtech ha aggiornato la sua notizia sulle prestazione della apu zacate vs i5-m 520.

secondo il sito il portatile con cpu intel dava dei risultati strani soprattutto sulle performance con il browes ie9 e i valori del "html5" compreso il test di "amazon shelf", la quale la apu di amd prendeva un considerevole vantaggio.

Il sito ha preso un notebook con un i5-m è ha rifatto i test mostrando dei risultati diversi da quelli che amd aveva mostrato.

il problema era di driver, infatti il particolare modello con cpu intel utilizzato da amd per i test aveva gli ultimi driver del produttore ma non quelli rilasciati da intel.

anandtech ha parlato con amd del problema ed essa ha accettato di installare manualmente gli ultimi driver della igp intel e rifare i test; ecco i nuovi risultati:

 

Zacate

20100915114305_zacatepsych_zacate.jpg

 

i5 nuovi driver igp

20100915114352_zacatepsych_i5.jpg

 

zacate

20100915114423_ie9_zacate.jpg

 

i5 nuovo driver igp

20100915114534_ie9_i5.jpg

 

zacate

20100915114504_batman_zatate.jpg

 

i5 nuovi driver igp

20100915114606_batman_i5.jpg

 

zacate

20100915114647_coh_zacate.jpg

 

i5 nuovi driver

20100915114732_coh_i5.jpg

 

i risultati di ie9 si sono allineati con zacate grazie ai nuovi driver intel, mentre le prestazioni del 3d rimangono a favore della soluzione zacate.

Amd ha voluto far notare le prestazione di zacate sul directcomputer eseguendo il bench n-body:

Secondo il sito zacate ha un netto vantaggio (23 gflops) sulla soluzione intel (8,8 gflops)

 

20100915115718_zacate-8917.jpg

 

per concludere il sito è rimasto sorpreso della disponibilità di amd ha rifare i test con i nuovi driver per la piattaforme i5 di intel...

 

clicca qui...

nuovo controller di memoria per bulldozer!

 

xbit-lab pubblica una dichiarazione di john fruehe (director of product marketing for server/workstation amd) dove annuncia che il controller di memoria integrato nelle nuove cpu con architettura bulldozer sarà completamente ridisegnato per velocizzare l'accesso alle ram:

 

"there will be enhancements to our memory controllers, things we canot talk about just yet, that we expect to help reduce the time to access memory, both locally and remotely,"

 

nella prossima generazione di cpu opteron con architettura bulldozer a 16 core ci sarà una configurazione in quad channel grazie ai due controller ram montati sullo stesso package, uno per ogni die; mentre per il mercato desktop amd manterrà una configurazione dual channel.

Le cpu bulldozer sono attese per la prima parte del 2011...

 

clicca qui...

fino a 16mb di cache per le cpu bulldozer core orochi!

 

secondo il sito xbit lab gli 8 core amd bulldozer core orochi avrà in totale 16mb di cache divise tra cache l2 e cache l3; per fare un esempio gli attuali k10 six core hanno un totale di 9mb di cache divise tra l2 e l3.

Ci saranno ben 2mb di cache l2 per ogni modulo bulldozer composto da due core, mentre la cache l3 sarà di 8mb condivisa per tutti i moduli e core.

La grande cache l2 faciliterebbe le prestazioni in single-threaded, mentre la cache l3 sarà utilizzata per massimizzare la grandezza di banda messa a disposizione dalla memoria ram.

 

clicca qui...

chipset amd serie 900 in consegna nel secondo trimestre 2011!

 

secondo il sito xbit lab amd dovrebbe consegnare i nuovi chipset serie 900 per la piattaforma scorpius, destinata alle nuove cpu amd con architettura bulldozer, nel secondo trimestre 2011.

I modelli saranno tre più due nuovi southbridge:

 

amd 990fx :

chipset di fascia alta per socket am3+

42 linee pci-express 2.0 (16+16+6+4)

crossfire ready

hyper transport 3.1

configurazioni possibili crossfire:

4 slot pci-express 16x meccanici ( 8x elettrici per ogni slot )

3 slot pci-express 16x meccanici ( 2 slot con 8x elettrici e uno 16x )

2 slot pci-express 16x meccanici ed elettrici

 

 

amd 990x:

chipset di fascia media/alta per socket am3+

26 linee pci-express 2.0 (16+6+4)

crossfire ready

hyper transport 3.1

configurazioni possibili crossfire:

2 slot pci-express 16x meccanici ( 16x elettrici per il primo slot e 8x elettrici per il secondo slot )

 

 

amd 970:

Chipset di fascia media per socket am3+

26 linee pci-express 2.0 (16+6+4)

no crossfire

hyper transport 3.1

configurazioni possibili:

1 slot pci-express 16x meccanico ed elettrico

 

 

sb950:

southbridge per tutti i nuovi chipset amd/ati

6 porte sata 3.0

4 linee pci-express 2.0

configurazione raid

raid 0, raid1, raid 5, raid 10

14 porte usb 2.0

?? Porte usb 3.0

2 porte usb 1.1 dedicate

gestione lan 10/100/1000 integrato

gestione high definition audio mediante chip esterno

 

sb920:

southbridge per tutti i nuovi chipset amd/ati

6 porte sata 3.0

4 linee pci-express 2.0

configurazione raid

raid 0, raid1, raid 10

14 porte usb 2.0

?? Porte usb 3.0

2 porte usb 1.1 dedicate

gestione lan 10/100/1000 integrato

gestione high definition audio mediante chip esterno

 

La novità più importante (la tecnologie IOMMU e già integrata del chipset serie 890FX), mentre per il momento non si conosce il processo produttivo dei nuovi chipset AMD serie 900

I southbridge serie SB900 al contrario delle attese non avranno integrato alcun controller USB 3.0; questa scelta è stata fatta per mantenere la compatibilità "pin to pin" con i vecchi southbridge tenendo così verso il basso il costo finale delle schede mamme con socket AMD.

Le consegne dei nuovi chipset e southbridge sono attese per il secondo trimestre 2011.

 

clicca qui...

Edited by capitan_crasy
Link to comment
Share on other sites

Come da roadmap Global Foundries inizierà lo sviluppo sui 22nm "Super High Performance" (presumibilmente SOI) nel terzo trimestre 2012 per poi immettere i primi prodotti nella prima parte del 2013.

 

i68169_gtc-2.jpg

 

Per quel periodo sono previsti il passaggio ai 22nm SOI per le CPU Bulldozer e per la seconda generazione di APU Llano, la quale dovrebbero mandare in pensione i core x86 con architettura K10 per utilizzare i core x86 con architettura Bulldozer; probabile anche un aggiornamento alla GPU integrata DX11.

Per quanto riguarda Bobcat GF prevede il passaggio dei 28nm bulk "Super Low Power" entro la fine del 2011.

Link to comment
Share on other sites

Dirk Meyer Ceo AMD ha dichiarato che le prime soluzioni APU Llano saranno prodotte in volumi nella prima parte del 2011.

In realtà questo non significa specificatamente che in quel periodo saranno immessi in commercio, ma è da considerarsi una "buona notizia" visto che le ultime voci su questa soluziona APU 32nm SOI la davano sul mercato solo nell'estate del 2011.

 

"Production shipments of Llano, our 32nm APU, are planned to occur in the first half of next year.

We expect the APUs to provide an opportunity for us to get more platform design wins and get a greater percentage of sell-outs based on the differentiated value proposition, which comes really in two forms. Number one, superior graphics performance at better price points and better power points than is available from the competition,""

 

Secondo il sito Xbit lab fonti vicine ad AMD prevedono che le varie soluzioni Llano, da quelle per il mercato mobile a quelle per il mercato mainstream, i valori TDP possano variare da un minimo di 20W ad un massimo di 59W.

 

Clicca qui...

Link to comment
Share on other sites

Secondo il sito Xbit lab mezza dozzina di produttori starebbero preparando soluzioni con APU Zacate basate sulla piattaforma "Brazus" in formato mini-ITX, già alla presentazione prevista per inizio 2011.

Zacate è la soluzione APU a basso consumo destinata al mercato desktop low-end con GPU integrata DX11 in grado di supportare tutte le nuove tecnologie quali l'accelerazione in hardware su filmati in alta definizione e il supporto HTML5 via GPU.

Si prevede l'utilizzo di soluzioni APU Zacate Dual core modello e350 venduti con il marchio "AMD Vision" e soluzioni single core e240 con il marchio "AMD HD Internet"; il TDP dovrebbe variare tra i 18W e i 9W.

Per completare la piattaforma verrà utilizzato il southbridge Hudson D1 la quale avrà il supporto delle porte SATA3, mentre la gestione Lan e le eventuali porte USB3.0 saranno affidati a chip esterni...

 

Clicca qui...

Link to comment
Share on other sites

Il piacere e' reciproco :>

 

Sai qualcosa della presunta intenzione di AMD di usare il nome Radeon anche in abbinamento alle APU, motivo per cui le schede discrete sarebbero state shiftate verso l'alto nella nomenclatura (la performance diventa 58xx, la enthusiast 59xx e la Sboron™ non si sa)?

Link to comment
Share on other sites

Il piacere e' reciproco :>

 

Sai qualcosa della presunta intenzione di AMD di usare il nome Radeon anche in abbinamento alle APU, motivo per cui le schede discrete sarebbero state shiftate verso l'alto nella nomenclatura (la performance diventa 58xx, la enthusiast 59xx e la Sboron™ non si sa)?

 

Per quanto riguarda Llano le mie informazioni sono piuttosto labili, per ora so che AMD è stata costretta a sviluppare un nuovo step in quanto il primo (A0/A1) a rilevato un (più o meno) grave BUG imputabile alla GPU integrata.

Non conosco ancora quale sia il reale problema ma molti ipotizzano che il passaggio alla tecnologia 32nm SOi stia provocando più grattacapi del previsto per quanto riguarda le GPU di origine bulk.:buck2:

Detto questo almeno per il momento non credo che AMD abbia intenzione di sostituire la serie 5570/5670 con Llano anche perchè si taglierebbe le gambe sul mercato mobile con CPU Intel.

Per Ontario e Zacate le cose vanno decisamente meglio tanto che AMD ha accelerato i tempi di consegna.

E' probabile (voce non confermata) che Ontario sostituisca le GPU entry level già dalla prossima generazione, oppure immettano sul mercato una soluzione nuova chiamata HD6300 (UVD 3.0, Blu-ray 3D, HDMI 1.4) la quale viene associata proprio con le APU Ontario/Zacate; ricordo che queste soluzioni non hanno controller PCI-express 2.0 dedicate (al contrario di Llano) per poter gestire GPU esterne.

:)

Link to comment
Share on other sites

Durante l'evento "AMD Technical Forum and Exhibition" tenutosi a Taipei, Chris Cloran (general manager di AMD) ha mostrato una piattaforma Demo e i primi Wafer di Llano ovvero un APU Quad core con GPU DX11 per il mercato mainstream.

 

i68658_wafer.jpg

 

La piattaforma era un sample di "Sabine" destinata al mercato notebook.

Durante la prova AMD ha eseguito contemporaneamente il programma DirectCompute con 4 sessione di HyperPi, il tutto coadiuvato da un filmato in alta definizione, la quale comunque risultava fluido nonostante tutti i core fossero occupati al 100%.

Non si conoscono ne le frequenze dei core X86/GPU ne gli stream processor del sample utilizzati.

 

i68651_demo.jpg

i68649_big-amd-llano-demo-2.jpg

i68650_big-amd-llano-demo.jpg

 

[video=youtube;-oPwIpJ-QWI]

 

AMD ha mostrato anche un video su "Brazos", piattaforma con APU AMD destinata al mercato netbook, dove viene paragonata la potenza della GPU integrata con quella di una IGP del modello Intel i5 M520 utilizzando il programma DirectCompute.

 

 

Fonte News

Link to comment
Share on other sites

The tech Report pubblica questa slide di origine AMD dove viene descritto l'innovativo sistema di controllo delle ventole introdotto (e mai usato da nessun produttore di schede mamme :muro: ) con i southbridge serie SB800.

 

i69419_singledual.jpg

 

Il socket nominato è AM3r2 o più semplicemente AM3+ destinato alle nuove CPU con architettura Bulldozer.

Si apre la possibilità che in futuro ci siano schede mamme socket AM3+ con gli attuali chipset serie 800...

 

Clicca qui...

Link to comment
Share on other sites

  • 2 weeks later...

Prendendo spunto dal Wafer di Llano mostrato qualche tempo fa da AMD si può valutare, grazie ad un immagine particolarmente chiara, le presunte dimensione della soluzione Llano a 32nm SOI attesa per il 2011.

 

i70279_dimensioni-wafer-llano.jpg

 

La dimensione presunta del DIE dovrebbe essere tra i 210mm e i 220mm, contro i presunti 170/180mm visti in un immagine pubblicata da AMD nel novembre scorso.

Le dimensioni dei core X86 non sarebbero cambiati, la GPU dovrebbe occupare più o meno il 40% dell' intero chip.

Link to comment
Share on other sites

Guest
This topic is now closed to further replies.

×
×
  • Create New...