AMD presenta le CPU EPYC Genoa di 4a generazione: 96 core Zen 4, fino a 160 linee PCIe Gen 5 e CXL
di Paolo Corsini pubblicata il 11 Novembre 2022, alle 17:55 nel canale DeviceAMD ha presentato ufficialmente i nuovi processori della gamma per server EPYC: basati sull'architettura Zen 4, offrono fino a 96 core, 160 linee PCIe Gen 5 e compatibilità con lo standard CXL
All'evento together we advance_data centers AMD ha presentato ufficialmente la quarta generazione di processori EPYC, nota anche con il nome in codice "Genoa" e basata sull'architettura Zen 4 già impiegata sui Ryzen della serie 7000. Arrivano molteplici cambiamenti rispetto alla terza generazione, a partire dal numero massimo di core che arriva a 96. Viene integrato anche il supporto alle memorie DDR5 e agli standard PCIe Gen 5 e CXL 1.1+.
AMD EPYC di 4a generazione: fino a 96 core, DDR5 e PCIe Gen 5
L'annuncio dei processori AMD EPYC di 4a generazione non comprende elementi particolarmente sorprendenti e si allinea alle attese su pressoché tutti i fronti. Era infatti previsto il supporto a DDR5 e PCIe Gen 5, così come quello allo standard CXL 1.1+ (di cui si era parlato proprio poche settimane fa).
La novità forse più grande è che il numero massimo di core dei nuovi EPYC raggiunge quota 96 (con 192 thread), contro invece i 64 (128 thread) della generazione precedente (con un aumento, quindi, del 50%). Ci saranno fino a 12 CCD, ciascuno dei quali con 8 core. È interessante notare come i consumi delle nuove CPU rimangano sostanzialmente allineati con quelli della generazione precedente, ovvero entro il limite dei 400 W; il modello EPYC 9654 con 96 core ha un TDP pari a 360 W, che si traduce in appena 3,75 W per ciascun core. AMD afferma che l'efficienza è migliore del 48% rispetto ai processori concorrenti di Intel.
I CCD sono identici a quelli già visti sui Ryzen 7000 per computer desktop, con 8 core dotati di 1 MB di cache L2 ciascuno e di 32 MB di cache L3 condivisa. Secondo AMD, le prestazioni sono superiori del 14% rispetto alle CPU Zen 3 a parità di velocità di clock. Tale balzo in avanti è dovuto a migliorie nelle unità di front-end e di load/store, così come nel branch predictor, nella presenza di una cache L2 più grande e nel motore di esecuzione.
Ci sono cambiamenti importanti anche nell'ISA, che vede l'aggiunta delle istruzioni AVX-512, VNNI e bfloat16. L'implementazione delle AVX-512 è, a detta di AMD, più efficiente rispetto a quella usata sulle CPU Intel, perché vengono usate le FPU a 256 bit esistenti in quella che AMD chiama modalità "double-pumped"; ciò sembra far intendere che le istruzioni AVX-512 di AMD richiedono due cicli di clock per essere calcolate, anziché uno solo. Le istruzioni VNNI e le bfloat16 sono impiegate nel deep learning e offrono un'efficienza migliore in questo specifico ambito rispetto alle alternative.
Vengono poi introdotti miglioramenti nelle funzionalità di sicurezza, in particolare per quanto riguarda le funzionalità di protezione delle macchine virtuali. Queste possono scegliere di girare solo quando non ci sono altri processi in esecuzione sullo stesso core fisico tramite il secondo thread; ciò aumenta la sicurezza rispetto ad attacchi che sfruttano le caratteristiche SMT dei processori.
I CCD sono prodotti con processo a 5 nm, mentre il Server I/O Die (sIOD) è prodotto a 6 nm. Quest'ultimo ha un numero molto più alto di transistor rispetto alla generazione precedente, soprattutto per via della presenza di due SERDES (serializzatore-deserializzatore) a 80 linee: possono essere configurati per gestire canali PCIe Gen 5, CXL 1.1, SATA 6 Gbps o Infinity Fabric (per i server a doppio processore). Parlando di connettività, il processore supporta fino a 64 linee CXL e 160 linee PCIe Gen 5 (ovvero fino a 10 slot x16 operanti a piena velocità). L'Infinity Fabric di terza generazione collega diverse componenti all'interno del sIOD, quest'ultimo ai CCD e due CPU tra di loro nei server a due socket. L'interfaccia di memoria supporta 12 canali (24 sub-canali da 40 bit) con il supporto a un massimo di 6 TB di memoria ECC DDR5-4800 per ciascun socket.
Sono in totale 18 i modelli di processore presentati da AMD, da 16 fino a 96 core. Sono presenti delle varianti "F" che offrono un minor numero di core, ma frequenze (e, di conseguenza, consumi) più elevate.
AMD ha altresì annunciato che le CPU EPYC "Bergamo", destinate agli hyperscaler, saranno disponibili nella prima metà del 2023, assieme alle "Genoa-X" dotate di 3D V-Cache, mentre le "Siena", destinate all'edge e alle telecomunicazioni, saranno rese disponibili nella seconda metà del prossimo anno.
6 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infohttps://www.phoronix.com/review/amd...9554-benchmarks
https://www.phoronix.com/review/amd...9554-benchmarks
Davvero impressionante, soprattutto le performance AVX-512 con software Intel che è sempre stato il tallone d'achille di Epyc in alcuni bench i nuovi Epyc vanno 6-7 volte più veloci di Milan, in pratica non c'è più un singolo carico di lavoro in cui siano preferibili gli Xeon.
Poi vabbè compila il kernel linux in 18 secondi.. sarà molto interessante quando usciranno i threadripper con architettura simile.
Poi vabbè compila il kernel linux in 18 secondi.. sarà molto interessante quando usciranno i threadripper con architettura simile.
Però €9000 la sola CPU!
Anche i Threadripper saranno carissimi.
Anche i Threadripper saranno carissimi.
Però se tieni conto che uno Xeon Platinum 8380 40c80t costa 9359$ il prezzo di questi Epyc è più che conveniente.
https://www.intel.com/content/www/u...ifications.html
Se prendi una SKU comparabile come il 9454 con 48c96t costa "solamente" 5225$
Scherzi a parte, nei bench di Phoronix la configurazione 9654 2P straccia tutti. L'unico test in cui è allineato è il pybench e il php.
Incredibile i 7.5 secondi per il render di blender BMW27. Quasi 7 volte piu' veloce del 7950X. Quanto ci metteva sulla RTX 4090?
Certo una configurazione completa 2P, a 11000$ a CPU, a quanto si avvicinerebbe? 30-35000 E?
Scherzi a parte, nei bench di Phoronix la configurazione 9654 2P straccia tutti. L'unico test in cui è allineato è il pybench e il php.
Incredibile i 7.5 secondi per il render di blender BMW27. Quasi 7 volte piu' veloce del 7950X. Quanto ci metteva sulla RTX 4090?
Certo una configurazione completa 2P, a 11000$ a CPU, a quanto si avvicinerebbe? 30-35000 E?
Non a caso php è nammerda(tm)
Ti prego dimmi che le è le hai messe apposta nel tuo post
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".