Intel

Itanium 2 Montecito: livelli record in virgola mobile

di Paolo Corsini pubblicata il 07 Luglio 2005, alle 09:31 nel canale Private Cloud

Il debutto delle cpu Itanium 2 basate su core Montecito si avvicina: Intel annuncia valori record per le performances di questi sistemi nell-esecuzione di calcoli in floating point

I migliori sconti su Amazon oggi

-22%

NiPoGi Mini PC 8GB DDR4 + 256GB M.2 SSD, Mini Computer, AK1Plus 12th

179.00 139.00€ Compra ora

-12%

HP 250 G9, Notebook Display 15.6'' FHD, Intel Core i5-12th 10 Core 4.4Ghz, Ram 16GB, SSD 512GB, Windows 11

498.00 439.00€ Compra ora

-50%

Oral-B Spazzolino Elettrico Ricaricabile iO 3 Nero, 1 Testina Di Ricambio, 1 Custodia Da Viaggio +Dentifricio Pro-Science Advanced Rigenera Smalto Pulizia Quotidiana 75ml. 1 Spazzolino

119.99 59.99€ Compra ora

G70 e frequenze di clock: parte 2

R520: nuove informazioni, e debutto a Settembre?

cdimauro15 Luglio 2005, 09:13 #71

Originariamente inviato da: bjt2

Ha ragione fantoibed... ma io non criticavo lo spreco di risorse, ma la mancanza di una modalità Niagara-Like. Mi spiego meglio: se voglio un mostro di calcolo parallelo, prendo un Itanium (2). Se voglio un sistema che possa gestire bene molti thread, devo per forza aumentare le CPU. Si poteva, senza complicare troppo la CPU, adottare un'altra modalità operativa come quella Niagara (visto che la logica OOO non c'è

, avendo un ultra hyper threading (riflettendoci mi pare che gli itanium 2 ce l'abbiano, ma non ne sono sicuro...), magari a 4 o più thread, vista la cache ed il numero di unità di calcolo presenti in quella CPU...

Per essere precisi, l'approccio di Intel con Itanium è simile a quello di Niagara, dove la CPU cambia thread di esecuzione di fronte a uno stallo. Quindi è un approccio un po' diverso e meno efficiente di quello adottatato per il P4 o da IBM col Power5, dove i thread presenti si contendono le risorse (il Power5 ha una logica molto fine per farlo, e addirittura il s.o. può controllarne alcuni aspetti).

Francamente non ricordo se Intel ha già adottato il CMP con qualche versione di Itanium 2, o lo farà in un prossimo futuro.

cdimauro15 Luglio 2005, 09:29 #72

Originariamente inviato da: DioBrando

Io non ho parlato di stallo per errate predizione, ho detto semplicemente stallo.

Esatto: le cause sono molteplici.

La predicazione non risolve tutte le possibili situazioni in cui uno stallo può verificarsi, ad es. perchè il codice per quanto il compilatore possa ottimizzare il codice per l'architettura EPIC, non riuscirà mai a "parallalelizzarlo" completamente.

Esattamente. E comunque, anche se riesce a fare un buon lavoro, di fronte a certe situazione tutt'altro che rare, è l'architettura stessa dell'Itanium a fare da freno.

Ad esempio, con un codice "poco diffuso"

come questo:
[CODE]
for i := 1 to n do
[...][/CODE]
alla fine di ogni ciclo la CPU sbaglierà la predizione n - 1 volte, e sarà costretta a svuotare e riempire la pipeline a causa del salto all'inizio del ciclo. Soltanto all'n-esimo ciclo continuerà l'esecuzione senza intoppi.
In questo contesto è evidente l'efficienza di un processore ooo: il salto verrà predetto correttamente n - 1 volte, e soltanto l'ultima fallirà.

Il compilatore può aiutare Itanium, mitigando la penalizzazione dovuta ai salti, effettuando loop unrolling, ma fino a un certo punto: anche la dimensione del codice è un fattore importante, per cui sarà costretto a trovare una soluzione di compromesso fra il numero di cicli da eseguire e lo spazio occupato.
Considerato che i bundle di Itanium sono costituiti da 128 bit (sono ben 16 byte), e che contengono al più 3 istruzioni "utili" (anche sui bundle ci sono parecchi vincoli: non si possono inserire arbitrariamente le istruzioni, come avviene con la maggior parte delle architetture VLIW), è facile che lo srotolamento dei cicli

porti a un eccessivo consumo di memoria. Consumo di memoria -> banda consumata per caricare il codice in cache.

Anche le rose più belle hanno pur sempre le spine...

cdimauro15 Luglio 2005, 09:37 #73

Dimenticavo: processori ooo moderni, come gli x86, che non usano il raffinato sistema di predicazione di Itanium, hanno comunque delle migliorie architetturali che aiutano molto nei casi più comuni.

Ad esempio, il vecchio PentiumPro ha introdotto le istruzioni CMOV e FCMOV, che consentono di eseguire o saltare l'istruzioni di spostamento di un registro, a seconda del verificarsi di una precisa condizione.

Inoltre con le SSE2 Intel ha introdotto anche due speciali prefissi per le istruzioni di salto, che "suggeriscono" alla logica di branch prediction se quel salto è più o meno soggetto ad essere eseguito.

Piccole migliorie, che costano poco, ma che permettono di risolvere in maniera efficace certi problemi comuni, anche se non eleganti come la soluzione di Itanium... Ma alla fine contano le prestazioni, non l'eleganza di un'architettura...

fantoibed15 Luglio 2005, 11:25 #74

Originariamente inviato da: cdimauro]Ad esempio, con un codice "

for i := 1 to n do
[...][/CODE]
alla fine di ogni ciclo la CPU sbaglierà la predizione n - 1 volte, e sarà costretta a svuotare e riempire la pipeline a causa del salto all'inizio del ciclo. Soltanto all'n-esimo ciclo continuerà l'esecuzione senza intoppi.
In questo contesto è evidente l'efficienza di un processore ooo: il salto verrà predetto correttamente n - 1 volte, e soltanto l'ultima fallirà.

Nemmeno il compilatore che trovi nel Dixan non produrrebbe un codice dal comportamento simile. Esistono predicati fatti ad hoc per i cicli for e while:
br.cloop, br.ctop e br.cexit per i cicli for e br.wtop e br.wexit per i cicli while.

...E poi esistono delle istruzioni che permettono di effettuare predizione statica e dinamica (solo che devono essere inserite nel codice dal compilatore): spnt, sptk, dpnt e dptk.
...Poi ci sono i prefetch hints ed i predictor deallocation hints.

La pipeline dell'Itanium, inoltre, ha solo 8 stadi (con un instruction buffer inserito tra i primi 2 stadi di front-end e gli ultimi 6 di back-end) quindi soffre poco lo stallo anche per quello...

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

VIDEO IN EVIDENZA

TOPICS

tutti gli articoli »

tutte le news »

Sapphire NITRO+ Radeon RX 9070 XT recensione: una GPU AMD con connettore 12V-2x6 La NITRO+ di Sapphire torna in edizione Radeon RX 9070 XT. Un nuovo design più squadrato con una griglia laterale, un backplate estetico opzionale, l'assenza del...

Recensione Onyx Boox Palma 2: solo evoluzione ma rimane unico Onyx BOOX Palma 2 è un e-reader compatto e versatile che evolve il modello precedente con un design vincente e funzionalità avanzate, ma non rivoluziona il concetto....

Kingdom Come: Deliverance 2 è il modo migliore per vivere il Medioevo Kingdom Come: Deliverance 2 porta i giocatori nel cuore della Boemia del XV secolo. Il livello di realismo, la complessità delle meccaniche e l'attenzione ai dettagli...

DJI Osmo Mobile 7P: ti segue anche con la fotocamera nativa dello smartphone! Grande novità per il nuovo gimbal DJI Osmo Mobile 7P: grazie al modulo multifunzione incluso, dotato di telecamera, ora l'inseguimento del soggetto è possibile anche...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

MWC 2025: dalle reti alle applicazioni, il 5G diventa l’infrastruttura per il futuro dell’IA Il Mobile World Congress è il luogo ideale per capire come si sta evolvendo il settore delle telecomunicazioni, in particolare in questa fase in cui c'è una forte...

Tesla Model S Plaid: la potenza con il controllo E' la vettura Tesla più potente e veloce, forte di 3 motori che scaricano a terra 1.020 cavalli. Ma al contempo è capace di venir utilizzata come la più sorniona...

Fujifilm X100VI: con le 'ricette' è la fotocamera più divertente del momento Fujifilm X100VI è la fotocamera perfetta per divertirsi con la street photography: è tascabile, offre grande qualità, ma soprattutto permette di giocare molto con...

No Rss

Itanium 2 Montecito: livelli record in virgola mobile

NiPoGi Mini PC 8GB DDR4 + 256GB M.2 SSD, Mini Computer, AK1Plus 12th

HP 250 G9, Notebook Display 15.6'' FHD, Intel Core i5-12th 10 Core 4.4Ghz, Ram 16GB, SSD 512GB, Windows 11

Oral-B Spazzolino Elettrico Ricaricabile iO 3 Nero, 1 Testina Di Ricambio, 1 Custodia Da Viaggio +Dentifricio Pro-Science Advanced Rigenera Smalto Pulizia Quotidiana 75ml. 1 Spazzolino

74 Commenti