Intel Xeon Phi ufficialmente al debutto: schede x86 per GPU Computing

Intel Xeon Phi ufficialmente al debutto: schede x86 per GPU Computing

In concomitanza con SC12 Intel presenta le proprie schede Xeon Phi, prodotti che abbinano l'accelerazione a calcoli paralleli con la flessibilità dell'architettura x86

di pubblicata il , alle 15:31 nel canale Private Cloud
Intel
 
86 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
PaulGuru13 Novembre 2012, 22:36 #21
Questo è un capolavoro, Intel riesce a competere contro le GPU top di gamma con una CPU x86, un primo passo per poter arrivare anche al desktop.
tuttodigitale13 Novembre 2012, 22:54 #22
Originariamente inviato da: sbudellaman
Ah è che l'avevo letto nella news

diciamo allora una via di mezzo?

per niente. Sono 60 core general purpose x86 su unico die, non ci . E a scanso di equivoci tutta quella potenza bruta non è certamente dovuta ai Pentium Pro, architettura del 1995 se non sbaglio...e neanche il consumo.
Sfruttare solo le istruzioni SSE è persino deletiero.. 8 core sb da 3 GHz sono equivalenti a 24 core SB a 1 GHz nell'ipotesi, non tanto errata, di uno sfruttamento totale delle risorse. Ma ci sono cpu da 16 core e 2,3GHz basate su SB...e quindi circa 36 core a 1GHz.
Un core SB va sicuramente meglio di due, ma anche 3 core Pentium Pro. Il fatto che non si possa sfruttare il nuovo coprocessore con applicazioni odierne lo vedo come un non problema. Il fatto che persino nell'ipotesi favorevole, di calcoli fortemente threaded, i Pentium escono battuti, la dice lunga sul come deve essere sfruttata questo XEON PHI.
Questa scheda praticamente è un array di SIMD a 512 bit gestite ciascuno da un core x86. I calcoli veri li farà la SIMD.
pregio principale di questa soluzione è che per sfruttare le prestazioni in virgola mobile non è necessario usare decine di migliaia di cpu basate su architetture mastondontiche come SB o Bulldozer.
PaulGuru13 Novembre 2012, 23:13 #23
Originariamente inviato da: tuttodigitale
per niente. Sono 60 core general purpose x86 su unico die, non ci . E a scanso di equivoci tutta quella potenza bruta non è certamente dovuta ai Pentium Pro, architettura del 1995 se non sbaglio...e neanche il consumo.
Sfruttare solo le istruzioni SSE è persino deletiero.. 8 core sb da 3 GHz sono equivalenti a 24 core SB a 1 GHz nell'ipotesi, non tanto errata, di uno sfruttamento totale delle risorse. Ma ci sono cpu da 16 core e 2,3GHz basate su SB...e quindi circa 36 core a 1GHz.
Un core SB va sicuramente meglio di due, ma anche 3 core Pentium Pro. Il fatto che non si possa sfruttare il nuovo coprocessore con applicazioni odierne lo vedo come un non problema. Il fatto che persino nell'ipotesi favorevole, di calcoli fortemente threaded, i Pentium escono battuti, la dice lunga sul come deve essere sfruttata questo XEON PHI.
Questa scheda praticamente è un array di SIMD a 512 bit gestite ciascuno da un core x86. I calcoli veri li farà la SIMD.
pregio principale di questa soluzione è che per sfruttare le prestazioni in virgola mobile non è necessario usare decine di migliaia di cpu basate su architetture mastondontiche come SB o Bulldozer.


Sbagli di grosso, 8 cores da 3Ghz equivalgono 24 da 1Ghz ? nemmeno col binocolo, l'aumento di frequenza non porta ad un proporzionale aumento di IPC perchè la banda di memoria e le allocazioni dei registri interni sono "limitati" e vi sono colli di bottiglia dovuti alle varie latenze di funzionamento, la cosa in genere vale fino ad una certa frequenza.

Se così fosse allora gli xeon e gli opteron da 12-16 cores dotati ovviamente di frequenze molto minori sono inferiori sarebbero inutili Invece un Opteron Interlagos a 16 cores da 2.1Ghz come IPC assoluto è superiore ad un FX8350 ( 8 cores a 4.2Ghz ).

Sono cores basati sui Pentium Pro ma una banda passante di 320GB/s a bassissima latenza e dotato delle tecnologie attuali.
Defragg14 Novembre 2012, 01:21 #24
Ma è Larrabee?
System Shock14 Novembre 2012, 01:30 #25
Così a prima vista non mi sembra entusiasmante , 60 core che devono condividere 8 Gb (ed immagino un cache non certo abbondante) .
Comunque prima di dare giudizi aspetto dei benchmark di qualche genere .

Anche senza aspettare i bench con quella cifra si comprano 4 cpu opteron a 16 core = 64 , e non credo che si possa dubitare sulla superiorità di questa soluzione .
Rubberick14 Novembre 2012, 02:47 #26
sicuramente la ricerca e particolari ambiti specifici ne beneficieranno

quelli professionali a meno che non siano molto legati all'informatica e alla possibilità di scriversi software da se dubito :\

l'idea mia poteva essere tranquillamente messa in pratica xo' .) ne avrebbero vendute a pacchi

si sente l'esigenza in alcuni casi di avere una mini workstation con molta potenza di calcolo

tanto più che con buona disponibilità di ram e ssd si finisce facilmente cpu bound

Rubberick14 Novembre 2012, 02:51 #27
che poi morale della favola non ho capito una cosa...

siamo daccordo ovviamente non si programmerà in cuda... opencl si? oppure no perchè non è una scheda da usare come gpugpu?
PaulGuru14 Novembre 2012, 09:19 #28
Originariamente inviato da: Defragg
Ma è Larrabee?


Esatto.

Originariamente inviato da: System Shock
Così a prima vista non mi sembra entusiasmante , 60 core che devono condividere 8 Gb (ed immagino un cache non certo abbondante) .
Comunque prima di dare giudizi aspetto dei benchmark di qualche genere .

Anche senza aspettare i bench con quella cifra si comprano 4 cpu opteron a 16 core = 64 , e non credo che si possa dubitare sulla superiorità di questa soluzione .


Veramente una GPU solitamente esprime in virgola mobile potenza nettamente superiori rispetto alle cpu classiche x86, anche 100 volte di più, comprare 4 opteron interlagos è inutile, verrebbero asfaltati a mani basse in questo tipo di mansioni.
Il fatto che Intel sia riuscito ad un primo colpo a competere in questo campo con un chip x86 è qualcosa di straordinario visti anche i margini di sviluppo che ci saranno sia nella programmazione che nell'hardware.
System Shock14 Novembre 2012, 09:56 #29
Originariamente inviato da: PaulGuru
Esatto.



Veramente una GPU solitamente esprime in virgola mobile potenza nettamente superiori rispetto alle cpu classiche x86, anche 100 volte di più, comprare 4 opteron interlagos è inutile, verrebbero asfaltati a mani basse in questo tipo di mansioni.
Il fatto che Intel sia riuscito ad un primo colpo a competere in questo campo con un chip x86 è qualcosa di straordinario visti anche i margini di sviluppo che ci saranno sia nella programmazione che nell'hardware.


Non stiamo parlando di una gpu , sono 60 core x 86
, non credo che questa soluzione entri in competizione con le soluzioni tesla o fire pro , a meno che oltre ai 60 core x 86 siano state integrate unita di calcolo particolari e dalle potenzialità non ancora note.

Comunque sicuramente in alcuni ambiti sarà molto valida e magari col tempo potrà arrivare qualcosa per il settore desktop dalle cifre umane .
coschizza14 Novembre 2012, 10:07 #30
Originariamente inviato da: System Shock
Così a prima vista non mi sembra entusiasmante , 60 core che devono condividere 8 Gb (ed immagino un cache non certo abbondante) .
Comunque prima di dare giudizi aspetto dei benchmark di qualche genere .

Anche senza aspettare i bench con quella cifra si comprano 4 cpu opteron a 16 core = 64 , e non credo che si possa dubitare sulla superiorità di questa soluzione .


la soluzione della controparte nvidia e amd hanno meno memoria e una quantita di cache nettamente inferiore, parlamo di 1,65MB di cache L2 per Kepler GK110 contro 30MB della soluzione intel che quindi per certi workflow sara nettamente avvantagiata.

4 cpu opteron a 16 core no vanno certo veloci come 1 singola scheda come questa nei calcoli a doppia precisione e consumano anche piu del doppio . Senza andare nei dattagli il sistema da te proposto amd ha 32 unita vettoriali a 256bit mentre questa singola scheda ne ha 60 da 512bit peraltro piu performanti per il tipo di calcolo richiesto.

Tanto per farti un esempio dei banchmark pubblicati da intel 1 scheda xeon phi è circa 2,5x piu veloce di un batteria di 2 xeon di ultima generazione nel classici test Linpack.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^