AMD
Flex FP: floating point per i futuri server AMD
di Paolo Corsini pubblicata il 29 Ottobre 2010, alle 11:47 nel canale Private Cloud
AMD illustra alcune delle peculiarità tecnologie della propria Flex FP, unità di calcolo in virgola mobile che verrà integrata nelle future cpu basate su architettura Bulldozer
18 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoSebbene il modulo sia l'unità costruttiva di Bulldozer, i core int per modulo sono di fatto due, cosa ben diversa dal singolo core con SMT degli attuali processori intel.
per quale motivo una cpu di fascia server ? Potevo capirla su una CPU dedicata ai gamer, dove qualche volta la FPU è sfruttata per tutti i calcoli complessi che ancora non si riesce a demandare alla scheda grafica.
Se è un server dedicato ad un servizio generico, come un server web, un database, ecc. ecc. la FPU è generalmente poco utilizzata e non costituisce di per sé un collo di bottiglia.
Se è un server dedicato ad un qualsiasi tipo di calcolo numerico, sono certo al 99% che utilizzare un'architettura dedicata più efficiente - leggi GPGPU - darà in ogni caso risultati migliori rispetto a qualsiasi FPU, incluse queste nuove estensioni, a parità di costo.
Perciò? A chi serviranno?
con la speranza che non si creino conflitti con l'architettura BD, un bug è sempre dietro l'angolo, magari con le avx viene sfruttato un solo core logico oppure nelle istruzioni a 128bit la fpu non riesce a fare due calcoli in parallelo...
sarebbe un bel danno per amd nel segmento desktop
Perciò? A chi serviranno?
solo una parte dei software possono essere adattati per sfruttare la GPGPU quindi devi avere alterantive per poter gestire tutte la possibilità che nel campo software sono molte
inoltre non pensare che una ruotine fatta per GPGPU dia risultati migliori della stessa eseguita sulla cpu, questo perche appunto non tutti i codici sono parralelizzabili ed eseguibili con la stessa efficienza sui vari sistemi
La prossima cpu intel sb ha messo in campo un esempio pratico di quello che ti sto dicendo, all'interno ha un encoder video hardware che occupa solo 3mm quadrati ed è composta solo da funzioni fisse come si faceva una volta, il risultato è che puo eseguire codifica di flussi video alla pari di una gpu che pero consuma 100 di piu con un costo infinitamente maggiore e un consumo di spazio sul die nemmeno confrontabile.
Quindi le sse, vmx ecc non sono sostituibili a prescindere da funzioni GPGPU perche poi a livello pratico possono essere piu sconvenienti in base a cosa devono eseguire
Sono assolutamente retrocompatibili con il codice SSEx e legacy esistente.
per quale motivo una cpu di fascia server ? Potevo capirla su una CPU dedicata ai gamer, dove qualche volta la FPU è sfruttata per tutti i calcoli complessi che ancora non si riesce a demandare alla scheda grafica.
Se è un server dedicato ad un servizio generico, come un server web, un database, ecc. ecc. la FPU è generalmente poco utilizzata e non costituisce di per sé un collo di bottiglia.
Se è un server dedicato ad un qualsiasi tipo di calcolo numerico, sono certo al 99% che utilizzare un'architettura dedicata più efficiente - leggi GPGPU - darà in ogni caso risultati migliori rispetto a qualsiasi FPU, incluse queste nuove estensioni, a parità di costo.
Perciò? A chi serviranno?
Il GPGPU ha ottime prestazioni solo con singola precisione. In doppia precisione le prestazioni si riducono ad 1/4.
sarebbe un bel danno per amd nel segmento desktop
Perché si dovrebbero creare conflitti ? E' una gufata ? Non capisco
La FPU di Bulldozer di fatto è una unità SMT, le istruzioni dei vari thread vengono mescolate ed in ogni istante ad un thread possono venire assegnate due unità FMAC, una unità FMAC o nessuna. Questo è appunto il motivo per cui si chiama Flex FP: cioè Flexible...
Il GPGPU ha ottime prestazioni solo con singola precisione. In doppia precisione le prestazioni si riducono ad 1/4.
Perché si dovrebbero creare conflitti ? E' una gufata ? Non capisco
La FPU di Bulldozer di fatto è una unità SMT, le istruzioni dei vari thread vengono mescolate ed in ogni istante ad un thread possono venire assegnate due unità FMAC, una unità FMAC o nessuna. Questo è appunto il motivo per cui si chiama Flex FP: cioè Flexible...
Ma infatti Cionci, io non capisco tutti questi commenti assurdi e fuori luogo.
AMD sta semplicemeno introducendo una FPU più avanzata e complessa che, nelle intenzioni di AMD, sarà la vera punta di diamante delle sue future CPU (oltre all'unità grafica integrata).
Certo beccare due thread non concorrenti (se sono in concorrenza la probabilità che uno dei due sia bloccato aumenta) che utilizzano la FPU non è così frequente in un utilizzo comune di server e desktop, tranne forse nell'utilizzo multimediale, encoding soprattutto, visto che il decoding sarà sempre più spesso demandato alla GPU.
La novità più grossa secondo me sono i due core INT nella stessa CPU. Questa sì che è una novità addirittura epocale. Soprattutto visto che le prestazioni a parità di frequenza saranno nettamente superiori ad un dual core della generazione precedente, ma con uno spazio occupato nettamente inferiore.
per quale motivo una cpu di fascia server ? Potevo capirla su una CPU dedicata ai gamer, dove qualche volta la FPU è sfruttata per tutti i calcoli complessi che ancora non si riesce a demandare alla scheda grafica.
Se è un server dedicato ad un servizio generico, come un server web, un database, ecc. ecc. la FPU è generalmente poco utilizzata e non costituisce di per sé un collo di bottiglia.
Se è un server dedicato ad un qualsiasi tipo di calcolo numerico, sono certo al 99% che utilizzare un'architettura dedicata più efficiente - leggi GPGPU - darà in ogni caso risultati migliori rispetto a qualsiasi FPU, incluse queste nuove estensioni, a parità di costo.
Perciò? A chi serviranno?
inoltre non pensare che una ruotine fatta per GPGPU dia risultati migliori della stessa eseguita sulla cpu, questo perche appunto non tutti i codici sono parralelizzabili ed eseguibili con la stessa efficienza sui vari sistemi
La prossima cpu intel sb ha messo in campo un esempio pratico di quello che ti sto dicendo, all'interno ha un encoder video hardware che occupa solo 3mm quadrati ed è composta solo da funzioni fisse come si faceva una volta, il risultato è che puo eseguire codifica di flussi video alla pari di una gpu che pero consuma 100 di piu con un costo infinitamente maggiore e un consumo di spazio sul die nemmeno confrontabile.
Quindi le sse, vmx ecc non sono sostituibili a prescindere da funzioni GPGPU perche poi a livello pratico possono essere piu sconvenienti in base a cosa devono eseguire
Il GPGPU ha ottime prestazioni solo con singola precisione. In doppia precisione le prestazioni si riducono ad 1/4.
come spiegato da coschizza, il gpgpu va bene solo in alcuni ambiti. Per il resto, il modello di programmazione delle gpu è troppo poco flessibile rispetto a quello delle cpu. Molto meglio avere una APU con cpu+gpu o cpu+fpu; in questo modo è possibile unire la potenza di calcolo di una unità fp dedicata con la flessibilità di una cpu. Al discorso flessibilità è legato anche quello relativo alla compatibilità. L'utilizzo di una gpu per calcoli gp obbliga al ricorso a middleware come CUDA, CAL o OpenCL
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".