AWS

Addio NVIDIA: Amazon ha realizzato internamente il processore per l'IA di Alexa (e non solo)

di Alberto Falchi pubblicata il 17 Novembre 2020, alle 08:31 nel canale Innovazione

Il team di Amazon Alexa ha spostato i carichi di lavoro su nuove macchine basata sui processori AWS Inferentia: latenze ridotte del 20% e un costo inferiore del 30% rispetto ai calcoli eseguiti su GPU

AWS ha annunciato una novità relativa ad Alexa: l'azienda sta infatti migrando i calcoli relativi ai sevizi di text-to-speech dai server basati su GPU ad altri che invece si appoggiano al chip AWS Inferentia realizzati internamente. Il motivo? Poter contare su latenze più base e abbassare i costi.

AWS Inferentia, i chip sviluppati da Amazon per potenziare Alexa

I chip AWS Inferentia sono stati sviluppati da zero da AWS con l'obiettivo di ridurre drasticamente i costi senza scendere a compromessi con le prestazioni. A quanto dichiara AWS, sono in grado di incrementare la banda passante del 30% e ridurre i costi per inferenza del 45% rispetto alle GPU G4 usate in precedenza. La latenza dei nuovi chip, invece, è stata ridotta del 25%.

Un risultato notevole, che migliorerà l'esperienza di Alexa per tutti gli utenti, che ormai sono centinaia di milioni e che usano quotidianamente l'assistente vocale di Amazon per controllare la loro smart home, ottenere informazioni, ascoltare musica.

Non solo Alexa

Nonostante il chip AWS Inferentia sia stato concepito per accelerare i calcoli tipici dell'IA di Alexa, questo non è l'unico campo di applicazione. Un altro servizio che si appoggia su questi nuovi processori è Amazon Rekognition, che sfrutta il deep learning per semplificare l'identificazione di oggetti, persone, testi, così come per eseguire calcoli per il riconoscimento facciale. In questo specifico scenario di utilizzo, si ha un banda passante doppia rispetto a quella ottenibile con le GPU e una latenza di ben 8 volte inferiore. AWS non è l'unica a sfruttare i nuovi chip, che non sono disponibili sul commercio ma possono essere "affittati" come istanze Inf1 di Amazon EC2. Fra queste Snap Inc (che la integra per alcune funzioni di SnapChat) e Conde Nast, che la applica al suo motore di raccomandazioni, e che ha visto un costo per le inferenze inferiore del 72% rispetto alle istanze basate su GPU.

I migliori sconti su Amazon oggi

-30%

LEFANT M330Pro Robot Aspirapolvere Lavapavimenti con Mappatura, Navigazione dToF, Zona vietata, Evitamento ostacoli PSD, Aspirazione 5000Pa, 150 minuti, Pulizia programmata, Alexa/APP/WiFi,Nero

149.99 104.99€ Compra ora

-53%

Amazfit GTR 3, 46 mm, Smartwatch Orologio Intelligente Alexa Integrato, 150 modalità di Allenamento con GPS, AMOLED, Monitor del Sonno, 5 ATM Impermeabile, Durata Batteria di 21 Giorni, SpO2

149.90 69.90€ Compra ora

-20%

DJI Neo, mini drone con fotocamera UHD 4K per adulti, 135g drone che vola da solo e ti segue, decollo dalla mano, tracciamento del soggetto, QuickShot, video stabilizzati, (senza radiocomando)

199.00 159.00€ Compra ora

X-NAND, la velocità della memoria SLC con capacità e prezzo di una QLC

Alla lotteria degli scontrini si potrà partecipare anche con le spese sanitarie

lucusta17 Novembre 2020, 09:44 #1

comunque "G4" è l'istanza EC2 (HW virtuale configurabile secondo varie scelte prestazionali); la scheda HW è comunque una T4.

Stefano Landau17 Novembre 2020, 10:02 #2

Echo show è qualche mese che "Sente meglio" prima era quasi inutilizzabile

Oltre ad un echo, ho anche un echo show da 5 " che avendo meno microfoni del solo altoparlante per la musica era abbastanza sordo.... direi quasi inutilizzabile.
E' da qualche mese che ci sente stranamente bene....... e sicuramente i microfoni non sono aumentati....... potrebbe a questo punte essere grazie ad un miglioramento della piattaforma sottostante......
Echo invece ci ha sempre sentito abbastanza bene avendo tanti microfoni direzionali......, per cui li non ho notato differenze....

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

VIDEO IN EVIDENZA

TOPICS

tutti gli articoli »

tutte le news »

HP Elitebook Ultra G1i 14 è il notebook compatto, potente e robusto Pensato per il professionista sempre in movimento, HP Elitebook Ultra G1i 14 abbina una piattaforma Intel Core Ultra 7 ad una costruzione robusta, riuscendo a mantenere...

Samsung Galaxy S25 Edge: il top di gamma ultrasottile e leggerissimo. La recensione Abbiamo provato il nuovo Galaxy S25 Edge, uno smartphone unico per il suo spessore di soli 5,8 mm e un peso super piuma. Parliamo di un device che ha pro e contro,...

Dopo un mese, e 50 foto, cosa abbiamo capito della nuova Nintendo Switch 2 Dopo un mese di utilizzo intensivo e l'analisi di oltre 50 scatti, l'articolo offre una panoramica approfondita di Nintendo Switch 2. Vengono esaminate le caratteristiche...

Fujifilm X-E5: la Fuji X che tutti gli appassionati volevano Dopo il fascino un po’ elitario della GFX100RF e le polemiche intorno a x Half, la nuova Fujifilm X-E5 riporta tutti d’accordo: una mirrorless compatta, leggera,...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

HPE Discover 2025: tra agenti intelligenti, infrastruttura AI-native e un futuro ibrido Edge9 ha seguito da vicino HPE Discover 2025 con accesso esclusivo a keynote e interviste. Dalla Sphere di Las Vegas, la visione di un’infrastruttura AI-native e...

Nuova Ford Capri elettrica, la super prova: in viaggio, in città e in autostrada Dopo diverse prove, da poche ore al volante, fino a un'intera settimana come prima auto, possiamo riportarvi tutti i dettagli e le impressioni sulla Ford Capri elettrica...

Roborock Saros Z70: un braccio meccanico per fare ordine in casa Dotato di tutte le ultime innovazioni in tema di aspirazione della polvere e pulizia dei pavimenti di casa, Roborock Saros Z70 integra un braccio meccanico che promette...