AWS down negli USA. Impattate per più di due ore Burger King, Taco Bell, Delta Airlines e molte altre imprese
di Alberto Falchi, Vittorio Manti pubblicata il 14 Giugno 2023, alle 18:31 nel canale CloudI problemi si sono verificati nella region us-east-1, la più anziana di Amazon negli USA. Non è la prima volta che le infrastrutture AWS di quest'area mostrano problemi: era già capitato tre volte negli ultimi 3 anni. Il problema è stato risolto
Il 13 giugno i server della region Amazon US-East-1 di AWS hanno iniziato a dare seri problemi, che si sono riflessi a catena su numerosi servizi statunitensi. Il problema è già stato risolto, ma gli utenti USA per alcune ore non hanno avuto accesso a numerosi servizi. Per esempio, non era possibile ordinare online dalle app di McDonald, Burger King e Taco Bell, non era possibile accedere a siti come The Verge né ad alcuni servizi di Delta Airlines.
Cosa è successo alla Amazon US-East-1 di AWS?
Come riporta lo status update di AWS, i problemi sono iniziati all'12:08 PM del 13 giugno (Pacific Time). Il problema è stato definitivamente risolto alle 3:43 PM, poco di di due ore e mezza dai primi sintomi, e sono stati interessati numerosi servizi della piattaforma: Amazon WorkSpaces, EC2 Image Builder, Amazon Elastic Kubernetes Service, AWS Single Sign-On, AWS Lambda e molti altri.
Un avviso dell'azienda, diramato alle 12:36 spiega cosa è successo: "Abbiamo identificato la causa principale come un problema con AWS Lambda e stiamo lavorando attivamente per risolverlo. Per i clienti che cercano di accedere alla AWS Management Console, consigliamo di utilizzare un endpoint specifico della regione".
All'1:48, invece, è stato pubblicato questo ulteriore avviso: "Abbiamo rapidamente identificato la causa principale in un sottosistema responsabile della gestione della capacità per AWS Lambda, che ha generato problemi ai clienti direttamente (l'utilizzo delle API Gateway) e indirettamente".
AWS Lambda è un servizio di elaborazione serverless molto utilizzato in quanto consente di eseguire codice senza doversi occupare di mettere in piedi l'infrastruttura di server sottostante, che verrà configurata e gestita automaticamente.
AWS US-East-1, uno dei punti deboli di AWS
Il fatto che un'infrastruttura informatica smetta improvvisamente di funzionare correttamente non è qualcosa di inimmaginabile, anzi. Capita spesso che per svariati motivi i server degli hyperscaler mostrino qualche problema, ma nella maggior parte dei casi, l'impatto sui clienti e sugli utenti finali è molto limitato, e i down vengono risolti in tempi brevissimi, grazie anche ai sistemi di backup e disaster recovery che intervengono immediatamente per ripristinare almeno i servizi critici.
Questa volta, però, qualcosa è andato storto e per quasi tre ore molti clienti, anche di alto profilo, di AWS hanno visto i loro servizi impattati. Un evento improbabile? Nella realtà sì, nell'atto pratico no. Ma non si tratta di un problema della tecnologia cloud in sé: come sottolinea The Register, non è la prima volta che la region AWS US-East-1 fa le bizze. Era già successo a novembre 2020, settembre 2021 e dicembre 2021, anche se le cause erano differenti.
AWS US-East-1 è la regione più anziana dell'hyperscaler e, nonostante numerosi aggiornamenti, non riesce a garantire la stabilità che ci si aspetta. Un problema segnalato anche da Gartner, che sottolinea le criticità di questa region (nonostante abbia indicato AWS come Leader nel Magic Quadrant per 12 anni consecutivi).
Quello che è successo con AWS US-East-1 deve far riflettere, perché troppo spesso si da per scontato che il cloud e, in generale, i servizi IT funzionino sempre, a prescindere. Dobbiamo ricordare sempre che dietro ogni servizio cloud, da qualche parte, c’è un “pezzo di ferro”, un server fisico su cui, in un determinato istante, vengono ospitati i nostri dati e le nostre applicazioni. Le garanzie offerte dagli hyperscaler sono ai massimi livelli possibili, ma possono comunque accadere dei problemi che impattano direttamente sui servizi dei clienti, nonostante la ridondanza che sul cloud è sicuramente più robusta che in qualsiasi altro data center.
1 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infose cascava il server amazon/sky/DAZN italia era rivolta e tutti in piazza come sardine...
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".