Alcuni SSD di HPE muoiono dopo 32.768 ore: facciamo chiarezza (e ricordiamoci dei backup)

Alcuni SSD di HPE muoiono dopo 32.768 ore: facciamo chiarezza (e ricordiamoci dei backup)

Un nuovo problema con alcuni modelli di SSD di HPE ci ricorda quanto siano fondamentali i backup: dopo meno di 4 anni alcuni SSD smettono di funzionare per un problema al firmware (risolvibile con un aggiornamento)

di pubblicata il , alle 11:01 nel canale Device
HPE
 
18 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Slater9101 Dicembre 2019, 11:34 #11
Originariamente inviato da: Unrue
Ma in che modo veniva usato questo contatore? Della serie: arrivato al massimo muori?


Esatto. Il perché è presto spiegato: i numeri con segno (signed in inglese) usano un bit, solitamente il primo o l'ultimo a seconda dell'architettura, per rappresentare il fatto che il numero sia positivo o negativo. Il problema sta nel fatto che il numero può diventare talmente grande che per rappresentarlo bisogna mettere tutte le cifre a 1: in questo modo il numero diventa negativo!
Immagina ora che ci sia una logica interna al firmware di questo tipo:
[CODE]SE il numero di ore di attività è superiore a X ALLORA consiglia un controllo;
SE il numero di ore di attività è superiore a Y (maggiore di X) ALLORA consiglia la sostituzione[/CODE]
Immagina che sia un po' più complicata di così. A un certo punto le dai in pasto un numero negativo: questa logica semplicemente non è fatta per gestire numeri negativi, quindi banalmente si pianta e il disco non è più utilizzabile.
Burke01 Dicembre 2019, 12:24 #12
Curioso come 32.768 hz sia la frequenza di oscillazione dei cristalli di quarzo usati negli orologi...
Jack.Mauro01 Dicembre 2019, 18:09 #13
Originariamente inviato da: Burke
Curioso come 32.768 hz sia la frequenza di oscillazione dei cristalli di quarzo usati negli orologi...


Io non credo sia casuale la frequenza di 32768 Hz, ma che sia stata scelta proprio perché facilmente divisibile fino ad ottenere la frequenza di 1/2/4Hz molto precise:

Link ad immagine (click per visualizzarla)

https://www.electronicszone.it/test...koscillator.php
sbaffo02 Dicembre 2019, 00:59 #14
Originariamente inviato da: Redazione di Hardware Upgrade
Link alla notizia: https://edge9.hwupgrade.it/news/dev...ckup_85801.html

Un nuovo problema con alcuni modelli di SSD di HPE ci ricorda quanto siano fondamentali i backup: dopo meno di 4 anni alcuni SSD smettono di funzionare per un problema al firmware (risolvibile con un aggiornamento)

Click sul link per visualizzare la notizia.


Purché non fatti su altri SSD uguali, che muoiono nel giro di 15min uno dall’altro.... in quel caso sei fottuto comunque.

Non mi è chiaro perché una volta aggiornato il firmware i dati non siano recuperabili, non si è mica autodistrutto, solo non parte più, riparato il contatore può ripartire. O no?
Slater9102 Dicembre 2019, 09:04 #15
Originariamente inviato da: sbaffo
Purché non fatti su altri SSD uguali, che muoiono nel giro di 15min uno dall’altro.... in quel caso sei fottuto comunque.

Non mi è chiaro perché una volta aggiornato il firmware i dati non siano recuperabili, non si è mica autodistrutto, solo non parte più, riparato il contatore può ripartire. O no?


Una volta raggiunto il limite massimo il disco è morto. È da buttare. Non puoi aggiornare il firmware su un disco che abbia già raggiunto il massimo previsto dal contatore.
biffuz02 Dicembre 2019, 09:49 #16
Benvenuti nel mondo della programmazione. Tutti i vostri dati personali viaggiano su sistemi progettati così
E nel futuro sarà ancora peggio, gli stagisti che vedo oggi sono orgogliosi del loro JS che pensa che 2 + 2 faccia 3.9999999999, non so se mi spiego...
Unrue02 Dicembre 2019, 09:51 #17
Originariamente inviato da: Slater91
Esatto. Il perché è presto spiegato: i numeri con segno (signed in inglese) usano un bit, solitamente il primo o l'ultimo a seconda dell'architettura, per rappresentare il fatto che il numero sia positivo o negativo. Il problema sta nel fatto che il numero può diventare talmente grande che per rappresentarlo bisogna mettere tutte le cifre a 1: in questo modo il numero diventa negativo!
Immagina ora che ci sia una logica interna al firmware di questo tipo:
[CODE]SE il numero di ore di attività è superiore a X ALLORA consiglia un controllo;
SE il numero di ore di attività è superiore a Y (maggiore di X) ALLORA consiglia la sostituzione[/CODE]
Immagina che sia un po' più complicata di così. A un certo punto le dai in pasto un numero negativo: questa logica semplicemente non è fatta per gestire numeri negativi, quindi banalmente si pianta e il disco non è più utilizzabile.


Quindi l'errore è doppio: aver messo un numero solo a 16 bit e non aver inserito una gestione dell'errore dell'overflow.
Burke02 Dicembre 2019, 11:45 #18
Originariamente inviato da: Jack.Mauro
Io non credo sia casuale la frequenza di 32768 Hz, ma che sia stata scelta proprio

Si hai ragione, viene tagliato e preparato per vibrare proprio a quella frequenza.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^