Un peu sur SMART et les utilitaires de surveillance

Il y a beaucoup d'informations sur le net sur SMART et les valeurs d'attributs. Mais je n'ai pas rencontré de mention de plusieurs points importants que je connais de la part de personnes impliquées dans l'étude des médias.



Quand j'ai dit une fois de plus à un ami pourquoi les lectures SMART ne devaient pas faire confiance inconditionnellement et pourquoi il vaut mieux ne pas utiliser les «moniteurs SMART» classiques tout le temps, l'idée m'est venue d'écrire les mots prononcés sous la forme d'un ensemble de thèses avec des explications. Pour fournir des liens, au lieu de raconter à chaque fois. Et pour familiariser un large public.



1) Les programmes de surveillance automatique des attributs SMART doivent être utilisés avec grand soin.



Ce que vous appelez les attributs SMART n'est pas stocké par défaut, mais généré au moment où vous les demandez. Ils sont calculés sur la base des statistiques internes accumulées et utilisées par le micrologiciel du disque pendant le fonctionnement.



Certaines de ces données ne sont pas nécessaires à l'appareil pour fournir les fonctionnalités de base. Et il n'est pas stocké, mais généré chaque fois qu'il est nécessaire. Par conséquent, lorsqu'une demande d'attributs SMART se produit, le micrologiciel lance un grand nombre de processus nécessaires pour récupérer les données manquantes.



Mais ces processus sont mal compatibles avec les procédures effectuées lorsque le lecteur est chargé avec des opérations de lecture-écriture.



Dans un monde idéal, cela ne devrait conduire à aucun problème. Mais en réalité, les gens ordinaires écrivent des micrologiciels pour les disques durs. Ce qui peut être faux et faux. Par conséquent, si vous recherchez des attributs SMART pendant que l'appareil exécute activement des opérations de lecture / écriture, les chances que quelque chose ne va pas sont considérablement augmentées. Par exemple, les données d'un tampon de lecture ou d'écriture utilisateur seront corrompues.



La déclaration sur l'augmentation des risques n'est pas une conclusion théorique, mais une observation pratique. Par exemple, il existe un bogue connu qui s'est produit dans le micrologiciel du disque dur Samsung 103UI, où les données utilisateur ont été endommagées lors de l'exécution d'une demande d'attributs SMART.



Par conséquent, ne configurez pas la vérification automatique des attributs SMART. Sauf si vous savez avec certitude que la commande Flush Cache est émise avant cela. Ou, si vous ne pouvez pas vous en passer, configurez l'exécution de la vérification aussi rarement que possible. Dans de nombreux programmes de surveillance, le délai par défaut entre les analyses est d'environ 10 minutes. C'est trop courant. Quoi qu'il en soit, ces vérifications ne sont pas une panacée en cas de défaillance inattendue du disque (une panacée n'est que la redondance). Une fois par jour - je pense que c'est tout à fait suffisant.



La demande de température n'entraîne pas le démarrage des processus de calcul d'attribut et peut être effectuée fréquemment. Parce que si correctement mis en œuvre, cela se fait via le protocole SCT. Seul ce qui est déjà connu est donné par SCT. Ces données sont mises à jour automatiquement en arrière-plan.



2) Les données d'attributs SMART sont souvent peu fiables.



Le micrologiciel du disque dur vous montre ce qu'il juge bon, pas ce qui se passe réellement. L'exemple le plus évident est le 5e attribut, le nombre de secteurs réaffectés. Il est bien connu des spécialistes de la récupération de données qu'un disque dur peut afficher un nombre nul de réaffectations dans le cinquième attribut, malgré le fait qu'ils existent et continuent d'apparaître.



J'ai posé une question à un spécialiste qui étudie les disques durs et examine leur firmware. J'ai demandé quel est le principe par lequel le firmware de l'appareil décide qu'il est maintenant nécessaire de cacher le fait de réaffecter les secteurs, et maintenant vous pouvez en parler via les attributs SMART.



Il a répondu qu'il n'y a pas de règle générale selon laquelle les appareils affichent ou cachent l'image réelle. Et la logique des programmeurs qui écrivent des micrologiciels pour les disques durs semble parfois très étrange. En étudiant le firmware de différents modèles, il a vu que souvent la décision de "cacher ou montrer" est prise sur la base d'un ensemble de paramètres, qui ne sont généralement pas clairs comment ils sont liés les uns aux autres et à la ressource restante du disque dur.



3) L'interprétation des métriques SMART est spécifique au fournisseur.



Par exemple, sur Seagates, vous ne devez pas faire attention aux "mauvaises" valeurs brutes des attributs 1 et 7, alors que le reste est normal. Sur les disques de ce fabricant, leurs valeurs absolues peuvent augmenter lors d'une utilisation normale.



image



Pour évaluer l'état et la ressource résiduelle d'un disque dur, il est tout d'abord recommandé de faire attention aux paramètres 5, 196, 197, 198. De plus, il est logique de se concentrer sur les valeurs absolues, brutes (brutes), et non sur celles données. La conversion d'attributs peut être effectuée de manière non évidente, qui diffèrent selon les algorithmes et les micrologiciels.



En général, chez les spécialistes des supports d'information, lorsqu'ils parlent de la valeur d'un attribut, c'est généralement la valeur absolue qui est désignée.



All Articles