Comment vérifier la santé d'un disque sous Linux avec smartctl

12 min de lecture - 18 mai 2026

hero section cover
Table des matières
  • Comment vérifier l'état de santé d'un disque sous Linux avec smartctl
  • L'installation de smartmontools
  • Identification des disques et activation de SMART
  • Exécution de contrôles d'intégrité et d'autotests
  • Principaux attributs SMART à surveiller
  • Automatisation de la surveillance avec smartd
Partager

Utilisez smartctl et smartd pour surveiller l'état des disques, exécuter des tests SMART et mettre en place des alertes automatisées sur les serveurs Linux. Tags : smartctl, smartmontools, SMART, santé des disques, Linux, surveillance des serveurs, smartd, NVMe, SSD, HDD.

Comment vérifier l'état de santé d'un disque sous Linux avec smartctl

smartctl est un outil en ligne de commande permettant de surveiller l'état des disques de stockage sous Linux. Il lit les données S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology) des disques durs, SSD et NVMe, en suivant des indicateurs tels que les secteurs réalloués, la température et le nombre d'erreurs. Si un disque est sur le point de tomber en panne, smartctl vous en avertit avant que vous ne perdiez des données. Ce guide couvre l'installation, l'exécution de contrôles d'état et d'autotests, la compréhension des attributs SMART clés et la configuration d'une surveillance automatisée avec smartd.


L'installation de smartmontools

smartctl fait partie du paquet smartmontools. Vous devez disposer des privilèges root ou sudo pour l'installer et pour exécuter la plupart des smartctl commandes, car celles-ci nécessitent un accès direct au matériel.

DistributionCommande
Debian / Ubuntu / Linux Mintsudo apt update && sudo apt install smartmontools -y
CentOS / RHEL / Rocky / Alma (8+)sudo dnf install smartmontools -y
CentOS / RHEL 7 et versions antérieuressudo yum install smartmontools -y
Arch Linux / Manjarosudo pacman -S smartmontools
Fedorasudo dnf install smartmontools

Vérifiez l'installation avec smartctl --version.

Identification des disques et activation de SMART

Avant de pouvoir vérifier quoi que ce soit, vous devez savoir quels disques se trouvent dans votre serveur et s'ils prennent en charge la technologie SMART.

Répertorier tous les périphériques blocs :

lsblk

Recherchez les disques compatibles SMART :

sudo smartctl --scan

Cela renvoie les noms, types et protocoles des périphériques (ATA, SCSI, NVMe). Les disques SATA et SAS apparaissent sous la forme /dev/sda, /dev/sdb, etc. Les disques NVMe apparaissent sous la forme /dev/nvme0n1, /dev/nvme1n1.

Vérifier si la technologie SMART est disponible et activée sur un disque spécifique :

sudo smartctl -i /dev/sda

Recherchez « SMART support is: Available » et « SMART support is: Enabled » dans la sortie. S'il est disponible mais pas activé, activez-le :

sudo smartctl -s on /dev/sda

Ce paramètre est conservé après les redémarrages.

Pour les disques derrière des contrôleurs RAID, utilisez le -d indicateur pour spécifier le type de contrôleur. Pour MegaRAID : -d megaraid,N. Pour HP Smart Array : -d cciss,N. Sans ce drapeau, smartctl les disques physiques individuels ne seront pas visibles.

La surveillance SMART n'est pas disponible pour les disques virtuels dans les environnements VPS ni pour la plupart des clés USB. La couche de virtualisation ou le boîtier USB bloque l'accès à la télémétrie matérielle.

Exécution de contrôles d'intégrité et d'autotests

Un contrôle de santé rapide interroge le micrologiciel du disque dur pour détecter les pannes critiques :

sudo smartctl -H /dev/sda

Un résultat « PASSED » signifie que le disque n'a pas atteint son seuil de défaillance interne. Un résultat « FAILED » signifie que le disque est sur le point de tomber en panne. Sauvegardez vos données immédiatement.

Pour obtenir les données SMART complètes, y compris tous les attributs et les journaux d'erreurs :

sudo smartctl -a /dev/sda

Les autotests

smartctl peuvent exécuter trois types d'autotests, tous en arrière-plan pendant que le système reste opérationnel :

  • Test court (1 à 5 minutes) : vérifie les composants électriques et mécaniques. sudo smartctl -t short /dev/sda
  • Test long (plusieurs heures) : analyse chaque secteur du disque. sudo smartctl -t long /dev/sda
  • Test de transport (~5 minutes) : détecte les dommages physiques liés au transport. sudo smartctl -t conveyance /dev/sda

Vérifiez la durée estimée avant de lancer un test long :

sudo smartctl -c /dev/sda

Afficher les résultats du test :

sudo smartctl -l selftest /dev/sda

Vous devez voir s'afficher « Terminé sans erreur ». Si un test échoue, le résultat inclut LBA_of_first_error, qui indique précisément où se trouve le dommage sur le disque.

Principaux attributs SMART à surveiller

Le contrôle d'intégrité de type « réussi/échoué » est utile mais limité. Un disque peut afficher « RÉUSSI » alors que certains attributs individuels présentent une tendance négative. Voici ceux qui importent le plus :

  • Nombre de secteurs réaffectés (ID 5) : secteurs défectueux que le disque a remplacés par des secteurs de réserve. Toute valeur non nulle indique une usure physique. Un seul secteur réaffecté sur un disque ancien n’est pas nécessairement urgent, mais une augmentation de ce nombre est un avertissement clair.
  • Nombre de secteurs en attente (ID 197) : Secteurs que le disque n'a pas pu lire ou écrire, en attente d'être remappés. Si ce nombre continue d'augmenter, le disque se détériore.
  • Erreurs irrécupérables hors ligne (ID 198) : erreurs irrécupérables détectées lors des analyses en arrière-plan. Indique des dommages à la surface.
  • Nombre d'erreurs CRC UDMA (ID 199) : erreurs de transfert de données. Cela indique généralement un câble SATA défectueux ou un connecteur mal branché, et non un disque en panne. Vérifiez d'abord vos câbles.

Pour les SSD et les disques NVMe, surveillez plutôt les champs « Espace de réserve disponible » et « Pourcentage utilisé ». Lorsque le « Pourcentage utilisé » approche les 100 %, le disque a atteint sa limite d'endurance en écriture.

La température est également importante. Les disques durs (HDD) deviennent peu fiables au-delà de 50 °C. Les SSD supportent mieux la chaleur, mais leur température doit rester inférieure à 70 °C. Consultez tous les attributs spécifiques au fabricant avec smartctl -A /dev/sda, ou vérifiez les échecs de commande récents avec smartctl -l error /dev/sda.

Automatisation de la surveillance avec smartd

La vérification manuelle des disques durs convient pour des diagnostics ponctuels. Pour une surveillance continue, utilisez smartd, le démon inclus dans smartmontools. Il interroge vos disques toutes les 30 minutes par défaut et consigne les modifications d'attributs dans syslog.

Modifiez le fichier de configuration situé à l'adresse /etc/smartd.conf (ou /etc/smartmontools/smartd.conf sur RHEL/CentOS). Plutôt que de vous fier à DEVICESCAN la détection automatique de tout, listez explicitement vos disques. Cela évite les blocages dus à des périphériques incompatibles.

Exemple de configuration :

/dev/sda -a -m [email protected] -s (S/../.././02|L/../../6/03) -W 4,45,55
/dev/sdb -a -m [email protected] -n standby,q

Fonction des indicateurs :

  • -a: surveiller tous les attributs SMART
  • -m: envoie des alertes par e-mail en cas de défaillance
  • -s: planifier un test court tous les jours à 2 h du matin et un test long tous les samedis à 3 h du matin
  • -W 4,45,55: enregistrer un écart de température de 4 °C, émettre un avertissement à 45 °C, déclencher une alerte critique à 55 °C
  • -n standby,q: ignorer l'interrogation des disques en mode veille pour éviter des démarrages inutiles

Pour les disques situés derrière des contrôleurs RAID, spécifiez le type par disque :

/dev/sda -d megaraid,0 -a -m [email protected]
/dev/sda -d megaraid,1 -a -m [email protected]

Activer et démarrer le service :

sudo systemctl enable --now smartd

Sur les systèmes basés sur Debian, décommentez également start_smartd=yes dans /etc/default/smartmontools.

Pour tester les alertes par e-mail, ajoutez -M test à une ligne de configuration, redémarrez smartd, puis supprimez-le. Rechargez les modifications de configuration sans redémarrer le service avec killall -HUP smartd.

Un test quotidien rapide prend 1 à 2 minutes et détecte la plupart des défauts superficiels. Un test hebdomadaire approfondi couvre tous les secteurs. Associé aux alertes par e-mail, cela vous offre une alerte précoce fiable avant qu’un disque ne tombe complètement en panne.

background image
Votre serveur freine-t-il votre croissance ?

Fatigué des déploiements lents ou des limites de bande passante ? FDC Servers offre une puissance dédiée instantanée, une portée mondiale et des plans flexibles conçus pour n'importe quelle échelle.

Mettre à jour maintenant

Blog

À l'honneur cette semaine

Plus d'articles
Processus zombies dans Linux : Trouver, supprimer, prévenir

Processus zombies dans Linux : Trouver, supprimer, prévenir

Apprenez à identifier, supprimer et prévenir les processus zombies sous Linux. Commandes, corrections de code et conseils de surveillance pour les administrateurs de serveurs.

15 min de lecture - 19 mai 2026

Liste de contrôle pour le durcissement des serveurs Linux

15 min de lecture - 8 mai 2026

Plus d'articles