Cómo comprobar el estado de los discos en Linux con smartctl

12 min de lectura - 18 de mayo de 2026

hero section cover
Tabla de contenidos
  • Cómo comprobar el estado del disco en Linux con smartctl
  • La instalación de smartmontools
  • Identificación de unidades y activación de SMART
  • Realización de comprobaciones de estado y autopruebas
  • Atributos SMART clave a tener en cuenta
  • Automatización de la supervisión con smartd
Compartir

Utilice smartctl y smartd para supervisar el estado de las unidades, ejecutar pruebas SMART y configurar alertas automáticas en servidores Linux. Etiquetas: smartctl, smartmontools, SMART, salud del disco, Linux, monitorización de servidores, smartd, NVMe, SSD, HDD.

Cómo comprobar el estado del disco en Linux con smartctl

smartctl es una herramienta de línea de comandos para supervisar el estado de las unidades de almacenamiento en Linux. Lee datos S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology) de discos duros, SSD y unidades NVMe, realizando un seguimiento de métricas como los sectores reasignados, la temperatura y el recuento de errores. Si una unidad está a punto de fallar, smartctl te da señales de advertencia antes de que pierdas datos. Esta guía cubre la instalación, la ejecución de comprobaciones de estado y autocomprobaciones, la comprensión de los atributos SMART clave y la configuración de la supervisión automatizada con smartd.


La instalación de smartmontools

smartctl forma parte del paquete smartmontools. Se necesitan privilegios de root o sudo para instalarlo y para ejecutar la mayoría de los smartctl comandos, ya que requieren acceso directo al hardware.

DistribuciónComando
Debian / Ubuntu / Linux Mintsudo apt update && sudo apt install smartmontools -y
CentOS / RHEL / Rocky / Alma (8+)sudo dnf install smartmontools -y
CentOS / RHEL 7 y versiones anterioressudo yum install smartmontools -y
Arch Linux / Manjarosudo pacman -S smartmontools
Fedorasudo dnf install smartmontools

Confirma la instalación con smartctl --version.

Identificación de unidades y activación de SMART

Antes de poder comprobar nada, es necesario saber qué unidades hay en el servidor y si son compatibles con SMART.

Enumerar todos los dispositivos de bloque:

lsblk

Buscar unidades compatibles con SMART:

sudo smartctl --scan

Esto devuelve los nombres de los dispositivos, los tipos y los protocolos (ATA, SCSI, NVMe). Las unidades SATA y SAS aparecen como /dev/sda, /dev/sdb, etc. Las unidades NVMe aparecen como /dev/nvme0n1, /dev/nvme1n1.

Comprueba si SMART está disponible y habilitado en una unidad específica:

sudo smartctl -i /dev/sda

Busque «SMART support is: Available» y «SMART support is: Enabled» en la salida. Si está disponible pero no activado, actívelo:

sudo smartctl -s on /dev/sda

Esta configuración se mantiene tras los reinicios.

Para unidades conectadas a controladores RAID, utilice el -d indicador para especificar el tipo de controlador. Para MegaRAID: -d megaraid,N. Para HP Smart Array: -d cciss,N. Sin este indicador, smartctl no se verán las unidades físicas individuales.

La supervisión SMART no está disponible para discos virtuales en entornos VPS ni para la mayoría de las unidades flash USB. La capa de virtualización o la carcasa USB bloquean el acceso a la telemetría del hardware.

Realización de comprobaciones de estado y autopruebas

Una comprobación rápida del estado consulta el firmware de la unidad en busca de fallos críticos:

sudo smartctl -H /dev/sda

Un resultado «PASSED» significa que la unidad no ha superado su umbral de fallo interno. Un resultado «FAILED» significa que se espera que la unidad falle de forma inminente. Haga una copia de seguridad de sus datos inmediatamente.

Para obtener datos SMART completos, incluidos todos los atributos y registros de errores:

sudo smartctl -a /dev/sda

Las autopruebas

smartctl pueden ejecutar tres tipos de autopruebas, todas en segundo plano mientras el sistema sigue operativo:

  • Prueba corta (1-5 minutos): comprueba los componentes eléctricos y mecánicos. sudo smartctl -t short /dev/sda
  • Prueba larga (varias horas): analiza todos los sectores de la unidad. sudo smartctl -t long /dev/sda
  • Prueba de transporte (~5 minutos): detecta daños físicos causados por el transporte. sudo smartctl -t conveyance /dev/sda

Comprueba el tiempo estimado de finalización antes de iniciar una prueba larga:

sudo smartctl -c /dev/sda

Ver los resultados de la prueba:

sudo smartctl -l selftest /dev/sda

Debe aparecer «Completado sin errores». Si una prueba falla, el resultado incluye LBA_of_first_error, que señala en qué parte del disco se encuentra el daño.

Atributos SMART clave a tener en cuenta

La comprobación de estado de «aprobado/suspendido» es útil, pero limitada. Una unidad puede indicar «APROBADO» aunque algunos atributos individuales muestren una tendencia negativa. Estos son los que más importan:

  • Recuento de sectores reasignados (ID 5): Sectores defectuosos que la unidad ha sustituido por otros de repuesto. Cualquier valor distinto de cero indica desgaste físico. Un solo sector reasignado en una unidad antigua no es necesariamente urgente, pero un recuento creciente es una clara señal de advertencia.
  • Recuento de sectores pendientes actuales (ID 197): Sectores que la unidad no ha podido leer o escribir, a la espera de ser reasignados. Si este recuento sigue aumentando, la unidad se está deteriorando.
  • Errores incorregibles fuera de línea (ID 198): Errores incorregibles detectados durante los análisis en segundo plano. Indica daños en la superficie.
  • Recuento de errores CRC UDMA (ID 199): Errores de transferencia de datos. Esto suele indicar un cable SATA defectuoso o un conector suelto, no una unidad averiada. Comprueba primero los cables.

En el caso de las unidades SSD y NVMe, preste atención a «Espacio libre disponible» y «Porcentaje utilizado». Cuando el «Porcentaje utilizado» se acerque al 100 %, la unidad habrá alcanzado su límite de resistencia a la escritura.

La temperatura también es importante. Los discos HDD dejan de ser fiables por encima de los 50 °C. Los SSD pueden tolerar más calor, pero deben mantenerse por debajo de los 70 °C. Consulte todos los atributos específicos del fabricante con smartctl -A /dev/sda, o comprueba los errores de comando recientes con smartctl -l error /dev/sda.

Automatización de la supervisión con smartd

Comprobar las unidades manualmente está bien para diagnósticos puntuales. Para una supervisión continua, utilice smartd, el demonio incluido en smartmontools. Por defecto, sondea sus unidades cada 30 minutos y registra los cambios de atributos en syslog.

Edite el archivo de configuración en /etc/smartd.conf (o /etc/smartmontools/smartd.conf en RHEL/CentOS). En lugar de confiar en DEVICESCAN la detección automática de todo, enumera tus unidades explícitamente. Esto evita bloqueos causados por dispositivos incompatibles.

Ejemplo de configuración:

/dev/sda -a -m [email protected] -s (S/../.././02|L/../../6/03) -W 4,45,55
/dev/sdb -a -m [email protected] -n standby,q

Función de los indicadores:

  • -a: supervisa todos los atributos SMART
  • -m: envía alertas por correo electrónico en caso de fallo
  • -s: programa una prueba corta diaria a las 2:00 a. m. y una prueba larga todos los sábados a las 3:00 a. m.
  • -W 4,45,55: registrar un cambio de temperatura de 4 °C, avisar a 45 °C y emitir una alerta crítica a 55 °C
  • -n standby,q: omitir el sondeo de unidades en modo de espera para evitar arranques innecesarios

Para las unidades conectadas a controladores RAID, especifique el tipo por unidad:

/dev/sda -d megaraid,0 -a -m [email protected]
/dev/sda -d megaraid,1 -a -m [email protected]

Habilitar e iniciar el servicio:

sudo systemctl enable --now smartd

En sistemas basados en Debian, descomente también start_smartd=yes en /etc/default/smartmontools.

Para probar las alertas por correo electrónico, añada -M test a una línea de configuración, reinicie smartdy, a continuación, elimínelo. Recargue los cambios de configuración sin reiniciar el servicio con killall -HUP smartd.

Una prueba diaria breve dura entre 1 y 2 minutos y detecta la mayoría de los defectos superficiales. Una prueba semanal más exhaustiva abarca todos los sectores. En combinación con las alertas por correo electrónico, esto le proporciona una alerta temprana fiable antes de que una unidad falle por completo.

background image
¿Su servidor está frenando su crecimiento?

¿Cansado de despliegues lentos o límites de ancho de banda? FDC Servers ofrece potencia dedicada instantánea, alcance global y planes flexibles diseñados para cualquier escala.

Actualizar ahora

Blog

Destacados de la semana

Más artículos
Procesos zombis en Linux: Encontrar, Eliminar, Prevenir

Procesos zombis en Linux: Encontrar, Eliminar, Prevenir

Aprenda a identificar, eliminar y prevenir procesos zombis en Linux. Comandos, correcciones de código y consejos de supervisión para administradores de servidores.

15 min de lectura - 19 de mayo de 2026

Lista de comprobación para el refuerzo de servidores Linux

15 min de lectura - 8 de mayo de 2026

Más artículos