Como verificar a integridade do disco no Linux com smartctl

12 min de leitura - 18 de maio de 2026

hero section cover
Índice
  • Como verificar o estado do disco no Linux com o smartctl
  • A instalação do smartmontools
  • Identificar unidades e ativar o SMART
  • Execução de verificações de integridade e autotestes
  • Principais atributos SMART a ter em conta
  • Automatizar a monitorização com o smartd
Partilhar

Utilize o smartctl e o smartd para monitorizar o estado da unidade, executar testes SMART e configurar alertas automáticos em servidores Linux. Tags: smartctl, smartmontools, SMART, saúde do disco, Linux, monitoramento de servidor, smartd, NVMe, SSD, HDD.

Como verificar o estado do disco no Linux com o smartctl

smartctl é uma ferramenta de linha de comandos para monitorizar o estado das unidades de armazenamento no Linux. Lê dados S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology) de discos rígidos (HDDs), SSDs e unidades NVMe, acompanhando métricas como setores realocados, temperatura e contagem de erros. Se uma unidade estiver a caminho de uma falha, smartctl o smartctl dá-lhe sinais de aviso antes de perder dados. Este guia abrange a instalação, a execução de verificações de integridade e autotestes, a compreensão dos principais atributos SMART e a configuração de monitorização automatizada com smartd.


A instalação do smartmontools

smartctl faz parte do pacote smartmontools. São necessários privilégios de root ou sudo para o instalar e para executar a maioria dos smartctl comandos, uma vez que estes requerem acesso direto ao hardware.

DistribuiçãoComando
Debian / Ubuntu / Linux Mintsudo apt update && sudo apt install smartmontools -y
CentOS / RHEL / Rocky / Alma (8+)sudo dnf install smartmontools -y
CentOS / RHEL 7 e versões anterioressudo yum install smartmontools -y
Arch Linux / Manjarosudo pacman -S smartmontools
Fedorasudo dnf install smartmontools

Confirme a instalação com smartctl --version.

Identificar unidades e ativar o SMART

Antes de verificar qualquer coisa, é necessário saber quais as unidades que se encontram no seu servidor e se suportam SMART.

Listar todos os dispositivos de bloco:

lsblk

Procure unidades compatíveis com SMART:

sudo smartctl --scan

Isto devolve nomes de dispositivos, tipos e protocolos (ATA, SCSI, NVMe). As unidades SATA e SAS aparecem como /dev/sda, /dev/sdb, etc. As unidades NVMe aparecem como /dev/nvme0n1, /dev/nvme1n1.

Verifique se o SMART está disponível e ativado numa unidade específica:

sudo smartctl -i /dev/sda

Procure por "Suporte SMART: Disponível" e "Suporte SMART: Ativado" na saída. Se estiver disponível, mas não ativado, ative-o:

sudo smartctl -s on /dev/sda

Esta configuração mantém-se após reinicializações.

Para unidades ligadas a controladores RAID, utilize o -d sinalizador para especificar o tipo de controlador. Para MegaRAID: -d megaraid,N. Para HP Smart Array: -d cciss,N. Sem este sinalizador, smartctl não será possível ver as unidades físicas individuais.

A monitorização SMART não está disponível para discos virtuais em ambientes VPS ou para a maioria das unidades flash USB. A camada de virtualização ou o invólucro USB bloqueia o acesso à telemetria do hardware.

Execução de verificações de integridade e autotestes

Uma verificação rápida de integridade consulta o firmware da unidade para detetar falhas críticas:

sudo smartctl -H /dev/sda

Um resultado «PASSED» significa que a unidade não atingiu o seu limiar de falha interna. Um resultado «FAILED» significa que a unidade deverá falhar em breve. Faça uma cópia de segurança dos seus dados imediatamente.

Para obter dados SMART completos, incluindo todos os atributos e registos de erros:

sudo smartctl -a /dev/sda

Os autotestes

smartctl podem executar três tipos de autoteste, todos em segundo plano enquanto o sistema permanece operacional:

  • Teste curto (1-5 minutos): verifica os componentes elétricos e mecânicos. sudo smartctl -t short /dev/sda
  • Teste longo (horas): analisa todos os setores da unidade. sudo smartctl -t long /dev/sda
  • Teste de transporte (~5 minutos): deteta danos físicos causados pelo transporte. sudo smartctl -t conveyance /dev/sda

Verifique o tempo estimado de conclusão antes de iniciar um teste longo:

sudo smartctl -c /dev/sda

Ver os resultados do teste:

sudo smartctl -l selftest /dev/sda

Deve ver «Concluído sem erros». Se um teste falhar, o resultado inclui LBA_of_first_error, o que indica exatamente onde se encontra o dano no disco.

Principais atributos SMART a ter em conta

A verificação de integridade de aprovação/reprovação é útil, mas limitada. Uma unidade pode apresentar o resultado APROVADO, mesmo que atributos individuais apresentem tendências negativas. Estes são os que mais importam:

  • Contagem de setores reatribuídos (ID 5): Setores defeituosos que a unidade substituiu por setores sobressalentes. Qualquer valor diferente de zero significa desgaste físico. Um único setor reatribuído numa unidade antiga não é necessariamente urgente, mas um aumento na contagem é um aviso claro.
  • Contagem de setores pendentes atuais (ID 197): Setores que a unidade não conseguiu ler ou gravar, à espera de serem remapeados. Se esta contagem continuar a subir, a unidade está a deteriorar-se.
  • Erros incorretáveis offline (ID 198): Erros incorretáveis encontrados durante análises em segundo plano. Indica danos na superfície.
  • Contagem de erros CRC UDMA (ID 199): Erros de transferência de dados. Isto geralmente indica um cabo SATA defeituoso ou um conector solto, e não uma unidade com falha. Verifique primeiro os seus cabos.

Para SSDs e unidades NVMe, observe em vez disso o Espaço livre disponível e a Percentagem utilizada. Quando a Percentagem utilizada se aproxima dos 100%, a unidade atingiu o seu limite de resistência à gravação.

A temperatura também é importante. Os HDDs tornam-se pouco fiáveis acima dos 50 °C. Os SSDs toleram mais calor, mas devem permanecer abaixo dos 70 °C. Veja todos os atributos específicos do fabricante com smartctl -A /dev/sda, ou verifique falhas recentes de comandos com smartctl -l error /dev/sda.

Automatizar a monitorização com o smartd

Verificar as unidades manualmente é adequado para diagnósticos pontuais. Para monitorização contínua, utilize smartd, o daemon incluído no smartmontools. Por predefinição, este consulta as suas unidades a cada 30 minutos e regista as alterações de atributos no syslog.

Edite o ficheiro de configuração em /etc/smartd.conf (ou /etc/smartmontools/smartd.conf no RHEL/CentOS). Em vez de confiar no DEVICESCAN na deteção automática de tudo, liste as suas unidades explicitamente. Isto evita bloqueios causados por dispositivos incompatíveis.

Exemplo de configuração:

/dev/sda -a -m [email protected] -s (S/../.././02|L/../../6/03) -W 4,45,55
/dev/sdb -a -m [email protected] -n standby,q

O que as opções fazem:

  • -a: monitorizar todos os atributos SMART
  • -m: enviar alertas por e-mail em caso de falha
  • -s: agendar um teste curto diariamente às 2h00 e um teste longo todos os sábados às 3h00
  • -W 4,45,55: registar uma variação de temperatura de 4 °C, emitir aviso aos 45 °C e alerta crítico aos 55 °C
  • -n standby,q: ignorar a sondagem de unidades em modo de espera para evitar ativações desnecessárias

Para unidades ligadas a controladores RAID, especifique o tipo por unidade:

/dev/sda -d megaraid,0 -a -m [email protected]
/dev/sda -d megaraid,1 -a -m [email protected]

Ative e inicie o serviço:

sudo systemctl enable --now smartd

Em sistemas baseados em Debian, remova também o comentário start_smartd=yes em /etc/default/smartmontools.

Para testar os alertas por e-mail, adicione -M test a uma linha de configuração, reinicie smartde, em seguida, remova-o. Recarregue as alterações de configuração sem reiniciar o serviço com killall -HUP smartd.

Um teste diário rápido demora 1 a 2 minutos e deteta a maioria dos defeitos superficiais. Um teste semanal mais demorado abrange todos os setores. Em combinação com os alertas por e-mail, isto proporciona-lhe um aviso precoce fiável antes de uma unidade falhar completamente.

background image
O seu servidor está a travar o seu crescimento?

Cansado de implementações lentas ou limites de largura de banda? A FDC Servers oferece potência dedicada instantânea, alcance global e planos flexíveis criados para qualquer escala.

Atualizar agora

Blogue

Em destaque esta semana

Mais artigos
Processos Zombie em Linux: Localizar, Remover, Prevenir

Processos Zombie em Linux: Localizar, Remover, Prevenir

Saiba como identificar, remover e evitar processos zombie no Linux. Comandos, correcções de código e dicas de monitorização para administradores de servidores.

15 min de leitura - 19 de maio de 2026

Lista de verificação de endurecimento do servidor Linux

15 min de leitura - 8 de maio de 2026

Mais artigos