Cum să verificați sănătatea discului pe Linux cu smartctl

12 min citire - 18 mai 2026

hero section cover
Cuprins
  • Cum se verifică starea discului pe Linux cu smartctl
  • Instalarea smartmontools
  • Identificarea unităților de stocare și activarea SMART
  • Efectuarea verificărilor de stare și a autotestelor
  • Atribute SMART cheie de urmărit
  • Automatizarea monitorizării cu smartd
Distribuie

Utilizați smartctl și smartd pentru a monitoriza starea unităților, pentru a rula teste SMART și pentru a configura alerte automate pe serverele Linux. Etichete: smartctl, smartmontools, SMART, sănătatea discurilor, Linux, monitorizarea serverelor, smartd, NVMe, SSD, HDD.

Cum se verifică starea discului pe Linux cu smartctl

smartctl este un instrument de linie de comandă pentru monitorizarea stării unităților de stocare pe Linux. Acesta citește datele S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology) de pe HDD-uri, SSD-uri și unități NVMe, urmărind indicatori precum sectoarele realocate, temperatura și numărul de erori. Dacă o unitate se îndreaptă spre defectare, smartctl vă oferă semne de avertizare înainte de a pierde date. Acest ghid acoperă instalarea, rularea verificărilor de stare și a autotestelor, înțelegerea atributelor cheie SMART și configurarea monitorizării automate cu smartd.


Instalarea smartmontools

smartctl face parte din pachetul smartmontools. Aveți nevoie de privilegii de root sau sudo pentru a-l instala și pentru a rula majoritatea smartctl comenzilor, deoarece acestea necesită acces direct la hardware.

DistribuțieComandă
Debian / Ubuntu / Linux Mintsudo apt update && sudo apt install smartmontools -y
CentOS / RHEL / Rocky / Alma (8+)sudo dnf install smartmontools -y
CentOS / RHEL 7 și versiuni mai vechisudo yum install smartmontools -y
Arch Linux / Manjarosudo pacman -S smartmontools
Fedorasudo dnf install smartmontools

Confirmați instalarea cu smartctl --version.

Identificarea unităților de stocare și activarea SMART

Înainte de a putea verifica ceva, trebuie să știți ce unități se află în serverul dvs. și dacă acestea acceptă SMART.

Listați toate dispozitivele bloc:

lsblk

Căutați unitățile compatibile cu SMART:

sudo smartctl --scan

Aceasta returnează numele dispozitivelor, tipurile și protocoalele (ATA, SCSI, NVMe). Unitățile SATA și SAS apar ca /dev/sda, /dev/sdb, etc. Unitățile NVMe apar ca /dev/nvme0n1, /dev/nvme1n1.

Verificați dacă SMART este disponibil și activat pe o unitate specifică:

sudo smartctl -i /dev/sda

Căutați „SMART support is: Available” și „SMART support is: Enabled” în rezultatul afișat. Dacă este disponibil, dar nu este activat, activați-l:

sudo smartctl -s on /dev/sda

Această setare se păstrează după repornire.

Pentru unitățile din spatele controlerelor RAID, utilizați -d indicatorul pentru a specifica tipul controlerului. Pentru MegaRAID: -d megaraid,N. Pentru HP Smart Array: -d cciss,N. Fără acest indicator, smartctl nu veți vedea unitățile fizice individuale.

Monitorizarea SMART nu este disponibilă pentru discurile virtuale din mediile VPS sau pentru majoritatea unităților flash USB. Stratul de virtualizare sau carcasa USB blochează accesul la telemetria hardware.

Efectuarea verificărilor de stare și a autotestelor

O verificare rapidă a stării interoghează firmware-ul unității pentru a detecta defecțiuni critice:

sudo smartctl -H /dev/sda

Un rezultat „PASSED” (Reușit) înseamnă că unitatea nu a atins pragul intern de defectare. Un rezultat „FAILED” (Eșuat) înseamnă că unitatea se va defecta în curând. Faceți imediat o copie de rezervă a datelor.

Pentru date SMART complete, inclusiv toate atributele și jurnalele de erori:

sudo smartctl -a /dev/sda

Autotesturile

smartctl pot rula trei tipuri de autotestare, toate în fundal, în timp ce sistemul rămâne operațional:

  • Test scurt (1-5 minute): verifică componentele electrice și mecanice. sudo smartctl -t short /dev/sda
  • Test lung (ore): scanează fiecare sector de pe unitate. sudo smartctl -t long /dev/sda
  • Test de transport (~5 minute): detectează deteriorările fizice cauzate de transport. sudo smartctl -t conveyance /dev/sda

Verificați timpul estimat de finalizare înainte de a începe un test lung:

sudo smartctl -c /dev/sda

Vizualizați rezultatele testului:

sudo smartctl -l selftest /dev/sda

Doriți să vedeți „Finalizat fără erori”. Dacă un test eșuează, rezultatul include LBA_of_first_error, care indică locul de pe disc unde se află deteriorarea.

Atribute SMART cheie de urmărit

Verificarea stării de funcționare (pass/fail) este utilă, dar limitată. O unitate poate raporta PASSED (trecut), în timp ce anumite atribute individuale prezintă tendințe negative. Acestea sunt cele mai importante:

  • Numărul de sectoare realocate (ID 5): sectoare defecte pe care unitatea le-a înlocuit cu altele de rezervă. Orice valoare diferită de zero înseamnă uzură fizică. Un singur sector realocat pe o unitate veche nu este neapărat urgent, dar o creștere a numărului este un avertisment clar.
  • Numărul actual de sectoare în așteptare (ID 197): sectoare pe care unitatea nu le-a putut citi sau scrie, așteptând să fie remapate. Dacă acest număr continuă să crească, unitatea se deteriorează.
  • Erorile incorectabile offline (ID 198): erori incorectabile găsite în timpul scanărilor de fundal. Indică deteriorarea suprafeței.
  • Număr de erori UDMA CRC (ID 199): Erori de transfer de date. Acest lucru indică de obicei un cablu SATA defect sau un conector slăbit, nu o unitate defectă. Verificați mai întâi cablurile.

Pentru unitățile SSD și NVMe, verificați în schimb „Spațiu disponibil” și „Procentaj utilizat”. Când „Procentaj utilizat” se apropie de 100%, unitatea a atins limita de rezistență la scriere.

Temperatura contează, de asemenea. HDD-urile devin nesigure la temperaturi peste 50 °C. SSD-urile pot tolera mai multă căldură, dar ar trebui să rămână sub 70 °C. Vizualizați toate atributele specifice furnizorului cu smartctl -A /dev/sdasau verificați eșecurile recente ale comenzilor cu smartctl -l error /dev/sda.

Automatizarea monitorizării cu smartd

Verificarea manuală a unităților este suficientă pentru diagnosticări punctuale. Pentru monitorizarea continuă, utilizați smartd, daemonul inclus în smartmontools. Acesta interoghează unitățile la fiecare 30 de minute în mod implicit și înregistrează modificările de atribute în syslog.

Editați fișierul de configurare la /etc/smartd.conf (sau /etc/smartmontools/smartd.conf pe RHEL/CentOS). În loc să vă bazați pe DEVICESCAN la detectarea automată a tuturor elementelor, enumerați unitățile în mod explicit. Astfel se evită blocările cauzate de dispozitive incompatibile.

Exemplu de configurare:

/dev/sda -a -m [email protected] -s (S/../.././02|L/../../6/03) -W 4,45,55
/dev/sdb -a -m [email protected] -n standby,q

Ce fac indicatorii:

  • -a: monitorizează toate atributele SMART
  • -m: trimite alerte prin e-mail în caz de eroare
  • -s: programează un test scurt zilnic la ora 2:00 AM și un test lung în fiecare sâmbătă la ora 3:00 AM
  • -W 4,45,55: înregistrează o variație de temperatură de 4 °C, avertizează la 45 °C, alertă critică la 55 °C
  • -n standby,q: omite interogarea unităților aflate în modul de așteptare pentru a evita pornirile inutile

Pentru unitățile din spatele controlerelor RAID, specificați tipul pentru fiecare unitate:

/dev/sda -d megaraid,0 -a -m [email protected]
/dev/sda -d megaraid,1 -a -m [email protected]

Activați și porniți serviciul:

sudo systemctl enable --now smartd

Pe sistemele bazate pe Debian, dezcomentați și start_smartd=yes în /etc/default/smartmontools.

Pentru a testa alertele prin e-mail, adăugați -M test la o linie de configurare, reporniți smartd, apoi eliminați-l. Reîncărcați modificările de configurare fără a reporni serviciul cu killall -HUP smartd.

Un test zilnic scurt durează 1-2 minute și detectează majoritatea defectelor superficiale. Un test săptămânal de durată acoperă fiecare sector. Combinat cu alertele prin e-mail, acest lucru vă oferă o avertizare timpurie fiabilă înainte ca unitatea să se defecteze complet.

background image
Serverul dvs. vă frânează creșterea?

V-ați săturat de implementări lente sau limite de lățime de bandă? FDC Servers oferă putere dedicată instantanee, acoperire globală și planuri flexibile construite pentru orice scară.

Actualizați acum

Blog

În prim plan săptămâna aceasta

Mai multe articole
Procese zombie în Linux: Găsire, eliminare, prevenire

Procese zombie în Linux: Găsire, eliminare, prevenire

Aflați cum să identificați, să eliminați și să preveniți procesele zombie în Linux. Comenzi, corecturi de cod și sfaturi de monitorizare pentru administratorii de servere.

15 min citire - 19 mai 2026

Lista de verificare pentru întărirea serverului Linux

15 min citire - 8 mai 2026

Mai multe articole
background image

Aveți întrebări sau aveți nevoie de o soluție personalizată?

icon

Opțiuni flexibile

icon

Acoperire globală

icon

Implementare instantanee

icon

Opțiuni flexibile

icon

Acoperire globală

icon

Implementare instantanee