Überprüfung des Festplattenzustands unter Linux mit smartctl
12 Min. Lesezeit - 18. Mai 2026

Verwenden Sie smartctl und smartd, um den Zustand von Laufwerken zu überwachen, SMART-Tests durchzuführen und automatische Warnungen auf Linux-Servern einzurichten. Tags: smartctl, smartmontools, SMART, Festplattenzustand, Linux, Serverüberwachung, smartd, NVMe, SSD, HDD.
So überprüfen Sie den Zustand von Festplatten unter Linux mit smartctl
smartctl ist ein Befehlszeilentool zur Überwachung des Zustands von Speicherlaufwerken unter Linux. Es liest S.M.A.R.T.-Daten (Self-Monitoring, Analysis, and Reporting Technology) von HDDs, SSDs und NVMe-Laufwerken aus und verfolgt Kennzahlen wie neu zugewiesene Sektoren, Temperatur und Fehleranzahl. Wenn ein Laufwerk kurz vor dem Ausfall steht, smartctl erhalten Sie Warnsignale, bevor Sie Daten verlieren. Dieser Leitfaden behandelt die Installation, die Durchführung von Zustandsprüfungen und Selbsttests, das Verständnis der wichtigsten SMART-Attribute sowie die Einrichtung einer automatisierten Überwachung mit smartd.
Die Installation von smartmontools
smartctl ist Teil des smartmontools-Pakets. Sie benötigen Root- oder Sudo-Rechte, um es zu installieren und die meisten smartctl Befehle auszuführen, da diese direkten Zugriff auf die Hardware erfordern.
| Verteilung | Befehl |
|---|---|
| Debian / Ubuntu / Linux Mint | sudo apt update && sudo apt install smartmontools -y |
| CentOS / RHEL / Rocky / Alma (8+) | sudo dnf install smartmontools -y |
| CentOS / RHEL 7 und älter | sudo yum install smartmontools -y |
| Arch Linux / Manjaro | sudo pacman -S smartmontools |
| Fedora | sudo dnf install smartmontools |
Bestätigen Sie die Installation mit smartctl --version.
Laufwerke identifizieren und SMART aktivieren
Bevor Sie irgendetwas überprüfen können, müssen Sie wissen, welche Laufwerke sich in Ihrem Server befinden und ob diese SMART unterstützen.
Alle Blockgeräte auflisten:
lsblkNach SMART-kompatiblen Laufwerken suchen:
sudo smartctl --scanDies gibt Gerätenamen, Typen und Protokolle (ATA, SCSI, NVMe) zurück. SATA- und SAS-Laufwerke werden als /dev/sda, /dev/sdbusw. NVMe-Laufwerke erscheinen als /dev/nvme0n1, /dev/nvme1n1.
Prüfen Sie, ob SMART auf einem bestimmten Laufwerk verfügbar und aktiviert ist:
sudo smartctl -i /dev/sdaSuchen Sie in der Ausgabe nach „SMART-Unterstützung ist: Verfügbar“ und „SMART-Unterstützung ist: Aktiviert“. Wenn es verfügbar, aber nicht aktiviert ist, schalten Sie es ein:
sudo smartctl -s on /dev/sdaDiese Einstellung bleibt auch nach einem Neustart erhalten.
Verwenden Sie für Laufwerke hinter RAID-Controllern das -d Flag, um den Controllertyp anzugeben. Für MegaRAID: -d megaraid,N. Für HP Smart Array: -d cciss,N. Ohne dieses Flag smartctl werden die einzelnen physischen Laufwerke nicht erkannt.
Die SMART-Überwachung ist für virtuelle Festplatten in VPS-Umgebungen oder für die meisten USB-Sticks nicht verfügbar. Die Virtualisierungsschicht oder das USB-Gehäuse blockiert den Zugriff auf die Hardware-Telemetrie.
Durchführung von Zustandsprüfungen und Selbsttests
Ein schneller Zustandscheck fragt die Firmware des Laufwerks auf kritische Fehler ab:
sudo smartctl -H /dev/sdaEin Ergebnis „PASSED“ bedeutet, dass das Laufwerk seinen internen Fehlerschwellenwert noch nicht erreicht hat. Ein Ergebnis „FAILED“ bedeutet, dass das Laufwerk voraussichtlich in Kürze ausfallen wird. Sichern Sie Ihre Daten unverzüglich.
Für vollständige SMART-Daten, einschließlich aller Attribute und Fehlerprotokolle:
sudo smartctl -a /dev/sdaSelbsttests
smartctl können drei Arten von Selbsttests ausführen, die alle im Hintergrund laufen, während das System betriebsbereit bleibt:
- Kurztest (1–5 Minuten): Überprüft elektrische und mechanische Komponenten.
sudo smartctl -t short /dev/sda - Langer Test (Stunden): Scannt jeden Sektor auf dem Laufwerk.
sudo smartctl -t long /dev/sda - Transporttest (~5 Minuten): Erkennt physische Schäden durch den Transport.
sudo smartctl -t conveyance /dev/sda
Überprüfen Sie die voraussichtliche Dauer, bevor Sie einen langen Test starten:
sudo smartctl -c /dev/sdaTestergebnisse anzeigen:
sudo smartctl -l selftest /dev/sdaSie sollten die Meldung „Ohne Fehler abgeschlossen“ sehen. Wenn ein Test fehlschlägt, enthält die Ausgabe LBA_of_first_error, was genau angibt, an welcher Stelle auf der Festplatte der Schaden liegt.
Wichtige SMART-Attribute, auf die zu achten ist
Der Pass/Fail-Zustandscheck ist nützlich, aber begrenzt. Ein Laufwerk kann „PASSED“ melden, während einzelne Attribute einen negativen Trend aufweisen. Dies sind die wichtigsten:
- Anzahl der neu zugewiesenen Sektoren (ID 5): Fehlerhafte Sektoren, die das Laufwerk durch Ersatzsektoren ersetzt hat. Jeder Wert ungleich Null deutet auf physischen Verschleiß hin. Ein einzelner neu zugewiesener Sektor auf einem alten Laufwerk ist nicht unbedingt ein Grund zur Eile, aber eine steigende Anzahl ist ein klares Warnsignal.
- Anzahl der derzeit ausstehenden Sektoren (ID 197): Sektoren, die das Laufwerk nicht lesen oder beschreiben konnte und die darauf warten, neu zugeordnet zu werden. Wenn diese Zahl weiter steigt, verschlechtert sich der Zustand des Laufwerks.
- Offline Uncorrectable (ID 198): Nicht korrigierbare Fehler, die bei Hintergrundscans gefunden wurden. Weist auf eine Beschädigung der Oberfläche hin.
- UDMA-CRC-Fehleranzahl (ID 199): Datenübertragungsfehler. Dies deutet in der Regel auf ein defektes SATA-Kabel oder einen lockeren Stecker hin, nicht auf ein ausfallendes Laufwerk. Überprüfen Sie zunächst Ihre Kabel.
Bei SSDs und NVMe-Laufwerken sollten Sie stattdessen die Werte für „Verfügbarer Speicherplatz“ und „Prozentualer Speicherverbrauch“ im Auge behalten. Wenn der prozentuale Speicherverbrauch sich 100 % nähert, hat das Laufwerk seine Schreiblebensdauergrenze erreicht.
Auch die Temperatur spielt eine Rolle. HDDs werden bei Temperaturen über 50 °C unzuverlässig. SSDs vertragen mehr Hitze, sollten aber unter 70 °C bleiben. Zeigen Sie alle herstellerspezifischen Attribute mit smartctl -A /dev/sdaoder überprüfen Sie aktuelle Befehlsfehler mit smartctl -l error /dev/sda.
Automatisierung der Überwachung mit smartd
Die manuelle Überprüfung von Laufwerken ist für einmalige Diagnosen ausreichend. Für die fortlaufende Überwachung verwenden Sie smartd, den in smartmontools enthaltenen Daemon. Er fragt Ihre Laufwerke standardmäßig alle 30 Minuten ab und protokolliert Attributänderungen in syslog.
Bearbeiten Sie die Konfigurationsdatei unter /etc/smartd.conf (oder /etc/smartmontools/smartd.conf unter RHEL/CentOS). Anstatt sich auf DEVICESCAN auf die automatische Erkennung aller Laufwerke zu verlassen, listen Sie Ihre Laufwerke explizit auf. Dies verhindert Abstürze durch inkompatible Geräte.
Beispielkonfiguration:
/dev/sda -a -m [email protected] -s (S/../.././02|L/../../6/03) -W 4,45,55
/dev/sdb -a -m [email protected] -n standby,qWas die Flags bewirken:
-a: alle SMART-Attribute überwachen-m: E-Mail-Benachrichtigungen bei Fehlern senden-s: Täglichen Kurztest um 2:00 Uhr und jeden Samstag um 3:00 Uhr einen Langtest planen-W 4,45,55: Protokollierung einer Temperaturänderung von 4 °C, Warnung bei 45 °C, kritischer Alarm bei 55 °C-n standby,q: Überspringen der Abfrage von Laufwerken im Standby-Modus, um unnötiges Hochfahren zu vermeiden
Für Laufwerke hinter RAID-Controllern geben Sie den Typ pro Laufwerk an:
/dev/sda -d megaraid,0 -a -m [email protected]
/dev/sda -d megaraid,1 -a -m [email protected]Den Dienst aktivieren und starten:
sudo systemctl enable --now smartdAuf Debian-basierten Systemen entfernen Sie außerdem die Auskommentierung start_smartd=yes ein /etc/default/smartmontools.
Um E-Mail-Benachrichtigungen zu testen, fügen Sie -M test zu einer Konfigurationszeile hinzu, starten Sie smartdund entfernen Sie es anschließend. Laden Sie Konfigurationsänderungen ohne Neustart des Dienstes mit killall -HUP smartd.
Ein kurzer täglicher Test dauert 1–2 Minuten und deckt die meisten oberflächlichen Fehler auf. Ein wöchentlicher Langzeittest deckt jeden Sektor ab. In Kombination mit E-Mail-Benachrichtigungen erhalten Sie so eine zuverlässige Frühwarnung, bevor eine Festplatte vollständig ausfällt.

Haben Sie genug von langsamen Bereitstellungen oder Bandbreitenbeschränkungen? FDC Servers bietet sofortige dedizierte Leistung, globale Reichweite und flexible Pläne, die für jede Größenordnung geeignet sind.
Jetzt aktualisieren
Zombie-Prozesse in Linux: Finden, Entfernen, Verhindern
Lernen Sie, wie Sie Zombie-Prozesse in Linux identifizieren, entfernen und verhindern können. Befehle, Codekorrekturen und Überwachungstipps für Serveradministratoren.
15 Min. Lesezeit - 19. Mai 2026
Checkliste für die Härtung von Linux-Servern
15 Min. Lesezeit - 8. Mai 2026

Haben Sie Fragen oder benötigen Sie eine individuelle Lösung?
Flexible Optionen
Globale Reichweite
Sofortige Bereitstellung
Flexible Optionen
Globale Reichweite
Sofortige Bereitstellung