Überprüfung des Festplattenzustands unter Linux mit smartctl

12 Min. Lesezeit - 18. Mai 2026

hero section cover
Inhaltsverzeichnis
  • So überprüfen Sie den Zustand von Festplatten unter Linux mit smartctl
  • Die Installation von smartmontools
  • Laufwerke identifizieren und SMART aktivieren
  • Durchführung von Zustandsprüfungen und Selbsttests
  • Wichtige SMART-Attribute, auf die zu achten ist
  • Automatisierung der Überwachung mit smartd
Teilen

Verwenden Sie smartctl und smartd, um den Zustand von Laufwerken zu überwachen, SMART-Tests durchzuführen und automatische Warnungen auf Linux-Servern einzurichten. Tags: smartctl, smartmontools, SMART, Festplattenzustand, Linux, Serverüberwachung, smartd, NVMe, SSD, HDD.

So überprüfen Sie den Zustand von Festplatten unter Linux mit smartctl

smartctl ist ein Befehlszeilentool zur Überwachung des Zustands von Speicherlaufwerken unter Linux. Es liest S.M.A.R.T.-Daten (Self-Monitoring, Analysis, and Reporting Technology) von HDDs, SSDs und NVMe-Laufwerken aus und verfolgt Kennzahlen wie neu zugewiesene Sektoren, Temperatur und Fehleranzahl. Wenn ein Laufwerk kurz vor dem Ausfall steht, smartctl erhalten Sie Warnsignale, bevor Sie Daten verlieren. Dieser Leitfaden behandelt die Installation, die Durchführung von Zustandsprüfungen und Selbsttests, das Verständnis der wichtigsten SMART-Attribute sowie die Einrichtung einer automatisierten Überwachung mit smartd.


Die Installation von smartmontools

smartctl ist Teil des smartmontools-Pakets. Sie benötigen Root- oder Sudo-Rechte, um es zu installieren und die meisten smartctl Befehle auszuführen, da diese direkten Zugriff auf die Hardware erfordern.

VerteilungBefehl
Debian / Ubuntu / Linux Mintsudo apt update && sudo apt install smartmontools -y
CentOS / RHEL / Rocky / Alma (8+)sudo dnf install smartmontools -y
CentOS / RHEL 7 und ältersudo yum install smartmontools -y
Arch Linux / Manjarosudo pacman -S smartmontools
Fedorasudo dnf install smartmontools

Bestätigen Sie die Installation mit smartctl --version.

Laufwerke identifizieren und SMART aktivieren

Bevor Sie irgendetwas überprüfen können, müssen Sie wissen, welche Laufwerke sich in Ihrem Server befinden und ob diese SMART unterstützen.

Alle Blockgeräte auflisten:

lsblk

Nach SMART-kompatiblen Laufwerken suchen:

sudo smartctl --scan

Dies gibt Gerätenamen, Typen und Protokolle (ATA, SCSI, NVMe) zurück. SATA- und SAS-Laufwerke werden als /dev/sda, /dev/sdbusw. NVMe-Laufwerke erscheinen als /dev/nvme0n1, /dev/nvme1n1.

Prüfen Sie, ob SMART auf einem bestimmten Laufwerk verfügbar und aktiviert ist:

sudo smartctl -i /dev/sda

Suchen Sie in der Ausgabe nach „SMART-Unterstützung ist: Verfügbar“ und „SMART-Unterstützung ist: Aktiviert“. Wenn es verfügbar, aber nicht aktiviert ist, schalten Sie es ein:

sudo smartctl -s on /dev/sda

Diese Einstellung bleibt auch nach einem Neustart erhalten.

Verwenden Sie für Laufwerke hinter RAID-Controllern das -d Flag, um den Controllertyp anzugeben. Für MegaRAID: -d megaraid,N. Für HP Smart Array: -d cciss,N. Ohne dieses Flag smartctl werden die einzelnen physischen Laufwerke nicht erkannt.

Die SMART-Überwachung ist für virtuelle Festplatten in VPS-Umgebungen oder für die meisten USB-Sticks nicht verfügbar. Die Virtualisierungsschicht oder das USB-Gehäuse blockiert den Zugriff auf die Hardware-Telemetrie.

Durchführung von Zustandsprüfungen und Selbsttests

Ein schneller Zustandscheck fragt die Firmware des Laufwerks auf kritische Fehler ab:

sudo smartctl -H /dev/sda

Ein Ergebnis „PASSED“ bedeutet, dass das Laufwerk seinen internen Fehlerschwellenwert noch nicht erreicht hat. Ein Ergebnis „FAILED“ bedeutet, dass das Laufwerk voraussichtlich in Kürze ausfallen wird. Sichern Sie Ihre Daten unverzüglich.

Für vollständige SMART-Daten, einschließlich aller Attribute und Fehlerprotokolle:

sudo smartctl -a /dev/sda

Selbsttests

smartctl können drei Arten von Selbsttests ausführen, die alle im Hintergrund laufen, während das System betriebsbereit bleibt:

  • Kurztest (1–5 Minuten): Überprüft elektrische und mechanische Komponenten. sudo smartctl -t short /dev/sda
  • Langer Test (Stunden): Scannt jeden Sektor auf dem Laufwerk. sudo smartctl -t long /dev/sda
  • Transporttest (~5 Minuten): Erkennt physische Schäden durch den Transport. sudo smartctl -t conveyance /dev/sda

Überprüfen Sie die voraussichtliche Dauer, bevor Sie einen langen Test starten:

sudo smartctl -c /dev/sda

Testergebnisse anzeigen:

sudo smartctl -l selftest /dev/sda

Sie sollten die Meldung „Ohne Fehler abgeschlossen“ sehen. Wenn ein Test fehlschlägt, enthält die Ausgabe LBA_of_first_error, was genau angibt, an welcher Stelle auf der Festplatte der Schaden liegt.

Wichtige SMART-Attribute, auf die zu achten ist

Der Pass/Fail-Zustandscheck ist nützlich, aber begrenzt. Ein Laufwerk kann „PASSED“ melden, während einzelne Attribute einen negativen Trend aufweisen. Dies sind die wichtigsten:

  • Anzahl der neu zugewiesenen Sektoren (ID 5): Fehlerhafte Sektoren, die das Laufwerk durch Ersatzsektoren ersetzt hat. Jeder Wert ungleich Null deutet auf physischen Verschleiß hin. Ein einzelner neu zugewiesener Sektor auf einem alten Laufwerk ist nicht unbedingt ein Grund zur Eile, aber eine steigende Anzahl ist ein klares Warnsignal.
  • Anzahl der derzeit ausstehenden Sektoren (ID 197): Sektoren, die das Laufwerk nicht lesen oder beschreiben konnte und die darauf warten, neu zugeordnet zu werden. Wenn diese Zahl weiter steigt, verschlechtert sich der Zustand des Laufwerks.
  • Offline Uncorrectable (ID 198): Nicht korrigierbare Fehler, die bei Hintergrundscans gefunden wurden. Weist auf eine Beschädigung der Oberfläche hin.
  • UDMA-CRC-Fehleranzahl (ID 199): Datenübertragungsfehler. Dies deutet in der Regel auf ein defektes SATA-Kabel oder einen lockeren Stecker hin, nicht auf ein ausfallendes Laufwerk. Überprüfen Sie zunächst Ihre Kabel.

Bei SSDs und NVMe-Laufwerken sollten Sie stattdessen die Werte für „Verfügbarer Speicherplatz“ und „Prozentualer Speicherverbrauch“ im Auge behalten. Wenn der prozentuale Speicherverbrauch sich 100 % nähert, hat das Laufwerk seine Schreiblebensdauergrenze erreicht.

Auch die Temperatur spielt eine Rolle. HDDs werden bei Temperaturen über 50 °C unzuverlässig. SSDs vertragen mehr Hitze, sollten aber unter 70 °C bleiben. Zeigen Sie alle herstellerspezifischen Attribute mit smartctl -A /dev/sdaoder überprüfen Sie aktuelle Befehlsfehler mit smartctl -l error /dev/sda.

Automatisierung der Überwachung mit smartd

Die manuelle Überprüfung von Laufwerken ist für einmalige Diagnosen ausreichend. Für die fortlaufende Überwachung verwenden Sie smartd, den in smartmontools enthaltenen Daemon. Er fragt Ihre Laufwerke standardmäßig alle 30 Minuten ab und protokolliert Attributänderungen in syslog.

Bearbeiten Sie die Konfigurationsdatei unter /etc/smartd.conf (oder /etc/smartmontools/smartd.conf unter RHEL/CentOS). Anstatt sich auf DEVICESCAN auf die automatische Erkennung aller Laufwerke zu verlassen, listen Sie Ihre Laufwerke explizit auf. Dies verhindert Abstürze durch inkompatible Geräte.

Beispielkonfiguration:

/dev/sda -a -m [email protected] -s (S/../.././02|L/../../6/03) -W 4,45,55
/dev/sdb -a -m [email protected] -n standby,q

Was die Flags bewirken:

  • -a: alle SMART-Attribute überwachen
  • -m: E-Mail-Benachrichtigungen bei Fehlern senden
  • -s: Täglichen Kurztest um 2:00 Uhr und jeden Samstag um 3:00 Uhr einen Langtest planen
  • -W 4,45,55: Protokollierung einer Temperaturänderung von 4 °C, Warnung bei 45 °C, kritischer Alarm bei 55 °C
  • -n standby,q: Überspringen der Abfrage von Laufwerken im Standby-Modus, um unnötiges Hochfahren zu vermeiden

Für Laufwerke hinter RAID-Controllern geben Sie den Typ pro Laufwerk an:

/dev/sda -d megaraid,0 -a -m [email protected]
/dev/sda -d megaraid,1 -a -m [email protected]

Den Dienst aktivieren und starten:

sudo systemctl enable --now smartd

Auf Debian-basierten Systemen entfernen Sie außerdem die Auskommentierung start_smartd=yes ein /etc/default/smartmontools.

Um E-Mail-Benachrichtigungen zu testen, fügen Sie -M test zu einer Konfigurationszeile hinzu, starten Sie smartdund entfernen Sie es anschließend. Laden Sie Konfigurationsänderungen ohne Neustart des Dienstes mit killall -HUP smartd.

Ein kurzer täglicher Test dauert 1–2 Minuten und deckt die meisten oberflächlichen Fehler auf. Ein wöchentlicher Langzeittest deckt jeden Sektor ab. In Kombination mit E-Mail-Benachrichtigungen erhalten Sie so eine zuverlässige Frühwarnung, bevor eine Festplatte vollständig ausfällt.

background image
Bremst Ihr Server Ihr Wachstum?

Haben Sie genug von langsamen Bereitstellungen oder Bandbreitenbeschränkungen? FDC Servers bietet sofortige dedizierte Leistung, globale Reichweite und flexible Pläne, die für jede Größenordnung geeignet sind.

Jetzt aktualisieren

Blog

Diese Woche im Blickpunkt

Weitere Artikel
Zombie-Prozesse in Linux: Finden, Entfernen, Verhindern

Zombie-Prozesse in Linux: Finden, Entfernen, Verhindern

Lernen Sie, wie Sie Zombie-Prozesse in Linux identifizieren, entfernen und verhindern können. Befehle, Codekorrekturen und Überwachungstipps für Serveradministratoren.

15 Min. Lesezeit - 19. Mai 2026

Checkliste für die Härtung von Linux-Servern

15 Min. Lesezeit - 8. Mai 2026

Weitere Artikel
background image

Haben Sie Fragen oder benötigen Sie eine individuelle Lösung?

icon

Flexible Optionen

icon

Globale Reichweite

icon

Sofortige Bereitstellung

icon

Flexible Optionen

icon

Globale Reichweite

icon

Sofortige Bereitstellung