Trotz aller getroffenen Data-Loss-Präventionen kann es passieren, dass dennoch ein Serverausfall eintritt oder ein Speichersystem seine Datenkonsistenz verliert. Daten- und Speichertechnische Redundanzen garantieren nicht immer die erhofften Ausfallsicherheiten.
Für die Datenrettung von RAID oder NAS-Systemen werden nicht nur allein umfangreiche Kenntnisse über die einzelnen Konfigurationsmöglichkeiten des Arrays oder Laufwerksverbunds benötigt, sondern darüber hinaus auch noch ein sehr breites und professionelles Expertenwissen über die einzelnen Dateisysteme, die in solchen Systemen zur Anwendung kommen können. Unser Service zur Datenwiederherstellung ausgefallener NAS / SAN und Server-Systeme beschäftigt sich nicht nur ausschließlich mit der logischen, sondern insbesondere auch mit der physikalischen Rettung defekter Festplatten eines RAID-Verbund / Arrays.
Situativ betrachtet ist es ratsam von jedem Datenwiederherstellungsversuch an einem RAID oder NAS / SAN Abstand zu nehmen und in Kontakt zu einem Rettungsunternehmen zu treten. Hier erhalten Sie die entsprechende Beratung und Informationen zur besten Vorgehensweise um die Chancen der Wiederherstellung Ihres redundanten Laufwerksverbunds bestmöglichst aufrecht zu erhalten.
Das Wiederherstellen verlorener Daten bzw. das Rebuild von RAID-Systemen sollte grundsätzlich nur an sektorbasierten Kopien jedes einzelnen Laufwerks als Verbund-Bestandteil versucht werden. Nur so ist gewährleistet, dass Sie den Originalzustand nach Ausfall eines solchen Systems nicht versehentlich verfälschen oder so maßgeblich beeinflussen, dass eine Rettung durch ein Labor nicht mehr möglich ist. Denn jeder Schreibzugriff ist ein physischer Eingriff in die Dateistruktur Ihres RAIDs, die schlimmsten Falles zu irreversiblen Schäden führen können.
Durch die Vielzahl von RAID-Typen (Hardware-RAID oder Software-RAID) und Leveln (z. B. RAID 0, RAID 1, RAID 5, RAID 6) als auch unterschiedlichsten Virtualisierungsgrade sind die möglichen Ausfallszenarien vielfältig.
Typische Ausfallsymptome sind
1) RAID ist offline, Rebuild-Abbruch nach Ausfall einer weiteren Festplatte
Was ist zu tun, wenn während eines Rebuild eine weitere Platte plötzlich ausfällt? Ursächlich hierfür können Defekte an einzelnen Festplatten und Folgefehler in der RAID-Konfiguration sein.
Fällt eine Festplatte in dem RAID-Verbund aus, geht bei den gängigen RAID-Leveln die Redundanz verloren, dabei liegt in den meisten Fällen eine ernsthafte Beschädigung vor.
Wenn beim RAID-5, RAID-6, RAID-10 und ähnlichen RAID-Leveln eine Fehlermeldung wie z.B. drive missing oder disk failed erscheint gibt es, aufgrund der Redundanz dieser Systeme, die Möglichkeit die defekte Festplatte durch eine neue zu ersetzen und ein Rebuild zu starten. Je nach Konfiguration kann dieser Prozess mit oder ohne Hotspare-Festplatte erfolgen. Beim Rebuild kopiert das RAID-Array mittels bestimmter RAID-Algorithmen und Paritätsdaten die Daten der defekten Festplatte auf ein neues Laufwerk oder auf eine Hotspare-Disk. Bei diesem Prozess werden alle Festplatten des RAID Verbundes aber stark beansprucht, daher ist es nicht selten, dass während des Rebuilds eine oder sogar mehrere weitere Festplatten ausfallen.
2) RAID / NAS Ausfall nach Serverneustart
Die RAID-Technologie soll die Ausfallsicherheit und die Leistung von Festplatten-Systemen erhöhen. Doch auch bei einem RAID System kann ein Datenverlust passieren. Fehlermeldungen wie RAID offline, RAID critical, RAID SUB-OPTIMAL, drive missing, disk failed sind nicht selten und deuten auf ein schwerwiegendes Problem hin.
Die Ursache kann eine oder bereits mehrere defekte Festplatten in dem RAID oder NAS sein. Möglich ist auch der Ausfall der RAID-Controllers.
In manchen Fällen und bei kleineren RAID Konfigurationen oder NAS mit einer einzelnen Festplatte ist überhaupt kein Zugriff möglich und lediglich die Status LED der NAS rot/grün abwechselnd blinkt.
Auf keinen Fall soll in solchem Fall die Reset-Taste an dem NAS-Gehäuse betätigt werden, diese dient dem Zurücksetzen des NAS auf Werkseinstellungen zwecks Neuinstallation des Betriebssystems. Dabei gehen die Daten verloren.
3) Spannungsspitzen, Stromausfall
Nach einem Stromausfall oder Überspannung ist ein Kurzschluss nur eine der vielen möglichen Folgen.
Die modernen Systeme sind vor einer Überspannung eigentlich gut geschützt, vor allem bei den NAS RAID Systemen sorgen die CPU- oder USV-Geräte dafür, dass die Hardware keinen Schaden erleidet.
Für NAS- und RAID-Arrays sollte nach Möglichkeit ein eigener Stromkreis genutzt werden.
Doch immer wieder kommt es vor, dass nach einer Spannungsspitze oder Stromausfall Probleme auftreten. Bei einem solchen Szenario kommt es immer darauf an, zu welchem „ungünstigen“ Zeitpunkt es passiert.
War das System währenddessen im Betrieb, können sowohl gravierende mechanische als auch logische Defekte am Array oder dem NAS auftreten. Nach einem Neustart des Systems die IP Adresse, zum Beispiel nicht korrekt zugeordnet werden, oder das NAS wird nicht mehr gefunden. Bei RAID Systemen kann zudem durch das abrupte Abschalten die Konfiguration beschädigt werden. Auch den Klassiker, Blitzschlag führt nicht selten dazu, dass Ausfälle von Laufwerken und anderen Komponenten sich nicht unabhängig voneinander ereignen. Die durch einen Blitzeinschlag verursachten Überspannungen erhöhen die Ausfallwahrscheinlichkeit des gesamten Verbundes schlagartig.
4) Defekter RAID Controller im Server (oder Ausfall nach Firmware Update)
Nicht immer reicht ein Firmware-Update des RAID-Controllers und die Installation neuer Treiber aus, um das RAID-System nach solchem Fehler wieder in Betrieb zu nehmen. Nach dem typischen Reboot blinken die Status LED der NAS rot/grün abwechselnd.
Fällt der Controller ganz aus oder wird das Dateisystem durch einen Controller defekt korrumpiert, ohne dass dies unmittelbar bemerkt wird, ist danach ein Zugriff auf die Startpartition begrenzt, die Datenpartition gar nicht einsehbar.
Ein Hardware-RAID-Controller ist ein physischer Controller, der als Hardware-Bauteil in den Server eingebaut ist. Dieser Controller besitzt für die Berechnung der RAID-Operationen einen eigenen Prozessor, der den Speicherplatz organisiert und verwaltet.
Den RAID-Controller einfach zu ersetzen, ohne Daten zu verlieren, ist daher unmöglich. Der neue Controller wird auf den Inhalt des bisherigen RAID-Verbundes nicht zugreifen können.
QNAP-NAS-Server sind eine häufig verwendete Speicherlösung. Vom Hersteller werden regelmäßig neue Firmware-Updates angeboten. Auch wenn das Firmware-Update zu verbesserten Systemeigenschaften durch die Behebung von ggf. vorhandenen Fehlern (Bugs) und das Hinzufügen von neuen Funktionen bei RAID und NAS führen soll, kommt es vor, dass ein Update fehlschlägt.
Die Ursachen können verschieden sein: Ein fehlendes Softwarepaket oder Dienstprogramm, welches hätte zusätzlich installiert werden müssen.
Manchmal reicht es nicht, den Anweisungen des Herstellers zu folgen, um Fehler zu beheben. Im schlimmsten Fall wird das Gerät sogar zurückgesetzt.
5) Nach Ausführung von chkdsk, fsck ist kein Zugriff auf die Daten mehr möglich
Bei Windows basierten Systemen ist der CHKDSK und bei Linux basierten Systemen das FSCK ein Werkzeug, um die Integrität des Dateisystems zu überprüfen und Fehler zu beheben. Dabei prüft und repariert CHKDSK / FSCK verlorene Zuordnungseinheiten (Cluster) sowie fehlerhafte Verzeichniseinträge.
Unter bestimmten Umständen kann das Dateisystem eines RAID oder NAS beschädigt sein und damit der Zugriff auf die Daten eingeschränkt wird. Dies kann dazu führen, dass Warnmeldungen angezeigt werden oder dass sich das System „seltsam“ verhält, z.B. wenn Prozesse abstürzen und Software nicht mehr startet.
Können Fehler nicht behoben werden, etwa aufgrund von defekten Sektoren einzelner Festplatten, ist nicht selten eine Beschädigung an der Dateisystemstruktur die Folge und die logische Integrität eines Dateisystems nicht mehr gegeben.
Daher gilt es bei Fehlermeldungen diese Dateisystemüberprüfungen zu vermeiden, da diese bei einem anschließenden Neustart des Storage zu Folge haben kann, dass der Verbund logische Schäden aufweist.
6) RAID-Konfiguration sind verloren oder Daten, Verzeichnisse gelöscht
Datenverluste, die aufgrund fälschlicher Initialisierung des RAID-Systems, verlorenen Konfigurationen oder falsch erfolgter Paritätsberechnung entstehen, sind nicht selten. Die meisten Fehler passieren während der RAID-Verwaltungsprozessen.
Die Systeme bieten unzählige Möglichkeiten, z.B. eine Kapazitätserweiterung, durch Hinzufügen weiterer Festplatten, Spares oder regelmäßiger Erneuerung der eingebauten Datenträger.
Bei NAS- Systemen können Freigaben für einzelne oder mehrere Nutzergruppen geändert werden. Alle diese Vorgänge erfolgen nicht automatisch, sondern werden von Nutzern oder Administratoren ausgeführt. Nicht immer läuft alles nach Plan.
Nach dem Neustart erscheint plötzlich „no operating system found“. Ein falsches RAID-Level wurde eingerichtet oder aber Daten, Verzeichnisse oder Freigaben werden versehentlich gelöscht. Es sind nur einige den möglichen Szenarien.
Bei allen logischen Fehlern an RAID Systemen ist das richtige Verhalten maßgeblich, da es sich hier um komplexe Systeme handelt, kann jeder Selbstversuch schwerwiegende Folgen haben. Weitere Beschädigungen an der Dateisystemstruktur können die logische Integrität eines Dateisystems zerstören. Zudem geben Betriebssysteme wie Linux alle gelöschten »Inodes«, also Dateisystem-Einträge, zur sofortigen Nutzung wieder frei.
Von welchen Herstellern retten und rekonstruieren wir die Daten?
Wir retten RAID- und NAS-Konfigurationen aller Hersteller und verfügen über eine jahrzehntelange Expertise in diesem Bereich. Diese Erfahrung beinhaltet nicht nur die einzelnen Level des jeweiligen RAIDs, sondern auch die hierauf verwandten unterschiedlich eingesetzten Dateisysteme.
Zu den Herstellern von RAID- / NAS- und Server-Systemen bei denen wir sehr häufig zur Wiederherstellung und Reparatur konsultiert werden zählen u.a.:
- Buffalo Technologies (Linkstation / Terastation, etc.)
- Western Digital
- Seagate
- Dell / EMC
- Fujitsu
- Hitachi
- HP
- IBM
- Netgear
- Netapp
- Qnap
- Synology sowie Zyxel
- und viele weitere
Bevor wir mit der Rettung Ihres RAID- oder NAS-Systems beginnen, führen wir zunächst eine Analyse / Fehlerbegutachtung des beschädigten Speichersystems durch. So ermitteln wir den benötigten Aufwand, um Ihre Daten zu retten und senden Ihnen Ihr individuelles Angebot per E-Mail zu.