Gibt es kein Raid, das Bitstürze erkennt?
Geizhals » Forum » Hardware-Allgemein » Gibt es kein Raid, das Bitstürze erkennt? (23 Beiträge, 665 Mal gelesen) Top-100 | Fresh-100
Du bist nicht angemeldet. [ Login/Registrieren ]
Gibt es kein Raid, das Bitstürze erkennt?
31.10.2016, 07:49:25
Ich habe gelegentlich korrupte Dateien.

Problem 1:

Dies merke ich oft zu spät, sodaß auch das Backup bereits beschädigt ist.

Somit suche ich eine automatisierte Lösung, die

- mehrere Festplatten abgleicht (mindestens 3), idealerweise ohne Paritätsbitberechnung
- BEI FEHLERN DIE MEHRHEIT DER PLATTEN ENTSCHEIDEN LÄSST
- das Bit auf der fehlerhaften Platte korrigiert
- wie bei S.M.A.R.T. die Durchführung der Korrektur auf der fehlerhaften Platte hinterlegt
- bei zu vielen Fehlern zum Austauschen der Platte auffordert.

Soweit ich mich informiert habe, gibt es diese Lösung nicht.

Raid 1 arbeitet nur mit zwei Platten und kann somit nur Lesefehler ausgleichen, aber bei Unstimmigkeiten der Bits ist es ratlos und gibt bestenfalls eine Fehlermeldung aus. Was ja schon einmal besser als nichts wäre.

Alle anderen Raid Levels arbeiten nur mit Paritätsbits und werden dadurch zwar schneller im Dateizugriff, worauf ich pfeife, machen aber andererseits keinen multiplen Abgleich der Daten und können somit Bitstürze genauso wenig korrigieren.

Was brauche ich? ?-)

a) Entweder eine Raid-Lösung, die eben aufgrund der obigen Vorgaben Bitstürze findet und korrigiert
b) Wenn es das nicht gibt, eine Software-Lösung, die beschädigte Videodateien wieder so weit korrigiert, dass sie wieder abspielbar sind (wie beim digitalen Bändern, da gehen ja auch höchstens einige Frames verloren).

Ich glaube, dass dieses Thema eigentlich nicht nur mich trifft, sondern eigentlich alle und warte auf eine rege, konstruktive Beteiligung. |-D

31.10.2016, 07:52 Uhr - Editiert von Michael, alte Version: hier
Antworten PM Übersicht Chronologisch
 
Melden nicht möglich
.
Re: Gibt es kein Raid, das Bitstürze erkennt?
31.10.2016, 13:02:33
  Wenn es das nicht gibt, eine Software-Lösung, die beschädigte Videodateien
wieder so weit korrigiert, dass sie wieder abspielbar sind (wie beim digitalen
Bändern, da gehen ja auch höchstens einige Frames verloren).

falls du mit "digitalen Bändern" miniDV u.ä. meinst: die haben den netten Vorteil, daß eben jeder Frame genau eine Schrägspur = 1 Block fixer Länge (fix quantisiert oder mit Padding) ist, der Anfang des nächsten Frames also genau bekannt ist. Bei VBR-Codierung mit wenig "sync-Daten" stolpert der Codec eben weiter, bis er wieder was verarbeitungsfähiges findet.

Geht es dir also um deine Videosammlung zum Ansehen oder um Rohmaterial zum Schneiden?

Wie schon oben wer gepostet hat: Formate, die Daten um soundsoviel % aufblasen (um Reed-Solomon-Codes oder vergleichbares) gibt es,mit entsprechend berechenbarer Korrekturkapazität, aber ein Filesystem, das sowas transparent macht, ist mir noch nicht untergekommen, obwohl es mit FUSE eine interessante Anwendung wäre (gibt es (mit Einschränkung auf Lesen) ja auch für .tar und .zip).


(Der Trend geht aber in Richtung transparenter Kompression am _potenten_ NAS/Fileserver (was bei hoher Rate trotz RAID netto tatsächlich weniger sein kann), nur: die hilft bei Multimedia genau nix.)

Aber vielleicht hilft dir das ja, falls ein ZFS-basiertes NAS (wie FreeNAS/TrueOS oder Fileserver mit aktueller Debian+ZFS) dir nicht in's Konzept paßt: https://en.wikipedia.org/wiki/Parchive

Antworten PM Übersicht Chronologisch Zum Vorgänger
 
Melden nicht möglich
.
Re: Gibt es kein Raid, das Bitstürze erkennt?
01.11.2016, 11:55:47
Dies merke ich oft zu spät, sodaß auch das Backup bereits beschädigt ist.


Hebst du bei deinem Backup nicht ältere Versionen eine Weile auf?

Leute rümpfen ja gerne die Nase über Backups auf optischen Medien weil die verfaulen würden... aber das schöne an denen ist, einmal geschrieben, überschreibt man sie nicht mehr, und sie überleben Blitzschlag, solange die Bude davon nicht abbrennt.

bei Unstimmigkeiten der Bits ist es ratlos


Unstimmigkeiten bei Bits gibt es eigentlich nicht. Dafür sorgen die Festplatten selber, die für jeden Sektor eine Prüfsumme haben. Und beim Umstieg auf 4K Sektoren ist dieses System nochmal verbessert worden. Wenn da ein Bit kippt dann werden nicht falsche Daten zurückgeliefert sondern Lesefehler.

Die Frage ist also, wo kommt deine Korruption eigentlich her? Wenn dein RAM futsch ist oder eine Software einen Bug hat und schon kaputte Dateien schreibt, dann hilft dir keine Storage und kein Dateisystem der Welt, die ZFS/BTRFS werden dann eben Prüfsummen von den kaputten Daten führen.

Mal davon abgesehen, daß sich ein echter Bitfehler, z.B. in einem JPEG Bild, ohne weiteres korrigieren ließe. Ein einzelnes geflipptes Bit könnte man problemlos wieder zurück-flippen. Aber so sieht die Datenkorruption halt eben in der Praxis niemals aus, da liegt der Hase woanders im Pfeffer.

Der häufigste Fehler bei RAID ist daß die Festplattenüberwachung fehlt. Lesefehler können über Jahre unentdeckt bleiben, und bis das RAID dann anfängt eine Platte rauszuwerfen, ist es schon zu spät. Regelmäßige Lesetests machen und bei Fehlern (Reallocated/Pending/Uncorrectable Sectors in SMART usw.) auch in den sauren Apfel beissen und den Müll austauschen.

RAID kann zwar keine Bitfehler korrigieren, aber RAID kann abgleichen ob die Spiegelung / die Parität zu den Daten passt. Unter Linux mdadm ist das RAID check und danach schauen ob `cat /sys/block/md42/md/mismatch_cnt` gleich 0 ist. RAID kann das zwar dann nicht korrigieren aber du weißt dann wenigstens schon mal, daß eine der Platten aus der Reihe tanzt und könntest dann entsprechende Schritte ergreifen (bei RAID 1, das RAID trennen, beide Seiten einzeln mounten und Dateien vergleichen).

Antworten PM Übersicht Chronologisch Zum Vorgänger
 
Melden nicht möglich
....
Re(4): Gibt es kein Raid, das Bitstürze erkennt?
02.11.2016, 16:09:21
Reed-Solomon Codes sind nicht nur einfache Prüfsummen, sonden haben Redundanz
mit einberechnet, dh. so viel Information über die Daten, dass man Fehler bis
zu einer bestimmten Größe nicht nur erkennen, sondern auch korrigieren kann.

die Erklärung erzeugt eventuell eine falsche Vorstellung .... Reed-Solomon bzw. Gruppencodes (von denen RS halt ein bestimmter Spezialfall sind, optimiert seinerzeit auf Fehlerbündel, wie sie bei Funkstörungen oder Kratzern auf CDs passieren)
  
Diese Codes basieren darauf, daß der "Störabstand" der übertragenen/gespeicherten Daten vergrößert wird, indem die Daten sozusagen "hochmultipliziert" werden (mit einem mathematischen Term, die Daten werden dabei aufgeblasen, um wieviel bzw. um welche Fehlertoleranz ist über den gewählten Term steuerbar) und beim "runterdividieren" quasi der Divisionsrest überprüft wird - ist der 0, sind die Daten OK, ansonsten gibt es eine gewisse Korrekturkapazität, bis zu der man den "Rest" ignoriert, aber die Daten passen. Wird die Korrekturkapazität überschritten, wird das aber nicht unbegrenzt erkannt (es kann für jedes Verfahren/Term eine Korrektur- und Erkennungskapazität angegeben werden) - darüber hinaus braucht es dann Prüfsummen auf anderer Ebene der Speicherung/Übertragung.

RS verteilt die Daten obendrein noch einmal, indem die Übertragung/Speicherung sozusagen spaltenweise statt zeilenweise stattfindet - dadurch äußert sich ein Kratzer nicht in einer "Zeile" / am Stück, sondern kann über die Korrekturkapazität des gesamten Blocks (2048/2384 Bytes netto bei der CD, brutto 40% mehr) gleichmässig verteilt.

Ein einfacher fehlerkorrigierender Code adressiert einzelne Bitfehler über systematische Parity-Bits, ist aber ineffizient und kann natürlich auch selbst (unbemerkt) gestört sein - insofern nur theoretische Bedeutung.

Antworten PM Übersicht Chronologisch Zum Vorgänger
 
Melden nicht möglich
 

Dieses Forum ist eine frei zugängliche Diskussionsplattform.
Der Betreiber übernimmt keine Verantwortung für den Inhalt der Beiträge und behält sich das Recht vor, Beiträge mit rechtswidrigem oder anstößigem Inhalt zu löschen.
Datenschutzerklärung