Koozali.org: home of the SME Server

Einige der Raid-Geräte sind fehlerhaft [gelöst]

Offline Free4All

  • ****
  • 115
  • +0/-0
    • http://de.wikipedia.org/wiki/Lord_of_the_Weed
Einige der Raid-Geräte sind fehlerhaft [gelöst]
« on: July 08, 2007, 06:58:22 PM »
Hi Leute,

bei meinem SME Server sind laut Serverkonsole einige der Raid-Geräte fehlerhaft. Wie geh ich jetzt vor? In der Serverkonsole kann ich unter
"Festplattenspieglung einstellen" nur auf "weiter" drücken. Eine Option zum Reparieren gibt es nicht. Nur der Hinweis: "Der manuelle Eingriff könnte erforderlich sein." Das sagt mir aber rein gar nix. :cry:

Über die Forensuche bin ich auf folgenden Thread gestossen:
http://forums.contribs.org/index.php?topic=35657.0

Im Grunde habe ich das gleiche Problem nur Huitzilopochtli hat leider nicht geschrieben wie er das Problem gelöst hat nur das er es gelöst hat. FraunhoferIFF hat geschrieben die defekte Festplatte platt zu machen und dann neu zu synchronisieren.
Gibt es da nicht eine bessere Lösung? Einen Befehl der bewirkt, dass der RAID-Verbund nochmals geprüft und dann entsprechend neu gespiegelt wird? Und wenn nicht wie krieg ich raus welche Festplatte im Server ich löschen muss?

Bei mir ist die Konfiguration so:
Quote

Aktueller RAID-Status:

Personalities : [raid1] [raid5]
md1 : active raid1 sda1[0] sdd1[3] sdc1[2] sdb1[1]
      104320 blocks [4/4] [UUUU]
md2 : active raid5 sda2[0] sdd2[3] sdc2[2]
      234130944 blocks level 5, 256k chunk, algorithm 2 [4/3] [U_UU]
unused devices: <none>




Zwei Mails vom SME Server habe ich auch bekommen.
Erst diese:

Code: [Select]

This is an automatically generated mail message from mdadm running on xxx.xxx.xxx.

A Fail event has been detected on md device /dev/md2.


und nach einem Neustart folgende:

Code: [Select]

This is an automatically generated mail message from mdadm running on xxx.xxx.xxx.

A DegradedArray event has been detected on md device /dev/md2.


Ich danke euch schonmal für eure Hilfe!

Offline FraunhoferIFF

  • *
  • 932
  • +0/-0
  • Widerstand ist Zwecklos !
    • http://www.magic-figo.de
Einige der Raid-Geräte sind fehlerhaft [gelöst]
« Reply #1 on: July 08, 2007, 09:16:14 PM »
Wie du schon sagst ich hatte es ja auch schon, habe die als Defekt makierte Platte Platt gemacht und dabei Festgestellt , das Sie defekte Sektoren hatte...

Also entweder (am schnellsten) defekte Platte Formatieren und das Raid neu machen...

Oder einfach abwarten ob sich das Problem von selber löst... Beim Reboot fängt das Syncen immer wieder neu an.
zudem würde ich mal ,
Raid Status Prüfen
Code: [Select]

mdadm --detail /dev/md1
mdadm --detail /dev/md2
cat /proc/mdstat


auch wär Interessant was in den Logs steht :
die findest Du unter :
Code: [Select]
/var/log/raidmonitor

bis gleich

Offline capri

  • *****
  • 530
  • +0/-0
    • GAMEWARE
Einige der Raid-Geräte sind fehlerhaft [gelöst]
« Reply #2 on: July 09, 2007, 10:14:14 AM »
Ich weiß nicht ob nur ich diese Erfahrung gemacht habe (egal welches Linux), oder ob es Anderen auch so geht, aber wenn eine ext2/3 Partition Fehler meldet, gleich neuformatieren sonst werden es immer Schneller immer Mehr, und im Raid Verbund wird die 'gesunde' Platte dann wohl Bald mitgerissen.

Für dieses sch...öne Dateisystem gibt es ja auch kaum Tools zur Reparatur/Prüfung, da ist man manchmal mit XFS deutlich besser bedient.

Offline FraunhoferIFF

  • *
  • 932
  • +0/-0
  • Widerstand ist Zwecklos !
    • http://www.magic-figo.de
Einige der Raid-Geräte sind fehlerhaft [gelöst]
« Reply #3 on: July 09, 2007, 11:29:54 AM »
@ capri ..

da geb ich dir recht , das gefühl hatt ich auch schon mal... Also ob er die Fehler Duplizieren würde.. nach 3 Tagen blieb nur Format über,,, FSCK hat zum schluß auch nur noch mist gebaut...

Offline capri

  • *****
  • 530
  • +0/-0
    • GAMEWARE
Einige der Raid-Geräte sind fehlerhaft [gelöst]
« Reply #4 on: July 09, 2007, 12:13:22 PM »
Mir läuft immer ein kalter Schauer über den Rücken wenn ein ext3 System einen defekten Superblock bemängelt, den bisher war es dann fast Immer so das auch die Reserve Superblocks nicht mehr angenommen wurden und letzendlich die halben Daten der Partition in Lost&Found landeten, natürlich sinnlos da noch eine Restaurierung zu versuchen :(

Offline Free4All

  • ****
  • 115
  • +0/-0
    • http://de.wikipedia.org/wiki/Lord_of_the_Weed
Einige der Raid-Geräte sind fehlerhaft [gelöst]
« Reply #5 on: July 09, 2007, 04:24:06 PM »
Nun gut. Dann wird mir leider wohl nichts anderes übrig bleiben als auf der Platte alles zu löschen.

Seh ich das richtig, dass es sich um die 2. Festplatte handelt?

Quote

md2 : active raid5 sda2[0] sdd2[3] sdc2[2]
234130944 blocks level 5, 256k chunk, algorithm 2 [4/3] [U_UU]


Wie macht ihr denn die Festplatte am schnellsten platt?

Offline capri

  • *****
  • 530
  • +0/-0
    • GAMEWARE
Einige der Raid-Geräte sind fehlerhaft [gelöst]
« Reply #6 on: July 09, 2007, 05:51:04 PM »
Klemm die vermeintlich betroffene Platte halt mal ab, dann siehst du ja was dann SME 7 meldet.

Zur Fromatierung der Platte, ist gewiss nicht falsch vor der eigentlichen Formatierung eine Low Level Formatierung zu machen, dann werden wenigstens eventuell defekte Sektoren sauber ausgeschlossen, ext3 traue ich da nämlich auch nicht ganz, die Formatierung damit geht mir immer etwas arg schnell, das 'bügelt' vermutlich nur seine Indexes drüber.

Offline FraunhoferIFF

  • *
  • 932
  • +0/-0
  • Widerstand ist Zwecklos !
    • http://www.magic-figo.de
Einige der Raid-Geräte sind fehlerhaft [gelöst]
« Reply #7 on: July 09, 2007, 07:55:48 PM »
Die Superblock geschichte hab ich mit einer drüber installation in den griff bekommen. Wobei in den "Griff" is ja  total fehl am platze ist. ich dacht mir das so einfach,,, defekte Platte raus aus dem Raid und wieder rein, bloß hatte ich die mail überlesen die mir 2 monate vorher , das zerbrochene Raid meldet .

Dann ging Platte 1. in die ewigen jagdgründe und die 2te war steinalt und zudem kam die scheiße mit dem Superblock.

Da findet man ja 1000 einträge im Forum dazu , keiner half . Selbst ein Guru vom Institut meinte das Linux Raids echt Tricki is.

Und auch er gab nach ne Weile einfach auf...

Nunja er Läuft wieder ,,, Püühhh.

Aber wieder 2 versaute Tage  :)

Marcel

Offline Free4All

  • ****
  • 115
  • +0/-0
    • http://de.wikipedia.org/wiki/Lord_of_the_Weed
Einige der Raid-Geräte sind fehlerhaft [gelöst]
« Reply #8 on: July 09, 2007, 11:07:49 PM »
Also ich hab jetzt erst die Platte rausgebaut, die laut Hauptplatine am Anschluss 2 hängt. Dann habe ich den SME Server wieder hochgefahren und ein "Kernel Panic" war die Folge. Da wurd ich dann erst etwas unruhig.
Dann hab ich es mit der Platte 3 ausprobiert. Und damit hat er dann "fast" ohne Probleme gestartet. Das hieß für mich, dass die Platte mit dem Anschluss 3 nicht in Ordnung ist. Auf die Platte 2 war ich gekommen, weil angeblich sdb ausgefallen ist.
An jeden der das Problem auch hat: ERST TESTEN!

Dann hab ich diese Platte mit Partition Magic komplett platt gemacht und wieder eingesetzt.
Dann hatte ich erst einen weiteren Fehler gemacht. Ich sichere auf eine USB-Festplatte und die war noch angeschlossen. Die hat er erst auch erkannt und erzählte mir was davon, dass alle Laufwerke gleich gross sein müssen. Als ich die USB-Festplatte ausgespölselt habe konnte ich die plattgemachte Festplatte wieder einbinden. Jetzt ist er gerade am synchronisieren oder wie das heisst.
Also: ALLE USB-FESTPLATTEN RAUS!

Ich hoffe sehr, dass sich damit das Thema erstmal gegessen hat. Ich danke euch schon mal sehr!
Nach einem halben Jahr SME Server war das definitiv der erste Schock. Besonders da ich damit noch nie konfrontiert war.

In dem anderen Thread werd ich hierhin noch einen Link setzen, damit auch andere an die Lösung kommen.

Diesen Thread setz ich auf [gelöst], wenn ich mir morgen sicher bin, dass alles ok ist. Andernfalls würd ich mich wieder melden.

Bis dahin

gn8!

Offline Free4All

  • ****
  • 115
  • +0/-0
    • http://de.wikipedia.org/wiki/Lord_of_the_Weed
Einige der Raid-Geräte sind fehlerhaft [gelöst]
« Reply #9 on: July 10, 2007, 07:46:16 AM »
Morgen Freunde!

So wie es aussieht ist alles wieder in Ordnung!
Das sagt einmal die Serverkonsole und folgende mail habe ich bekommen:

Quote

A RebuildFinished event has been detected on md device /dev/md2.


Also nochmal danke schön!

Bei irgendwelchen Nachwehen würd ich mich nochmal melden, aber ich denke jetzt ist alles wieder im grünen Bereich!

Offline capri

  • *****
  • 530
  • +0/-0
    • GAMEWARE
Einige der Raid-Geräte sind fehlerhaft [gelöst]
« Reply #10 on: July 10, 2007, 10:16:03 AM »
In fast allen Linux spezifischen Foren wird ext3 als bestes Dateisystem für Linux proklamiert, dabei habe ich zumindest bisher fast nur negative Erfahrungen damit gemacht, meien Linux Systeme laufen sonst alle auf XFS das mir noch nicht solche Probleme bereitet hat, nur beim SME 7 Server ist mir der Aufwand für eine Umstellung zu groß (Stichwort: Raid, Quotas).

Aber Allgemein ein paar Tipps, die ich meine das sie von Relevanz sind:

Oft werden wegen der Kosten ältere Platten für SME7 Systeme verwendetet, dabei ist zu bedenken das Comsumer IDE/S-ATA Platten eine etwaige Lebenserwartung von 3 -4 Jahren haben, sollten also alle 3 Jahre ausgewechselt werden auch wenn sie noch keine Probleme zeigen.

Bei SCSI Platten kann man da je nach Typ, schon 1 -3 Jahre mehr drauflegen.

Nach defekten Partitionen, nicht einfach neu aufsetzen, sondern, wie schon erwähnt, erst mit einem Tool (gibts meißt auf den Webseiten der Plattenhersteller zum Download) Low Level Formatieren, das ist sicherer als den Fähigkeiten von ext2/3/4 zu trauen defekte Sektoren ausgrenzen zu können (In die 'Bad sector list' der Platte einzutragen).

Für meinen Teil fahre ich KEIN RAID mehr auf SME7, die Strom- und Plattenkosten stehen für mich in keinen Vergleich zum (geringen) gewonnen mehr an Sicherheit, Ab und An eine Spiegelung mittels z.B. TrueImage auf eine Reserve Platte, genügt mir um eine 'Notfallsystem' schnell hochzufahren, in Kombination mit einer USB Festplatte und einem Backup Script, ist es so eine Arbeit von unter einer Stunde das System wieder auf den letzten Sicherungsstand zu bringen.

Der nächste, und öfter mal unterschätzte, Punkt wären die Kabel, nur hochwertige IDE/S-ATA Kabel verwenden, schlechte Kabel müssen sich nicht unbedingt gleich zeigen, können aber zu unerwarteten Störungen führen.

Dann die Belüftung im Rechner, je mehr die Platten über 40 Grad heiß werden desdo schneller altern sie (Beschichtung der Scheiben, Elektronik).

Oft wird ja viel gemacht um den Prozessor gut zu Kühlen, die Platten aber dabei vergessen, da gerade bei RAID5 der Platz in Midi Towern schnell eng wird und 'gestapelte' Platten sich halt gegenseitig aufheitzen, hier hilft es auch die 5 1/4 Zoll Plätze mit Adaptern für Platten zu nutzen und die Führung des Luftstroms im Rechner entsprechend zu leiten (Bleche, Schläuche etc.)

So, das waren meine '5 Cent' dazu, wollte damit nur sagen das oft einfache Masnahmen mehr bringen als kostspieleige Totalumrüstung oder aufwendige Softwaremasnahmen :)

Offline Free4All

  • ****
  • 115
  • +0/-0
    • http://de.wikipedia.org/wiki/Lord_of_the_Weed
Re: Einige der Raid-Geräte sind fehlerhaft [gelöst]
« Reply #11 on: February 25, 2009, 10:55:35 AM »
Für meinen Teil fahre ich KEIN RAID mehr auf SME7, die Strom- und Plattenkosten stehen für mich in keinen Vergleich zum (geringen) gewonnen mehr an Sicherheit, Ab und An eine Spiegelung mittels z.B. TrueImage auf eine Reserve Platte, genügt mir um eine 'Notfallsystem' schnell hochzufahren, in Kombination mit einer USB Festplatte und einem Backup Script, ist es so eine Arbeit von unter einer Stunde das System wieder auf den letzten Sicherungsstand zu bringen.

Also ich wollt jetzt kurz mal schildern wie es bei mir so weitergegangen ist.

Vor etwa 2 Monaten hatte ich wieder das Problem, dass eine Platte angeblich ausgefallen sei. Ich hab die Platte wieder ausgebaut und formatiert. Danach hab ich die Platte wieder reingesetzt und das Raid-Array wiederhergestellt.

Gestern dann ist mir der SME komplett abgeschmiert. Beim Neustart gabs ein Kernel Panic und es ging gar nix mehr. Wenigstens wurde kurz vorher noch die Datensicherung gemacht. Hab also eine Neuinstallation aber diesmal OHNE raid gemacht und per dar2 die Komplettsicherung eingespielt. Aufgrund der zeitnahen Sicherung sind keine E-Mails verloren gegangen. Als admin hab ich vor dem Absturz zwei Meldungen erhalten, dass das Raid-Array wieder nach Mama ruft.

Also bei mir hat das Softwareraid soviel Probleme gemacht, dass ich davon nur noch abraten kann. Jetzt läuft er bei mir auch ohne Raid und ich muss mal sehen wie ich die anderen Platte in den SME Server einbinde.

Ein Problem hab ich seit der Wiederherstellung aber: Beim MediaWiki werden die Einträge bzw. Beiträge mit Umlauten nicht mehr richtig angezeigt. Ich will es mal mit dieser Problemlösung probieren: http://wiki.bplaced.net/index.php/Das_Umlaut_Problem , aber falls das nix bringen sollte würd ich mich nochmal melden. Die Codierung ist aber doch in letzter Zeit nicht irgendwie umgestellt worden oder?

[Edit]
Hat leider nix gebracht. Hat jemand ne Idee woran das liegen könnte? Aus Übersicht macht er Übersicht. Wo werden denn in der DB die Beiträge abgespeichert?
« Last Edit: February 25, 2009, 11:46:59 AM by Free4All »