Koozali.org: home of the SME Server

Dringende Hilfe für Raid-Syncronisation

Offline stimzuk

  • *****
  • 154
  • +0/-0
Dringende Hilfe für Raid-Syncronisation
« on: February 02, 2010, 12:17:25 PM »
Hallo Kollegen, bei mir läuft eine Softraid1 Synchronisation seit Stunden (!) und ich weiß nicht ob ich die noch 66 Std weiterlaufen lassen soll oder doch nicht besser kontrolliert abbrechen soll:
Ich habe zwei 320er Platten hda und hdc. Die Syncronistion dauert in der Regel 2-3 Std. Diesmal hatte ich aber nach 6 Std erst 10% und jetzt dauert die Syncronisation bereits 8 Std und ist erst zu 15% fertig! Da ist vermutlich etwas passiert. Das System hängt aber nicht denn es wird auf die Festplatten zugegriffen (das merkt man an den LED Lampen an den Festplatten), die Server-Konsole funktioniert auch und als Root komme ich auch ins System.
Da mein einziger Datenbestand auf der hda ist möchte ich das Synchronisieren kontrolliert abbrechen und nicht nur das System abdrehen, denn dann geht sicher was kaputt - denke ich. Kann mir da jemand den entscheidenden Tipp geben. Oder wisst Ihr was da plötzlich so lange dauern kann?

Offline Igi2003

  • *****
  • 226
  • +0/-0
Re: Dringende Hilfe für Raid-Syncronisation
« Reply #1 on: February 02, 2010, 05:35:10 PM »
Schon im anderen Thread geschrieben, versuch mal neues IDE Kabel an hdc. Ich denke eher das da deine Ursache zu suchen ist. Normal ist das verhalten ja nicht. Mein P3 900 braucht 4 Stunden für 320er Platten und die sind recht voll.

Mfg

Offline stimzuk

  • *****
  • 154
  • +0/-0
Re: Dringende Hilfe für Raid-Syncronisation
« Reply #2 on: February 03, 2010, 07:07:38 AM »
Danke mache ich später, aber wie kann ich die laufende Raidsyncronisation kontrolliert abbrechen? Die läuft seit 26 Stunden und ist erst bei 45% !!!

Offline stimzuk

  • *****
  • 154
  • +0/-0
Re: Dringende Hilfe für Raid-Syncronisation
« Reply #3 on: February 03, 2010, 08:15:30 AM »
Hallo, die RaidSync läuft jetzt seit 28 Stunden und ist erst bei 45% ! Ich habe mir mal die letzten Messages in /var/log/messages angesehen, und habe Auszugsweise mal die Messages von heute morgen 04:19:23 bis 04:21:12 angehängt (s.unten). Zu sagen wäre noch ich hatte ein funktionsfähige hda und habe eine hdc zum sync reingehängt. Der Servermanager hatte mir auch gesagt daß er ein Raid1 mit hda und hdc findet wobei die verwendet Platte die hda wäre und das er eine nicht verwendet hdc gefunden hätte, die Frage zum Sync habe ich dann mit JA beantwortet im Glauben die Sync würde von hda auf hdc stattfinden. Seitdem läuft das Ding 28 Std. In den Messages (s.unten) habe ich aber nur Meldungen von hda (statusmeldungen, read-fehlermeldung und write-fehlermeldungen) und das in Abständen von mehrere Minuten. Ich finde keine einzige hdc Meldungen in den letzten Stunden.
Auf welchen Fehler lassen die Meldungen schliessen:

Feb  3  04:19:23 sme kernel: hda: read_intr: status=0x7f { DriveReady DeviceFault SeekComplete DataRequest CorrectedError Index Error }
Feb  3  04:19:23 sme kernel: hda: read_intr: error=0x7f   { DriveStatusError UncorrectableError SectorIdNotFound TrackZeroNotFound AddrMarkNotFound }, LBAsect=150081181286271, high=8945535, low=8355711, sector=255169006
Feb  3  04:19:23 sme kernel: ide: failed opcode was: unknown
Feb  3  04:19:28 sme kernel: ide0: reset: success
Feb  3  04:19:51 sme kernel: hda: status error=0x7f { DriveReady DeviceFault SeekComplete DataRequest CorrectedError Index Error }
Feb  3  04:19:51 sme kernel: hda: status error=0x7f   {  DriveStatusError UncorrectableError SectorIdNotFound TrackZeroNotFound  AddrMarkNotFound},LBAsect=150081181286271, high=8945535, low=8355711, sector=625137154
Feb  3  04:19:51 sme kernel: ide: failed opcode was: unknown
Feb  3  04:19:51 sme kernel: hda: drive not ready for command
Feb  3  04:19:56 sme kernel: ide0: reset: success
Feb  3  04:19:56 sme kernel: hda: read_intr: status=0x7f { DriveReady DeviceFault SeekComplete DataRequest CorrectedError Index Error }
Feb  3  04:19:56 sme kernel: hda: read_intr: error=0x7f   { DriveStatusError UncorrectableError SectorIdNotFound TrackZeroNotFound AddrMarkNotFound }, LBAsect=150081181286271, high=8945535, low=8355711, sector=255234176
Feb  3  04:19:56 sme kernel: ide: failed opcode was: unknown
Feb  3  04:20:01 sme kernel: ide0: reset: success
Feb  3  04:20:02 sme kernel: hda: write_intr error1: nr_sectors=360, stat=0x7f
Feb  3  04:20:02 sme kernel: hda: write_intr: status=0x7f { DriveReady DeviceFault SeekComplete DataRequest CorrectedError Index Error }
Feb  3  04:20:02 sme kernel: hda: write_intr: error=0x7f   { DriveStatusError UncorrectableError SectorIdNotFound TrackZeroNotFound AddrMarkNotFound }, LBAsect=140185576636287, high=8355711, low=8355711, sector=274010
Feb  3  04:20:02 sme kernel: ide: failed opcode was: unknown
Feb  3  04:20:12 sme kernel: ide0: reset: success
Feb  3  04:21:01 sme kernel: hda: write_intr error1: nr_sectors=1, stat=0x7f
Feb  3  04:21:01 sme kernel: hda: write_intr: status=0x7f { DriveReady DeviceFault SeekComplete DataRequest CorrectedError Index Error }
Feb  3  04:20:12 sme kernel: hda: write_intr: error=0x7f   { DriveStatusError UncorrectableError SectorIdNotFound TrackZeroNotFound AddrMarkNotFound }, LBAsect=150081181286271, high=8945535, low=8355711, sector=625137161
Feb  3  04:21:01 sme kernel: ide: failed opcode was: unknown
Feb  3  04:21:06 sme kernel: ide0: reset: success
Feb  3  04:21:07 sme kernel: hda: write_intr error1: nr_sectors=24, stat=0x7f
Feb  3  04:21:07 sme kernel: hda: write_intr: status=0x7f { DriveReady DeviceFault SeekComplete DataRequest CorrectedError Index Error }
Feb  3  04:21:07 sme kernel: hda: write_intr: error=0x7f   { DriveStatusError UncorrectableError SectorIdNotFound TrackZeroNotFound AddrMarkNotFound }, LBAsect=150081181286271, high=8945535, low=8355711, sector=278650
Feb  3  04:21:07 sme kernel: ide: failed opcode was: unknown
Feb  3  04:21:12 sme kernel: ide0: reset: sucecess

Und dann bis 04:59:11 keine weiteren Einträge in /var/log/messages, aber System ist erst bei 45% und macht noch weiter.

Offline Igi2003

  • *****
  • 226
  • +0/-0
Re: Dringende Hilfe für Raid-Syncronisation
« Reply #4 on: February 03, 2010, 09:18:24 AM »
In diesem Fall sieht das schon ganz anders aus. Da ist deine FESTPLATTE C defekt.
In diesem Fall empfehle ich die synchronisation durchlaufen zu lassen und hoffen das die Daten sauber übertragen werden. Danach die hda raus schmeißen oder mal bei hda ein neues IDE kabel probieren.

Mfg

Offline stimzuk

  • *****
  • 154
  • +0/-0
Re: Dringende Hilfe für Raid-Syncronisation
« Reply #5 on: February 03, 2010, 11:07:04 AM »
In diesem Fall sieht das schon ganz anders aus. Da ist deine FESTPLATTE C defekt.

Festplatte C soll defekt sein? Bist Du sicher hast Dich nicht verschrieben? Das sind ja alles Meldungen der hda? Bitte nochmals und bitte etwas erklären - ich bin leider nicht so ein Linux Spezialist -danke.

In diesem Fall empfehle ich die synchronisation durchlaufen zu lassen und hoffen das die Daten sauber übertragen werden. Danach die hda raus schmeißen oder mal bei hda ein neues IDE kabel probieren.

Die hda rauschmeissen und s. oben da soll die hdc kaputt sein? Dann hab ich ja überhaupt keine Platte mehr? Zur Erklärung beide Platten sind komplett neu (3 Tage alt) ich glaube nicht das beide Platten kaputt sind im Sinne von entsorgen. Vielleicht sind die NUR die Daten da drauf "kaputt"?

Außerdem habe ich irgendwo in /var/log/messages irgendwas gelesen mit DMA disabled? Ist das der Grund wieso die Sync bereits 28 Std dauert und hängt das irgendwie mit obigen Messages zusammen? Das file /var/log/messages wäre zu groß um es hier zu posten aber könnte ich es dir irgendwie zusenden? Das wäre toll.

Offline Igi2003

  • *****
  • 226
  • +0/-0
Re: Dringende Hilfe für Raid-Syncronisation
« Reply #6 on: February 03, 2010, 03:44:41 PM »
Sorry, nicht FESTPLATTE C, hatte da das alte DOS im Kopf. Bei hda bringt er Fehler.
Bitte erst neue IDE Kabel anschließen und anschließend

Code: [Select]
hdparm -c1 /dev/hda /deb/hdceingeben um bei beiden Platten die UDMA 32-bit Übertragung zu aktivieren.
Sync

Mfg

PS. Die Synchronisation kannst du einfach unterbrechen indem du den Server runter fährst.

Offline Reinhold

  • *
  • 517
  • +0/-0
    • http://127.0.0.1
Re: Dringende Hilfe für Raid-Syncronisation
« Reply #7 on: February 04, 2010, 02:00:34 AM »
SME setzt standardmäßig  auch bei (nur) einer Platte ein RAID1 auf (mit 2nd disk missing).
Da kommt er natürlich gleich auf die Idee deine neu eingebaute 2. Platte mal in Beschlag-s'ync  zu nehmen.

Ein neues Kabel ist immer eine gute Idee - aber nicht vergessen hdc ist am 2. IDE Strang die Master Platte.
Bist du dir sicher das sich dort nicht schon ein auf Master gejumpertes Teil namens CD-ROM befindet ?

"TrackZeroNotFound " bei einer HD ist ein ganz böses Zeichen ... insbesondere wenn die Platte schon etwas älter ist.
Hör mal genau hin - wenn du den Kopf hören kannst wie er an die Wand schlägt ist es höchste Zeit für was Neues.

Runterfahren mit:

shutdown -h now

ist zwar generell für's Raid1 unkritisch (und SME fängt den (kurzzeitigen) Netzschalter-druck mit was vergleichbarem ab)  - aber der resync beginnt natürlich beim Neustart komplett von vorn !

Lies dich mal in die Raid sektion im Wiki ein  (such einfach dort nach "Raid")

Regard
Reinhold

P.S.: ein "man mdadm" ist vielleicht auch mal ganz hilfreich (notfalls als: http://www.google.de/search?q=man+mdadm auf einem belastbaren Rechner)
« Last Edit: February 04, 2010, 02:02:49 AM by Reinhold »
............

Offline stimzuk

  • *****
  • 154
  • +0/-0
Re: Dringende Hilfe für Raid-Syncronisation
« Reply #8 on: February 14, 2010, 01:31:10 PM »
Hallo, ich hab's jetzt mit neuen IDE Kabeln probiert, aber auch nix neues. Dann habe ich die alten IDE Kabel wieder verwendet und jetzt geht das Ding wieder - schon komisch. Aber danke an alle die geholfen haben!