Koozali.org: home of the SME Server

DegradedArray event

Offline nicos

  • *
  • 9
  • +0/-0
DegradedArray event
« on: October 06, 2008, 10:50:17 AM »
Ciao a tutti,

Ho installato su un server hp proliant una SME 7.3
Il server in questione ha 2 dischi sata da 500 giga in raid 1 hardware.
Da alcuni giorni ricevo da admin il seguente messaggio:
A DegradedArray event has been detected on md device /dev/md2.
Il controller raid del server non rileva nessun problema.

Con il comando
mdadm --query --detail /dev/md[12]
questo è il risultato:

/dev/md1:
        Version : 00.90.01
  Creation Time : Wed May  7 13:47:00 2008
     Raid Level : raid1
     Array Size : 104320 (101.89 MiB 106.82 MB)
    Device Size : 104320 (101.89 MiB 106.82 MB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 1
    Persistence : Superblock is persistent
    Update Time : Sun Oct  5 13:43:15 2008
          State : clean
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0
           UUID : 12db2092:10bd21e3:9c2c43d6:2b876493
         Events : 0.1750
    Number   Major   Minor   RaidDevice State
       0       8        1        0      active sync   /dev/sda1
       1       8       17        1      active sync   /dev/sdb1
/dev/md2:
        Version : 00.90.01
  Creation Time : Wed May  7 13:47:00 2008
     Raid Level : raid1
     Array Size : 488279488 (465.66 GiB 500.00 GB)
    Device Size : 488279488 (465.66 GiB 500.00 GB)
   Raid Devices : 2
  Total Devices : 1
Preferred Minor : 2
    Persistence : Superblock is persistent
    Update Time : Mon Oct  6 10:31:22 2008
          State : active, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 0
  Spare Devices : 0
           UUID : 82b11445:a2d2b33c:23b23401:ae2c50c8
         Events : 0.5946665
    Number   Major   Minor   RaidDevice State
       0       0        0        -      removed
       1       8       18        1      active sync   /dev/sdb2

Qualche esperto può aiutarmi a capire il problema?

Grazie mille.


Online Stefano

  • *
  • 10,894
  • +3/-0
Re: DegradedArray event
« Reply #1 on: October 06, 2008, 12:11:07 PM »
ciao

raid HW? sicuro?

per cortesia, posta qui:

Code: [Select]
cat /proc/mdstat

proliant che modello? che controller raid?

da quel che capisco il raid HW non è in funzione.. e se il controller è un fakeraid SME vede i 2 dischi..

Ciao
Stefano

Offline nicos

  • *
  • 9
  • +0/-0
Re: DegradedArray event
« Reply #2 on: October 06, 2008, 04:45:50 PM »
Comunque hai ragione....
Lo SME non riconosce il raid hardware e da quanto ho capito ha fatto in automatico un raid software che si è degradato.... :(

Potrei sapere la procedura migliore per ripristinare il raid software tenendo presente che sono un utente Linux alle prime armi?

Grazie e scusa ancora.



Online Stefano

  • *
  • 10,894
  • +3/-0
Re: DegradedArray event
« Reply #3 on: October 06, 2008, 04:58:57 PM »
ciao

non hai postato quello che ti ho chiesto ma vabbè, si fa lo stesso ;-)

allora..

c'è da sapere che certe volte l'array va fuori sync anche per nulla e non è detto che il disco sia da buttare.
andiamo per ordine:

1) cerca in /var/log/messages eventuali errori con
Code: [Select]
grep 'sda2' /var/log/messages
questo dovrebbe darti il messaggio di errore che ha fatto mettere off-line il disco sda (o meglio, al sua partizione sda2)..
posta qui il risultato, grazie

2) prova a re-inserire il disco nell'array con
Code: [Select]
mdadm -a /dev/md2 /dev/sda2

ed a monitorare lo stato della ricostruzione con
Code: [Select]
cat /proc/mdstat

se il disco è ok la procedura dovrebbe andare a buon fine.. occhio che potrebbe volerci molto, con hd da 500 Gb

Naturalmente tu hai un backup dei dati, vero?

Ciao
Stefano

Offline nicos

  • *
  • 9
  • +0/-0
Re: DegradedArray event
« Reply #4 on: October 06, 2008, 05:36:11 PM »
OK Vado in ordine come mi hai chiesto  :?

Il server è un proliant ml 150 g3

Il controller presumo che sia un intel ICH ESB2 integrato nella mainboard

CODE:cat /proc/mdstat

Personalities : [raid1]
md2 : active raid1 sdb2[1]
      488279488 blocks [2/1] [_U]
     
md1 : active raid1 sda1[0] sdb1[1]
      104320 blocks [2/2] [UU]

CODE:grep 'sda2' /var/log/messages

Oct  5 13:41:29 smeserver kernel:  sda: sda1 sda2
Oct  5 13:41:30 smeserver kernel: md: bind<sda2>
Oct  5 13:41:30 smeserver kernel: md: kicking non-fresh sda2 from array!
Oct  5 13:41:30 smeserver kernel: md: unbind<sda2>
Oct  5 13:41:30 smeserver kernel: md: export_rdev(sda2)
Oct  5 13:41:34 smeserver kernel: md: could not bd_claim sda2.
Oct  5 13:41:34 smeserver kernel: md: considering sda2 ...
Oct  5 13:41:34 smeserver kernel: md:  adding sda2 ...
Oct  5 13:41:35 smeserver kernel: md: md2 already running, cannot run sda2
Oct  5 13:41:35 smeserver kernel: md: export_rdev(sda2)

Non è che avere un raid hw che non viene riconosciuto può dare dei problemi?

Sto facendo un backup aggiornato.

Ciao Nicola

Online Stefano

  • *
  • 10,894
  • +3/-0
Re: DegradedArray event
« Reply #5 on: October 06, 2008, 07:38:20 PM »
OK Vado in ordine come mi hai chiesto  :?

Il server è un proliant ml 150 g3

ok..

Quote
Il controller presumo che sia un intel ICH ESB2 integrato nella mainboard

ok..

Quote
CODE:cat /proc/mdstat

Personalities : [raid1]
md2 : active raid1 sdb2[1]
      488279488 blocks [2/1] [_U]
     
md1 : active raid1 sda1[0] sdb1[1]
      104320 blocks [2/2] [UU]


ok

Quote
CODE:grep 'sda2' /var/log/messages

Oct  5 13:41:29 smeserver kernel:  sda: sda1 sda2
Oct  5 13:41:30 smeserver kernel: md: bind<sda2>
Oct  5 13:41:30 smeserver kernel: md: kicking non-fresh sda2 from array!

cosa è successo prima?

prova a cercare con
Code: [Select]
grep sda /var/log/messages

in particolare gli eventi prima delle 13:41 di ieri

Quote
Non è che avere un raid hw che non viene riconosciuto può dare dei problemi?

non che io sappia.. SME ha visto ed utilizzato i 2 dischi come se il raid non esistesse, anzi per lui non esiste proprio.. ;-)

Quote
Sto facendo un backup aggiornato.

questo è solo un bene.. assicurati di farlo con continuità ;-)

non mi hai però detto se hai poi ri-aggiunto la partizione sda2 all'array come ti ho indicato..

Ciao

Stefano

P.S. se trovi 2 minuti, leggi qui http://forums.contribs.org/index.php?topic=41381.0

Offline nicos

  • *
  • 9
  • +0/-0
Re: DegradedArray event
« Reply #6 on: October 07, 2008, 09:55:33 AM »
Ciao e grazie per le tue risposte.

CODE: grep sda /var/log/messages

Oct  5 13:41:28 smeserver kernel: SCSI device sda: 976773168 512-byte hdwr sectors (500108 MB)
Oct  5 13:41:29 smeserver kernel: SCSI device sda: drive cache: write through
Oct  5 13:41:29 smeserver kernel: SCSI device sda: 976773168 512-byte hdwr sectors (500108 MB)
Oct  5 13:41:29 smeserver kernel: SCSI device sda: drive cache: write through
Oct  5 13:41:29 smeserver kernel:  sda: sda1 sda2
Oct  5 13:41:29 smeserver kernel: Attached scsi disk sda at scsi0, channel 0, id 0, lun 0
Oct  5 13:41:30 smeserver kernel: md: bind<sda1>
Oct  5 13:41:30 smeserver kernel: md: bind<sda2>
Oct  5 13:41:30 smeserver kernel: md: kicking non-fresh sda2 from array!
Oct  5 13:41:30 smeserver kernel: md: unbind<sda2>
Oct  5 13:41:30 smeserver kernel: md: export_rdev(sda2)
Oct  5 13:41:34 smeserver kernel: md: could not bd_claim sda1.
Oct  5 13:41:34 smeserver kernel: md: could not bd_claim sda2.
Oct  5 13:41:34 smeserver kernel: md: considering sda2 ...
Oct  5 13:41:34 smeserver kernel: md:  adding sda2 ...
Oct  5 13:41:35 smeserver kernel: md: md2 already running, cannot run sda2
Oct  5 13:41:35 smeserver kernel: md: export_rdev(sda2)

Ancora non ho ri-aggiunto la partizione sda2 all'array come mi hai indicato...
Prima vorrei tentare di capire cosa è successo...


Nicola

Online Stefano

  • *
  • 10,894
  • +3/-0
Re: DegradedArray event
« Reply #7 on: October 07, 2008, 11:45:43 AM »
Oct  5 13:41:28 smeserver kernel: SCSI device sda: 976773168 512-byte hdwr sectors (500108 MB)
Oct  5 13:41:29 smeserver kernel: SCSI device sda: drive cache: write through
Oct  5 13:41:29 smeserver kernel: SCSI device sda: 976773168 512-byte hdwr sectors (500108 MB)
Oct  5 13:41:29 smeserver kernel: SCSI device sda: drive cache: write through
Oct  5 13:41:29 smeserver kernel:  sda: sda1 sda2
Oct  5 13:41:29 smeserver kernel: Attached scsi disk sda at scsi0, channel 0, id 0, lun 0
Oct  5 13:41:30 smeserver kernel: md: bind<sda1>
Oct  5 13:41:30 smeserver kernel: md: bind<sda2>
Oct  5 13:41:30 smeserver kernel: md: kicking non-fresh sda2 from array!

ok.. ma non sappiamo COSA è successo prima.. hai riavviato il server?

cerca in messages*

Quote
Ancora non ho ri-aggiunto la partizione sda2 all'array come mi hai indicato...
Prima vorrei tentare di capire cosa è successo...

aggiungila e poi monitorizza /var/log/messages con un
Code: [Select]
tail -f /var/log/messages | grep sda

se succede qualcosa (il disco è rotto o altro) te lo scrive

Ciao
Stefano

Offline nicos

  • *
  • 9
  • +0/-0
Re: DegradedArray event
« Reply #8 on: October 09, 2008, 12:42:48 PM »
/root$ cat /proc/mdstat
Personalities : [raid1]
md2 : active raid1 sda2[0] sdb2[1]
      488279488 blocks [2/2] [UU]
     
md1 : active raid1 sda1[0] sdb1[1]
      104320 blocks [2/2] [UU]
     
unused devices: <none>

Grazie Per l'aiuto.

Nicola