Koozali.org: home of the SME Server

Other Languages => Italiano => Topic started by: nicos on October 06, 2008, 10:50:17 AM

Title: DegradedArray event
Post by: nicos on October 06, 2008, 10:50:17 AM: Ciao a tutti,

Ho installato su un server hp proliant una SME 7.3
Il server in questione ha 2 dischi sata da 500 giga in raid 1 hardware.
Da alcuni giorni ricevo da admin il seguente messaggio:
A DegradedArray event has been detected on md device /dev/md2.
Il controller raid del server non rileva nessun problema.

Con il comando
mdadm --query --detail /dev/md[12]
questo è il risultato:

/dev/md1:
Version : 00.90.01
Creation Time : Wed May 7 13:47:00 2008
Raid Level : raid1
Array Size : 104320 (101.89 MiB 106.82 MB)
Device Size : 104320 (101.89 MiB 106.82 MB)
Raid Devices : 2
Total Devices : 2
Preferred Minor : 1
Persistence : Superblock is persistent
Update Time : Sun Oct 5 13:43:15 2008
State : clean
Active Devices : 2
Working Devices : 2
Failed Devices : 0
Spare Devices : 0
UUID : 12db2092:10bd21e3:9c2c43d6:2b876493
Events : 0.1750
Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
1 8 17 1 active sync /dev/sdb1
/dev/md2:
Version : 00.90.01
Creation Time : Wed May 7 13:47:00 2008
Raid Level : raid1
Array Size : 488279488 (465.66 GiB 500.00 GB)
Device Size : 488279488 (465.66 GiB 500.00 GB)
Raid Devices : 2
Total Devices : 1
Preferred Minor : 2
Persistence : Superblock is persistent
Update Time : Mon Oct 6 10:31:22 2008
State : active, degraded
Active Devices : 1
Working Devices : 1
Failed Devices : 0
Spare Devices : 0
UUID : 82b11445:a2d2b33c:23b23401:ae2c50c8
Events : 0.5946665
Number Major Minor RaidDevice State
0 0 0 - removed
1 8 18 1 active sync /dev/sdb2

Qualche esperto può aiutarmi a capire il problema?

Grazie mille.
Title: Re: DegradedArray event
Post by: Stefano on October 06, 2008, 12:11:07 PM: ciao

raid HW? sicuro?

per cortesia, posta qui:

Code: [Select]
cat /proc/mdstat
proliant che modello? che controller raid?

da quel che capisco il raid HW non è in funzione.. e se il controller è un fakeraid SME vede i 2 dischi..

Ciao
Stefano
Title: Re: DegradedArray event
Post by: nicos on October 06, 2008, 04:45:50 PM: Comunque hai ragione....
Lo SME non riconosce il raid hardware e da quanto ho capito ha fatto in automatico un raid software che si è degradato.... :(

Potrei sapere la procedura migliore per ripristinare il raid software tenendo presente che sono un utente Linux alle prime armi?

Grazie e scusa ancora.
Title: Re: DegradedArray event
Post by: Stefano on October 06, 2008, 04:58:57 PM: ciao

non hai postato quello che ti ho chiesto ma vabbè, si fa lo stesso ;-)

allora..

c'è da sapere che certe volte l'array va fuori sync anche per nulla e non è detto che il disco sia da buttare.
andiamo per ordine:

1) cerca in /var/log/messages eventuali errori con
Code: [Select]
grep 'sda2' /var/log/messagesquesto dovrebbe darti il messaggio di errore che ha fatto mettere off-line il disco sda (o meglio, al sua partizione sda2)..
posta qui il risultato, grazie

2) prova a re-inserire il disco nell'array con
Code: [Select]
mdadm -a /dev/md2 /dev/sda2
ed a monitorare lo stato della ricostruzione con
Code: [Select]
cat /proc/mdstat
se il disco è ok la procedura dovrebbe andare a buon fine.. occhio che potrebbe volerci molto, con hd da 500 Gb

Naturalmente tu hai un backup dei dati, vero?

Ciao
Stefano
Title: Re: DegradedArray event
Post by: nicos on October 06, 2008, 05:36:11 PM: OK Vado in ordine come mi hai chiesto :?

Il server è un proliant ml 150 g3

Il controller presumo che sia un intel ICH ESB2 integrato nella mainboard

CODE:cat /proc/mdstat

Personalities : [raid1]
md2 : active raid1 sdb2[1]
488279488 blocks [2/1] [_U]

md1 : active raid1 sda1[0] sdb1[1]
104320 blocks [2/2] [UU]

CODE:grep 'sda2' /var/log/messages

Oct 5 13:41:29 smeserver kernel: sda: sda1 sda2
Oct 5 13:41:30 smeserver kernel: md: bind<sda2>
Oct 5 13:41:30 smeserver kernel: md: kicking non-fresh sda2 from array!
Oct 5 13:41:30 smeserver kernel: md: unbind<sda2>
Oct 5 13:41:30 smeserver kernel: md: export_rdev(sda2)
Oct 5 13:41:34 smeserver kernel: md: could not bd_claim sda2.
Oct 5 13:41:34 smeserver kernel: md: considering sda2 ...
Oct 5 13:41:34 smeserver kernel: md: adding sda2 ...
Oct 5 13:41:35 smeserver kernel: md: md2 already running, cannot run sda2
Oct 5 13:41:35 smeserver kernel: md: export_rdev(sda2)

Non è che avere un raid hw che non viene riconosciuto può dare dei problemi?

Sto facendo un backup aggiornato.

Ciao Nicola
Title: Re: DegradedArray event
Post by: Stefano on October 06, 2008, 07:38:20 PM: Quote from: nicos on October 06, 2008, 05:36:11 PM
OK Vado in ordine come mi hai chiesto :?

Il server è un proliant ml 150 g3

ok..

Quote
Il controller presumo che sia un intel ICH ESB2 integrato nella mainboard

ok..

Quote
CODE:cat /proc/mdstat

Personalities : [raid1]
md2 : active raid1 sdb2[1]
488279488 blocks [2/1] [_U]

md1 : active raid1 sda1[0] sdb1[1]
104320 blocks [2/2] [UU]

ok

Quote
CODE:grep 'sda2' /var/log/messages

Oct 5 13:41:29 smeserver kernel: sda: sda1 sda2
Oct 5 13:41:30 smeserver kernel: md: bind<sda2>
Oct 5 13:41:30 smeserver kernel: md: kicking non-fresh sda2 from array!

cosa è successo prima?

prova a cercare con
Code: [Select]
grep sda /var/log/messages
in particolare gli eventi prima delle 13:41 di ieri

Quote
Non è che avere un raid hw che non viene riconosciuto può dare dei problemi?

non che io sappia.. SME ha visto ed utilizzato i 2 dischi come se il raid non esistesse, anzi per lui non esiste proprio.. ;-)

Quote
Sto facendo un backup aggiornato.

questo è solo un bene.. assicurati di farlo con continuità ;-)

non mi hai però detto se hai poi ri-aggiunto la partizione sda2 all'array come ti ho indicato..

Ciao

Stefano

P.S. se trovi 2 minuti, leggi qui http://forums.contribs.org/index.php?topic=41381.0 (http://forums.contribs.org/index.php?topic=41381.0)
Title: Re: DegradedArray event
Post by: nicos on October 07, 2008, 09:55:33 AM: Ciao e grazie per le tue risposte.

CODE: grep sda /var/log/messages

Oct 5 13:41:28 smeserver kernel: SCSI device sda: 976773168 512-byte hdwr sectors (500108 MB)
Oct 5 13:41:29 smeserver kernel: SCSI device sda: drive cache: write through
Oct 5 13:41:29 smeserver kernel: SCSI device sda: 976773168 512-byte hdwr sectors (500108 MB)
Oct 5 13:41:29 smeserver kernel: SCSI device sda: drive cache: write through
Oct 5 13:41:29 smeserver kernel: sda: sda1 sda2
Oct 5 13:41:29 smeserver kernel: Attached scsi disk sda at scsi0, channel 0, id 0, lun 0
Oct 5 13:41:30 smeserver kernel: md: bind<sda1>
Oct 5 13:41:30 smeserver kernel: md: bind<sda2>
Oct 5 13:41:30 smeserver kernel: md: kicking non-fresh sda2 from array!
Oct 5 13:41:30 smeserver kernel: md: unbind<sda2>
Oct 5 13:41:30 smeserver kernel: md: export_rdev(sda2)
Oct 5 13:41:34 smeserver kernel: md: could not bd_claim sda1.
Oct 5 13:41:34 smeserver kernel: md: could not bd_claim sda2.
Oct 5 13:41:34 smeserver kernel: md: considering sda2 ...
Oct 5 13:41:34 smeserver kernel: md: adding sda2 ...
Oct 5 13:41:35 smeserver kernel: md: md2 already running, cannot run sda2
Oct 5 13:41:35 smeserver kernel: md: export_rdev(sda2)

Ancora non ho ri-aggiunto la partizione sda2 all'array come mi hai indicato...
Prima vorrei tentare di capire cosa è successo...

Nicola
Title: Re: DegradedArray event
Post by: Stefano on October 07, 2008, 11:45:43 AM: Quote from: nicos on October 07, 2008, 09:55:33 AM
Oct 5 13:41:28 smeserver kernel: SCSI device sda: 976773168 512-byte hdwr sectors (500108 MB)
Oct 5 13:41:29 smeserver kernel: SCSI device sda: drive cache: write through
Oct 5 13:41:29 smeserver kernel: SCSI device sda: 976773168 512-byte hdwr sectors (500108 MB)
Oct 5 13:41:29 smeserver kernel: SCSI device sda: drive cache: write through
Oct 5 13:41:29 smeserver kernel: sda: sda1 sda2
Oct 5 13:41:29 smeserver kernel: Attached scsi disk sda at scsi0, channel 0, id 0, lun 0
Oct 5 13:41:30 smeserver kernel: md: bind<sda1>
Oct 5 13:41:30 smeserver kernel: md: bind<sda2>
Oct 5 13:41:30 smeserver kernel: md: kicking non-fresh sda2 from array!

ok.. ma non sappiamo COSA è successo prima.. hai riavviato il server?

cerca in messages*

Quote
Ancora non ho ri-aggiunto la partizione sda2 all'array come mi hai indicato...
Prima vorrei tentare di capire cosa è successo...

aggiungila e poi monitorizza /var/log/messages con un
Code: [Select]
tail -f /var/log/messages | grep sda
se succede qualcosa (il disco è rotto o altro) te lo scrive

Ciao
Stefano
Title: Re: DegradedArray event
Post by: nicos on October 09, 2008, 12:42:48 PM: /root$ cat /proc/mdstat
Personalities : [raid1]
md2 : active raid1 sda2[0] sdb2[1]
488279488 blocks [2/2] [UU]

md1 : active raid1 sda1[0] sdb1[1]
104320 blocks [2/2] [UU]

unused devices: <none>

Grazie Per l'aiuto.

Nicola