Koozali.org: home of the SME Server
Other Languages => Italiano => Topic started by: nicos on October 06, 2008, 10:50:17 AM
-
Ciao a tutti,
Ho installato su un server hp proliant una SME 7.3
Il server in questione ha 2 dischi sata da 500 giga in raid 1 hardware.
Da alcuni giorni ricevo da admin il seguente messaggio:
A DegradedArray event has been detected on md device /dev/md2.
Il controller raid del server non rileva nessun problema.
Con il comando
mdadm --query --detail /dev/md[12]
questo è il risultato:
/dev/md1:
Version : 00.90.01
Creation Time : Wed May 7 13:47:00 2008
Raid Level : raid1
Array Size : 104320 (101.89 MiB 106.82 MB)
Device Size : 104320 (101.89 MiB 106.82 MB)
Raid Devices : 2
Total Devices : 2
Preferred Minor : 1
Persistence : Superblock is persistent
Update Time : Sun Oct 5 13:43:15 2008
State : clean
Active Devices : 2
Working Devices : 2
Failed Devices : 0
Spare Devices : 0
UUID : 12db2092:10bd21e3:9c2c43d6:2b876493
Events : 0.1750
Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
1 8 17 1 active sync /dev/sdb1
/dev/md2:
Version : 00.90.01
Creation Time : Wed May 7 13:47:00 2008
Raid Level : raid1
Array Size : 488279488 (465.66 GiB 500.00 GB)
Device Size : 488279488 (465.66 GiB 500.00 GB)
Raid Devices : 2
Total Devices : 1
Preferred Minor : 2
Persistence : Superblock is persistent
Update Time : Mon Oct 6 10:31:22 2008
State : active, degraded
Active Devices : 1
Working Devices : 1
Failed Devices : 0
Spare Devices : 0
UUID : 82b11445:a2d2b33c:23b23401:ae2c50c8
Events : 0.5946665
Number Major Minor RaidDevice State
0 0 0 - removed
1 8 18 1 active sync /dev/sdb2
Qualche esperto può aiutarmi a capire il problema?
Grazie mille.
-
ciao
raid HW? sicuro?
per cortesia, posta qui:
cat /proc/mdstat
proliant che modello? che controller raid?
da quel che capisco il raid HW non è in funzione.. e se il controller è un fakeraid SME vede i 2 dischi..
Ciao
Stefano
-
Comunque hai ragione....
Lo SME non riconosce il raid hardware e da quanto ho capito ha fatto in automatico un raid software che si è degradato.... :(
Potrei sapere la procedura migliore per ripristinare il raid software tenendo presente che sono un utente Linux alle prime armi?
Grazie e scusa ancora.
-
ciao
non hai postato quello che ti ho chiesto ma vabbè, si fa lo stesso ;-)
allora..
c'è da sapere che certe volte l'array va fuori sync anche per nulla e non è detto che il disco sia da buttare.
andiamo per ordine:
1) cerca in /var/log/messages eventuali errori con
grep 'sda2' /var/log/messages
questo dovrebbe darti il messaggio di errore che ha fatto mettere off-line il disco sda (o meglio, al sua partizione sda2)..
posta qui il risultato, grazie
2) prova a re-inserire il disco nell'array con
mdadm -a /dev/md2 /dev/sda2
ed a monitorare lo stato della ricostruzione con
cat /proc/mdstat
se il disco è ok la procedura dovrebbe andare a buon fine.. occhio che potrebbe volerci molto, con hd da 500 Gb
Naturalmente tu hai un backup dei dati, vero?
Ciao
Stefano
-
OK Vado in ordine come mi hai chiesto :?
Il server è un proliant ml 150 g3
Il controller presumo che sia un intel ICH ESB2 integrato nella mainboard
CODE:cat /proc/mdstat
Personalities : [raid1]
md2 : active raid1 sdb2[1]
488279488 blocks [2/1] [_U]
md1 : active raid1 sda1[0] sdb1[1]
104320 blocks [2/2] [UU]
CODE:grep 'sda2' /var/log/messages
Oct 5 13:41:29 smeserver kernel: sda: sda1 sda2
Oct 5 13:41:30 smeserver kernel: md: bind<sda2>
Oct 5 13:41:30 smeserver kernel: md: kicking non-fresh sda2 from array!
Oct 5 13:41:30 smeserver kernel: md: unbind<sda2>
Oct 5 13:41:30 smeserver kernel: md: export_rdev(sda2)
Oct 5 13:41:34 smeserver kernel: md: could not bd_claim sda2.
Oct 5 13:41:34 smeserver kernel: md: considering sda2 ...
Oct 5 13:41:34 smeserver kernel: md: adding sda2 ...
Oct 5 13:41:35 smeserver kernel: md: md2 already running, cannot run sda2
Oct 5 13:41:35 smeserver kernel: md: export_rdev(sda2)
Non è che avere un raid hw che non viene riconosciuto può dare dei problemi?
Sto facendo un backup aggiornato.
Ciao Nicola
-
OK Vado in ordine come mi hai chiesto :?
Il server è un proliant ml 150 g3
ok..
Il controller presumo che sia un intel ICH ESB2 integrato nella mainboard
ok..
CODE:cat /proc/mdstat
Personalities : [raid1]
md2 : active raid1 sdb2[1]
488279488 blocks [2/1] [_U]
md1 : active raid1 sda1[0] sdb1[1]
104320 blocks [2/2] [UU]
ok
CODE:grep 'sda2' /var/log/messages
Oct 5 13:41:29 smeserver kernel: sda: sda1 sda2
Oct 5 13:41:30 smeserver kernel: md: bind<sda2>
Oct 5 13:41:30 smeserver kernel: md: kicking non-fresh sda2 from array!
cosa è successo prima?
prova a cercare con
grep sda /var/log/messages
in particolare gli eventi prima delle 13:41 di ieri
Non è che avere un raid hw che non viene riconosciuto può dare dei problemi?
non che io sappia.. SME ha visto ed utilizzato i 2 dischi come se il raid non esistesse, anzi per lui non esiste proprio.. ;-)
Sto facendo un backup aggiornato.
questo è solo un bene.. assicurati di farlo con continuità ;-)
non mi hai però detto se hai poi ri-aggiunto la partizione sda2 all'array come ti ho indicato..
Ciao
Stefano
P.S. se trovi 2 minuti, leggi qui http://forums.contribs.org/index.php?topic=41381.0 (http://forums.contribs.org/index.php?topic=41381.0)
-
Ciao e grazie per le tue risposte.
CODE: grep sda /var/log/messages
Oct 5 13:41:28 smeserver kernel: SCSI device sda: 976773168 512-byte hdwr sectors (500108 MB)
Oct 5 13:41:29 smeserver kernel: SCSI device sda: drive cache: write through
Oct 5 13:41:29 smeserver kernel: SCSI device sda: 976773168 512-byte hdwr sectors (500108 MB)
Oct 5 13:41:29 smeserver kernel: SCSI device sda: drive cache: write through
Oct 5 13:41:29 smeserver kernel: sda: sda1 sda2
Oct 5 13:41:29 smeserver kernel: Attached scsi disk sda at scsi0, channel 0, id 0, lun 0
Oct 5 13:41:30 smeserver kernel: md: bind<sda1>
Oct 5 13:41:30 smeserver kernel: md: bind<sda2>
Oct 5 13:41:30 smeserver kernel: md: kicking non-fresh sda2 from array!
Oct 5 13:41:30 smeserver kernel: md: unbind<sda2>
Oct 5 13:41:30 smeserver kernel: md: export_rdev(sda2)
Oct 5 13:41:34 smeserver kernel: md: could not bd_claim sda1.
Oct 5 13:41:34 smeserver kernel: md: could not bd_claim sda2.
Oct 5 13:41:34 smeserver kernel: md: considering sda2 ...
Oct 5 13:41:34 smeserver kernel: md: adding sda2 ...
Oct 5 13:41:35 smeserver kernel: md: md2 already running, cannot run sda2
Oct 5 13:41:35 smeserver kernel: md: export_rdev(sda2)
Ancora non ho ri-aggiunto la partizione sda2 all'array come mi hai indicato...
Prima vorrei tentare di capire cosa è successo...
Nicola
-
Oct 5 13:41:28 smeserver kernel: SCSI device sda: 976773168 512-byte hdwr sectors (500108 MB)
Oct 5 13:41:29 smeserver kernel: SCSI device sda: drive cache: write through
Oct 5 13:41:29 smeserver kernel: SCSI device sda: 976773168 512-byte hdwr sectors (500108 MB)
Oct 5 13:41:29 smeserver kernel: SCSI device sda: drive cache: write through
Oct 5 13:41:29 smeserver kernel: sda: sda1 sda2
Oct 5 13:41:29 smeserver kernel: Attached scsi disk sda at scsi0, channel 0, id 0, lun 0
Oct 5 13:41:30 smeserver kernel: md: bind<sda1>
Oct 5 13:41:30 smeserver kernel: md: bind<sda2>
Oct 5 13:41:30 smeserver kernel: md: kicking non-fresh sda2 from array!
ok.. ma non sappiamo COSA è successo prima.. hai riavviato il server?
cerca in messages*
Ancora non ho ri-aggiunto la partizione sda2 all'array come mi hai indicato...
Prima vorrei tentare di capire cosa è successo...
aggiungila e poi monitorizza /var/log/messages con un
tail -f /var/log/messages | grep sda
se succede qualcosa (il disco è rotto o altro) te lo scrive
Ciao
Stefano
-
/root$ cat /proc/mdstat
Personalities : [raid1]
md2 : active raid1 sda2[0] sdb2[1]
488279488 blocks [2/2] [UU]
md1 : active raid1 sda1[0] sdb1[1]
104320 blocks [2/2] [UU]
unused devices: <none>
Grazie Per l'aiuto.
Nicola