Koozali.org: home of the SME Server

kernel panic - not syncing

kernel panic - not syncing
« on: April 27, 2011, 03:34:16 PM »
Salve, penso di essere nei guai. Ho un server sme di un mio cliente con
- 4 hdd da 2tb sata in raid5 nospare nolvm, sme 7.5.1
che ha funzionato correttamente per qualche tempo ma adesso durante il boot mi da il seguente errore

Code: [Select]
md3 : raid array is not clean : starting background recostruction
raid 5 : device sdb3 operational as raid disk 1
raid 5 : device sdd3 operational as raid disk 2
raid 5 : device sdc3 operational as raid disk 3
raid 5 : can not start dirty degraded array for md3
--rd:4 wd:3 fd:1
disk 1, o:1 , dev:sdb3
disk 2, o:1 , dev:sdc3
disk 3, o:1 , dev:sdd3
raid5 failed to run raidset md3
...
kernel panic - not syncing


Riesco a partire con sme rescue ma ho davvero poca pratica e non so come muovermi.
Se lancio fdisk mi riporta i singoli dischi ognuno con 3 partizioni (la prima riporta un asterisco) e tipo 'fd'.
Quando tutto funzionava il volume raid era /dev/md3 che adesso non compare.
Come posso procedere...ho una copia dei dati ma con un giorno di sfasatura e si tratta del lavoro di 14 persone...
Preferirei cercare di recuperare questa installazione.
Grazie.

Antonio


Re: kernel panic - not syncing
« Reply #1 on: April 27, 2011, 03:43:01 PM »
Vorrei inviare un immagine completa dell'errore che ho in formato jpg ma non ho ben capito come postarla... Ho davvero urgenza di risolvere, questa non è una prova.

Antonio

Offline Stefano

  • *
  • 10,894
  • +3/-0
Re: kernel panic - not syncing
« Reply #2 on: April 27, 2011, 04:22:52 PM »
Vorrei inviare un immagine completa dell'errore che ho in formato jpg ma non ho ben capito come postarla... Ho davvero urgenza di risolvere, questa non è una prova.

Antonio

devi metterla su un server remoto e poi linkarla qui

Offline Stefano

  • *
  • 10,894
  • +3/-0
Re: kernel panic - not syncing
« Reply #3 on: April 27, 2011, 04:27:52 PM »
Salve, penso di essere nei guai.

capita

Quote
Ho un server sme di un mio cliente con
- 4 hdd da 2tb sata in raid5 nospare nolvm, sme 7.5.1
che ha funzionato correttamente per qualche tempo ma adesso durante il boot mi da il seguente errore

Code: [Select]
md3 : raid array is not clean : starting background recostruction
raid 5 : device sdb3 operational as raid disk 1
raid 5 : device sdd3 operational as raid disk 2
raid 5 : device sdc3 operational as raid disk 3
raid 5 : can not start dirty degraded array for md3
--rd:4 wd:3 fd:1
disk 1, o:1 , dev:sdb3
disk 2, o:1 , dev:sdc3
disk 3, o:1 , dev:sdd3
raid5 failed to run raidset md3
...
kernel panic - not syncing

con ogni probabilità il disco sda è andato

domande:
- chi legge le email amministrative?
- cosa è successo al server? riavvio/spegnimento brutale? qualche aggiornamento ultimamente?

Quote
Riesco a partire con sme rescue ma ho davvero poca pratica e non so come muovermi.

ti riconosce l'installazione?

Quote
Se lancio fdisk mi riporta i singoli dischi ognuno con 3 partizioni (la prima riporta un asterisco) e tipo 'fd'.

normale.. li vedi tutti i dischi?

Quote
Quando tutto funzionava il volume raid era /dev/md3 che adesso non compare.

chiaramente.. non parte il raid..

Quote
Come posso procedere...ho una copia dei dati ma con un giorno di sfasatura e si tratta del lavoro di 14 persone...
Preferirei cercare di recuperare questa installazione.

intanto procurati un hd sostitutivo

poi rispondi alle domande e se vuoi contattami via skype

Re: kernel panic - not syncing
« Reply #4 on: April 27, 2011, 04:54:16 PM »
Quote
ti riconosce l'installazione?
No, mi dice che non ne rileva alcuna

Quote
normale.. li vedi tutti i dischi?
si e con fdisk -l per ogni disco mi mostra le 3 partizioni (boot,swap e sistema con dati). Rileva come tipo partizione 'fd'

Ho già un harddisk sostitutivo identico a quelli montati da 2tb.
Partendo con gparted per ogni hdd mi vede le 3 partizioni ...
sul sda
riconosce la prima come boot
riconosce la seconda come swap
la terza la vede come sconosciuta

su tutti gli altri
riconosce la prima come boot
la seconda la vede come sconosciuta
la terza la vede come sconosciuta

Come posso procedere?

Antonio

Offline Stefano

  • *
  • 10,894
  • +3/-0
Re: kernel panic - not syncing
« Reply #5 on: April 27, 2011, 05:09:07 PM »
No, mi dice che non ne rileva alcuna

ok..

Quote
si e con fdisk -l per ogni disco mi mostra le 3 partizioni (boot,swap e sistema con dati). Rileva come tipo partizione 'fd'

ok, corretto

Quote
Ho già un harddisk sostitutivo identico a quelli montati da 2tb.

tienilo pronto :-)

come supponevo..

mi rispondi anche alle altre domande? chi legge le email amministrative?

la cosa da fare è far partire, da SME rescue, l'array dicendogli che il disco sda è failed.. il raid dovrebbe partire in modalità degradata.. poi tramite mdadm si rimuove il disco sda (tutte le sue partizioni) da tutti gli array

quando tutto è a posto si reboota la macchina (che dovrebbe ripartire correttamente), e si opera tramite console inserendo il nuovo disco (nel frattempo fisicamente inserito nel server) nell'array..

NON provare a fare l'hot plug.. :-)

intanto, avvia da cd in modalità rescue e dimmi cosa dice
Code: [Select]
cat /proc/mdstat



Re: kernel panic - not syncing
« Reply #6 on: April 27, 2011, 06:08:09 PM »
Quote
chi legge le email amministrative?

...sinceramente nell'ultimo periodo non sono state lette.

Quote
cat /proc/mdstat
niente di buono, penso...

Code: [Select]
Personalities : [raid0] [raid1] [raid5] [raid6]
unused devices : <none>

Offline Stefano

  • *
  • 10,894
  • +3/-0
Re: kernel panic - not syncing
« Reply #7 on: April 27, 2011, 06:13:02 PM »
...sinceramente nell'ultimo periodo non sono state lette.

e questo è M A L E

sto creando una macchina virtuale come la tua (4 hd, raid5 nospare, no lvm) in scala ridotta per simulare la cosa..

quanta ram ha la macchina? posta l'output di
Code: [Select]
fdisk -l /dev/sdb

ripeto: se vuoi che facciamo prima passa su altro canale (skype)

Re: kernel panic - not syncing
« Reply #8 on: April 27, 2011, 06:33:16 PM »
Quote
e questo è M A L E
hai ragione, sarò più attento.

Quote
quanta ram ha la macchina?
4gb

Quote
fdisk -l /dev/sdb

Code: [Select]
disk /dev/sdb: 2000.3 gb, 2000398934016 bytes
255 heads, 63 sectors/track, 243201 cylinders
units = cylinders of 16065 * 512 = 8225280 bytes
/dev/sdb1 *    1       13        014391 fd system linux raid autodetect
/dev/sdb2     14      267      2040255 fd system linux raid autodetect
/dev/sdb3    268 243201 1951367355 fd system linux raid autodetect



Re: kernel panic - not syncing
« Reply #9 on: April 27, 2011, 09:54:04 PM »
Ciao Stefano, ti ho appena inviato una richiesta di contatto su skype. Domani dovrei riconsegnare il server... :(

Offline Stefano

  • *
  • 10,894
  • +3/-0
Re: kernel panic - not syncing
« Reply #10 on: April 28, 2011, 10:27:12 AM »
Per i posteri:

- avviato il server con cd avviabile di SysrescueCd e verificato salute dischi tramite smartctl (non disponibile da SME rescue)
- avviato server con cd di SMe in modalità rescue
- forzato lo start dell'array con
Code: [Select]
mdadm --assemble --force /dev/md3 /dev/sd[b-d]3
- spento server e rimosso disco sda (quello problematico)
- riavviato server in modalità rescue e verificato che l'installazione su dischi venisse correttamente rilevata
- riavviato server in modalità normale (da dischi)
- shutdown controllato
- installazione disco sostitutivo
- riavvio e reinserimento del nuovo disco nell'array tramite punto 5 della console
- verifica che la ricostruzione proceda

Offline Fumetto

  • *
  • 899
  • +1/-0
Re: kernel panic - not syncing
« Reply #11 on: April 28, 2011, 10:06:04 PM »
... e il cero a S. Stefano? :P

Offline Stefano

  • *
  • 10,894
  • +3/-0
Re: kernel panic - not syncing
« Reply #12 on: April 28, 2011, 10:15:15 PM »
... e il cero a S. Stefano? :P

nessun cero, ma moccoli a pioggia.. e cazziatone extra large ;-)

Re: kernel panic - not syncing
« Reply #13 on: April 29, 2011, 06:29:53 PM »
VA TUTTO BENE!!!
Ho portato il server dal cliente ed è attualmente operativo. Una sola stranezza...facendo un calcolo ci doveva mettere 6 giorni a fare il rebuild, il realtà ha finito dopo poche ore, strano perchè la velocità dichiarata con la quale ho ricavato il calcolo dei 6 giorni è rimasta costante per oltre 20min, oltre non so.
Resta solo un dilemma atroce...che cosa e perchè è successo...ai posteri l'ardua sentenza. L'hard disk rimosso è stato testato con successo con seatool 2.2 (era un seagate).

Ciao Stefano e grazie davvero.
Antonio.