Koozali.org: home of the SME Server

Other Languages => Italiano => Topic started by: vgsangiuliano on April 13, 2007, 02:02:11 PM

Title: Problema raid
Post by: vgsangiuliano on April 13, 2007, 02:02:11 PM
Ciao a tutti sto utilizzando lo sme con il raid software dello sme stesso.
Oggi il sistema mi ha mandato questa mail:

A Fail event has been detected on md device /dev/md2.

Guardando nella gestione raid del pannello di controllo loggandomi come admin via ssh mi dice:

Stato RAID corrente:

Personalities : [raid1]
md1: active raid1 hda1[0]  hdc[1]
         104320 blocks [2/2]  [UU]
md2: active raid1 hda2[2] (F) hdc2[1]
         40041920 blocks [2/1]  [_U]
unused devices: <none>

Solo alcune periferiche RAID sono corrotte.
Potrebbe essere necessario un intervento manuale.


Bene la mia domanda è:
cosa devo fare?
potrebbe essere utile ricostruire l'array?
se si come si fa?
Grazie
Mirko
Title: Re: Problema raid
Post by: Stefano on April 13, 2007, 02:25:12 PM
Quote from: "vgsangiuliano"
Ciao a tutti sto utilizzando lo sme con il raid software dello sme stesso.
Oggi il sistema mi ha mandato questa mail:

A Fail event has been detected on md device /dev/md2.

Guardando nella gestione raid del pannello di controllo loggandomi come admin via ssh mi dice:

Stato RAID corrente:

Personalities : [raid1]
md1: active raid1 hda1[0]  hdc[1]
         104320 blocks [2/2]  [UU]
md2: active raid1 hda2[2] (F) hdc2[1]
         40041920 blocks [2/1]  [_U]
unused devices: <none>

Solo alcune periferiche RAID sono corrotte.
Potrebbe essere necessario un intervento manuale.


Bene la mia domanda è:
cosa devo fare?
potrebbe essere utile ricostruire l'array?
se si come si fa?
Grazie
Mirko


ciao

allora..

qualche volta capita che un disco (o meglio una partizione) venga "sputata" fuori dal raid..

da shell, prova a dare

mdadm -a /dev/md2 /dev/hda2

se poi digiti

cat /proc/mdstat puoi verificare lo stato di ricostruzione dell'array..

in ogni caso, un

grep -i hda2 /var/log/messages

dovrebbe/potrebbe darti maggiori info sul perchè la partizione hda2 sia stata marchiata come failed

HTH

Stefano
Title: Problema raid
Post by: vgsangiuliano on April 14, 2007, 09:03:26 AM
Grazie Stefano per la tua risposta velocissima. dopo la ricostruzione dell'array lo stato del raid è sempre lo stesso. questo è l'output di grep -i hda2 /var/log/messages  e di mdadm -D
Cosa si può fare? Da quello che mi sembra di capire hda2 è stato disabilitato o sbaglio? C'è da cambiare l'hd?
Mirko

Apr  7 10:18:03 server kernel:  hda: hda1 hda2
Apr  7 10:18:05 server kernel: md: bind<hda2>
Apr  7 10:18:05 server kernel: md: could not bd_claim hda2.
Apr  7 10:47:39 server kernel:  hda: hda1 hda2
Apr  7 10:47:39 server kernel: md: bind<hda2>
Apr  7 10:47:39 server kernel: md: could not bd_claim hda2.
Apr 10 08:38:47 server kernel:  hda: hda1 hda2
Apr 10 08:38:47 server kernel: md: bind<hda2>
Apr 10 08:38:47 server kernel: md: could not bd_claim hda2.
Apr 11 14:45:57 server kernel:  hda: hda1 hda2
Apr 11 14:45:57 server kernel: md: bind<hda2>
Apr 11 14:45:57 server kernel: md: could not bd_claim hda2.
Apr 11 15:17:13 server kernel:  hda: hda1 hda2
Apr 11 15:17:15 server kernel: md: bind<hda2>
Apr 11 15:17:15 server kernel: md: could not bd_claim hda2.
Apr 11 16:09:45 server kernel:  hda: hda1 hda2
Apr 11 16:09:49 server kernel: md: bind<hda2>
Apr 11 16:09:49 server kernel: md: could not bd_claim hda2.
Apr 11 16:12:36 server kernel:  hda: hda1 hda2
Apr 11 16:12:36 server kernel: md: bind<hda2>
Apr 11 16:12:38 server kernel: md: could not bd_claim hda2.
Apr 11 16:16:30 server kernel:  hda: hda1 hda2
Apr 11 16:16:30 server kernel: md: bind<hda2>
Apr 11 16:16:30 server kernel: md: could not bd_claim hda2.
Apr 11 16:57:46 server kernel:  hda: hda1 hda2
Apr 11 16:57:46 server kernel: md: bind<hda2>
Apr 11 16:57:46 server kernel: md: could not bd_claim hda2.
Apr 11 17:00:52 server kernel:  hda: hda1 hda2
Apr 11 17:00:52 server kernel: md: bind<hda2>
Apr 11 17:00:52 server kernel: md: could not bd_claim hda2.
Apr 12 21:29:35 server kernel: raid1: Disk failure on hda2, disabling device.
Apr 12 21:29:35 server kernel: raid1: hda2: rescheduling sector 33048552
Apr 12 21:29:39 server kernel:  disk 0, wo:1, o:0, dev:hda2
Apr 13 14:09:31 server kernel:  hda: hda1 hda2
Apr 13 14:09:31 server kernel: md: bind<hda2>
Apr 13 14:09:31 server kernel: md: kicking non-fresh hda2 from array!
Apr 13 14:09:31 server kernel: md: unbind<hda2>
Apr 13 14:09:31 server kernel: md: export_rdev(hda2)
Apr 13 14:09:31 server kernel: md: could not bd_claim hda2.
Apr 13 14:09:31 server kernel: md: considering hda2 ...
Apr 13 14:09:31 server kernel: md:  adding hda2 ...
Apr 13 14:09:31 server kernel: md: md2 already running, cannot run hda2
Apr 13 14:09:31 server kernel: md: export_rdev(hda2)
Apr 13 14:31:08 server kernel: md: bind<hda2>
Apr 13 14:31:08 server kernel:  disk 0, wo:1, o:1, dev:hda2
Apr 13 20:49:28 server kernel: raid1: Disk failure on hda2, disabling device.
Apr 13 20:49:29 server kernel:  disk 0, wo:1, o:0, dev:hda2


/dev/md1:
        Version : 00.90.01
  Creation Time : Sat Mar 31 13:02:15 2007
     Raid Level : raid1
     Array Size : 104320 (101.88 MiB 106.82 MB)
    Device Size : 104320 (101.88 MiB 106.82 MB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 1
    Persistence : Superblock is persistent

    Update Time : Fri Apr 13 14:10:48 2007
          State : clean
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0


    Number   Major   Minor   RaidDevice State
       0       3        1        0      active sync   /dev/hda1
       1      22        1        1      active sync   /dev/hdc1
           UUID : 01a91bdc:a5ae1274:e5129f8c:695577e0
         Events : 0.3451

/dev/md2:
        Version : 00.90.01
  Creation Time : Sat Mar 31 13:02:15 2007
     Raid Level : raid1
     Array Size : 40041920 (38.19 GiB 41.00 GB)
    Device Size : 40041920 (38.19 GiB 41.00 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 2
    Persistence : Superblock is persistent

    Update Time : Sat Apr 14 09:26:37 2007
          State : clean, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 1
  Spare Devices : 0


    Number   Major   Minor   RaidDevice State
       0       0        0       -1      removed
       1      22        2        1      active sync   /dev/hdc2
       2       3        2       -1      faulty   /dev/hda2
           UUID : 0a74ff22:3c5821db:848584c9:b48c063d
         Events : 0.4328186
Title: Problema raid
Post by: Stefano on April 14, 2007, 10:27:43 AM
Quote from: "vgsangiuliano"

Apr 12 21:29:35 server kernel: raid1: hda2: rescheduling sector 33048552


pare ci sia un settore danneggiato..

ciao

Stefano
Title: Problema raid
Post by: vgsangiuliano on April 14, 2007, 10:49:59 AM
grazie stefano. Ho rimosso l'hd che non funziona, e voglio installarne un altro identico e poi risincronizzare il tutto.
Ora il server sta girando con un solo hd (quello funzionante).
Io ho un altro hd sempre maxtor da 40 gb non formattato (unallocated space). Ho provato a collegarlo nella speranza che lo sme facesse tutto da solo ma con questo hd il server non parte.
Devo preparare prima l'hd?
C'è qualche guida da eguire?
Grazie
Mirko
Title: Problema raid
Post by: Stefano on April 14, 2007, 11:14:36 AM
Quote from: "vgsangiuliano"
grazie stefano. Ho rimosso l'hd che non funziona, e voglio installarne un altro identico e poi risincronizzare il tutto.
Ora il server sta girando con un solo hd (quello funzionante).
Io ho un altro hd sempre maxtor da 40 gb non formattato (unallocated space). Ho provato a collegarlo nella speranza che lo sme facesse tutto da solo ma con questo hd il server non parte.
Devo preparare prima l'hd?
C'è qualche guida da eguire?
Grazie
Mirko


ciao Mirko..

si, c'è la guida di SME :-D

comunque, loggati in console come admin ed avrai una voce di menu per la gestione degli hd del raid..

un consiglio, spero tu capisca il mio intento: se usi sme in ambiente di produzione, e su esso basi una attività, ci memorizzi dei dati e, alla fin fine, condizioni la produttività di un qualsiasi ambiente di lavoro, ti conviene leggere bene tutta la guida.. e fare test, provare e capire..

magari usando vmware, che ti permette di non fare malanni..

questo perchè sme è estremamente semplice da installare e configurare ma se qualcosa non funziona (e quindi si blocca il lavoro) è necessario sapere con che cosa si ha a che fare ;-)

quindi, concludendo:
- leggi bene la guida
- leggi sempre bene le mail amministrative che il server spedisce a root
- usa la funzione search di questo sito e google.. non dimentichiamo che sme è una distribuzione linux e quindi, di fondo, i problemi che si possono verificare sono più o meno gli stessi di tutte le altre distribuzioni.
- impara a guardare i log di sistema e a capirli. linux logga praticamente tutto e con pochi comandi da linea di comando si può sapere tutto.. /var/log/messages è il punto da cui partire ed è certamente tuo amico :-)

nel caso specifico fai così:
- apri due sessioni della console (con putty o altro client)
- in una ti logghi come admin, nell'altra come root
- in quella di root dai il comando
Code: [Select]
tail -f /var/log/messages
- in quella di admin scegli la procedura per aggiungere l'hd al raid
- guarda i log e vedi cosa succede

Spero di esserti stato utile, in ogni caso, tempo permettendo, son qua..

ah, mi trovi anche al messenger eventualmente

Ciao

Stefano
Title: Problema raid
Post by: vgsangiuliano on April 14, 2007, 11:21:06 AM
Grazie stefano. Capisco quello che mi hai detto, ma non preoccuparti il server non è in produzione o meglio lo è ma non fa praticamente nulla se non gestire gli accessi ad internet. Di file importante condiviso c'è ne è solo 1 da 50 mb che ogni giorno salvo quindi non ho problemi anche se il server non funzionasse.
La mia domanda è (se possibile mi dai il tuo nick per trovarti sul messenger.)
Inoltre se collego un altro hd da 40 gb identico a quello funzionante il server non parte proprio quindi non riesco a loggarmi e a fare niente.
Per questo pensavo che l'hd andasse prima preparato, ora io ho solo cancellato le partizioni che avevo e ho lasciato spazio non allocato nella speranza che sme facesse tutto, ma se collego l'hd (ho i cass. estraibili, quindi l'operazione è veloce) lo sme non parte
Grazie
Title: Problema raid
Post by: Stefano on April 14, 2007, 11:27:16 AM
Quote from: "vgsangiuliano"
Grazie stefano. Capisco quello che mi hai detto, ma non preoccuparti il server non è in produzione o meglio lo è ma non fa praticamente nulla se non gestire gli accessi ad internet. Di file importante condiviso c'è ne è solo 1 da 50 mb che ogni giorno salvo quindi non ho problemi anche se il server non funzionasse.


buon per te.. certo è che se si blocca non si accede ad internet ;-)

Quote
La mia domanda è (se possibile mi dai il tuo nick per trovarti sul messenger.)


dovresti poter accedere al mio profilo e li trovi l'account

Quote
Inoltre se collego un altro hd da 40 gb identico a quello funzionante il server non parte proprio quindi non riesco a loggarmi e a fare niente.
Per questo pensavo che l'hd andasse prima preparato, ora io ho solo cancellato le partizioni che avevo e ho lasciato spazio non allocato nella speranza che sme facesse tutto, ma se collego l'hd (ho i cass. estraibili, quindi l'operazione è veloce) lo sme non parte
Grazie


inverti i dischi.. dovrebbe funzionare..

a dire il vero comunque a me i cassetti estraibili hanno sempre e solo creato casini :-)

Ciao

Stefano
Title: Problema raid
Post by: vgsangiuliano on April 14, 2007, 11:31:08 AM
ok. hai ragione non avevo guardato il profilo.
Si è già capitato che dovessi spegnere e staccare il server, ma lo sme fa da server-gateway ed è collegato al router con una scheda di rete mentre l'altra è collegata ad un hub, quindi basta scollegare il router dallo sme, scollegare lo sme dall'hub e collegare il router all'hub ed ecco bypassato il problema di internet per tutti i pc.  :D
Comunque provo a invertire gli hd e ti faccio sapere
grazie
Title: Problema raid
Post by: Stefano on April 14, 2007, 11:33:50 AM
Quote from: "vgsangiuliano"
ok. hai ragione non avevo guardato il profilo.
Si è già capitato che dovessi spegnere e staccare il server, ma lo sme fa da server-gateway ed è collegato al router con una scheda di rete mentre l'altra è collegata ad un hub, quindi basta scollegare il router dallo sme, scollegare lo sme dall'hub e collegare il router all'hub ed ecco bypassato il problema di internet per tutti i pc.  :D


fammi capire... in tutto questo can can, cambi almeno l'indirizzo di rete interno del router oppure (come pare di capire) gli ip delle due schede di sme  appartengono alla stessa rete?


Quote
Comunque provo a invertire gli hd e ti faccio sapere
grazie


attendo.. ciao

S.
Title: Raid
Post by: maleficus01 on April 23, 2007, 12:51:34 PM
Buon giorno a tutti
credo di acere lo stesso problema o similare ma con una piccolissima differenza, il server del cliente è in produzione quindi mi devo sbrigare per non fare danni.
Guardando nella gestione raid del pannello di controllo loggandomi come admin via ssh mi dice:

Code: [Select]

Stato RAID corrente:

Personalities : [raid1]
md1 : active raid1 hdb1[1]
      104320 blocks [2/1] [_U]
md2 : active raid1 hdb2[1]
      156183808 blocks [2/1] [_U]
unused devices: <none>


devices: $VAR1 = {
          '/dev/md2' => {
                          'PreferredMinor' => '2',
                          'RaidLevel' => 'raid1',
                          'State' => 'clean, degraded',
                          'DeviceSize' => '156183808',
                          '1' => '       1       3       66        1      active sync   /dev/hdb2
',
                          'SpareDevices' => '0',
                          'RaidDevices' => '2',
                          'FailedDevices' => '0',
                          'UpdateTime' => 'Fri Apr 20 14:47:12 2007',
                          'ArraySize' => '156183808',
                          'UUID' => '83c709a0:8e501eed:20439ef0:b34504d4',
                          'CreationTime' => 'Tue Apr 17 17:53:35 2007',
                          'WorkingDevices' => '1',
                          'Persistence' => 'Superblock is persistent',
                          'UsedDisks' => [
                                           'hdb'
                                         ],
                          'Version' => '00.90.01',
                          'Events' => '0.151022',
                          'TotalDevices' => '1',
                          'ActiveDevices' => '1'
                        },
          '/dev/md1' => {
                          'PreferredMinor' => '1',
                          'RaidLevel' => 'raid1',
                          'State' => 'clean, degraded',
                          'DeviceSize' => '104320',
                          '1' => '       1       3       65        1      active sync   /dev/hdb1
',
                          'SpareDevices' => '0',
                          'RaidDevices' => '2',
                          'FailedDevices' => '0',
                          'UpdateTime' => 'Fri Apr 20 05:27:38 2007',
                          'ArraySize' => '104320',
                          'UUID' => 'e59c0da0:c2079719:e7d0c9ba:b5b74c85',
                          'CreationTime' => 'Tue Apr 17 17:53:35 2007',
                          'WorkingDevices' => '1',
                          'Persistence' => 'Superblock is persistent',
                          'UsedDisks' => [
                                           'hdb'
                                         ],
                          'Version' => '00.90.01',
                          'Events' => '0.1838',
                          'TotalDevices' => '1',
                          'ActiveDevices' => '1'
                        }
        };

used_disks: $VAR1 = {
          'hdb' => 2
        };

unclean: /dev/md2 => clean, degraded /dev/md1 => clean, degraded
recovering:
free_disks: $VAR1 = {
          'sda' => 1,
          'hda' => 1
        };






 Stato RAID venerdì aprile 20, 2007 14:47:13

                                x Stato RAID corrente:                                                    
                                                                                                         
                                x Personalities : [raid1]                                                  
                                x md1 : active raid1 hdb1[1]                                              
                                x       104320 blocks [2/1] [_U]                                          
                                x md2 : active raid1 hdb2[1]                                              
                                x       156183808 blocks [2/1] [_U]                                        
                                x unused devices: <none>                                                  
                                                                                                         
                                                                                               
                                x The free disk count must equal one.                                      
                                                                                                         
                                x Potrebbe essere necessario un intervento manuale.                        
                                                                                                         
                                x Stato attuale disco:                                                    
                                                                                                         
                                x Dischi installati: hdb sda hda                                          
                                x Dischi in uso: hdb                                                      

Sostanzialmente abbiamo rimosso un disco rotto (hda) ma al riavvio anzichè ricostruire il raid mi da questa schermata e non so dove mettere mani per non fare danni.
Potete aiutarmi ?   :roll:  :roll:  :roll:  :roll:
Title: Re: Raid
Post by: Stefano on April 26, 2007, 09:11:40 AM
Quote from: "maleficus01"
Buon giorno a tutti
credo di acere lo stesso problema o similare ma con una piccolissima differenza, il server del cliente è in produzione quindi mi devo sbrigare per non fare danni.
Guardando nella gestione raid del pannello di controllo loggandomi come admin via ssh mi dice:

Code: [Select]


unclean: /dev/md2 => clean, degraded /dev/md1 => clean, degraded
recovering:
free_disks: $VAR1 = {
          'sda' => 1,
          'hda' => 1
        };






 Stato RAID venerdì aprile 20, 2007 14:47:13

                                x Stato RAID corrente:                                                    
                                                                                                         
                                x Personalities : [raid1]                                                  
                                x md1 : active raid1 hdb1[1]                                              
                                x       104320 blocks [2/1] [_U]                                          
                                x md2 : active raid1 hdb2[1]                                              
                                x       156183808 blocks [2/1] [_U]                                        
                                x unused devices: <none>                                                  
                                                                                                         
                                                                                               
                                x The free disk count must equal one.                                      
                                                                                                         
                                x Potrebbe essere necessario un intervento manuale.                        
                                                                                                         
                                x Stato attuale disco:                                                    
                                                                                                         
                                x Dischi installati: hdb sda hda                                          
                                x Dischi in uso: hdb                                                      

Sostanzialmente abbiamo rimosso un disco rotto (hda) ma al riavvio anzichè ricostruire il raid mi da questa schermata e non so dove mettere mani per non fare danni.
Potete aiutarmi ?   :roll:  :roll:  :roll:  :roll:


- che dischi usavi/usi?
- noto che avevi hda e hdb.. sono dischi ide sullo stesso canale o dischi sata in emulazione ide?
- hai un backup?
- sda che disco è? scsi? sata? è di dimensioni almeno pari a hdb?

Ciao

Stefano
Title: Problema raid
Post by: maleficus01 on April 26, 2007, 10:15:18 AM
I dischi sono 2 seagate uguali da 160 Gb Ide, sullo stesso canale ide visti come hda e hdb. Il disco sda è un disco usb esterno da 500 gb su cui faccio il backup dei dati tramite backuppc. Ho rimosso il disco hda perche' danneggiato e fortunatamente è ripartito tutto dal disco hdb. Ho rimesso un disco identico in sostituzione ma l'output è quello che vedete. HELP ME
Title: Problema raid
Post by: Stefano on April 26, 2007, 11:18:10 AM
Quote from: "maleficus01"
I dischi sono 2 seagate uguali da 160 Gb Ide, sullo stesso canale ide visti come hda e hdb. Il disco sda è un disco usb esterno da 500 gb su cui faccio il backup dei dati tramite backuppc. Ho rimosso il disco hda perche' danneggiato e fortunatamente è ripartito tutto dal disco hdb. Ho rimesso un disco identico in sostituzione ma l'output è quello che vedete. HELP ME


i due dischi NON vanno MAI messi sullo stesso canale.. perchè se si rompe il canale, perdi tutto.. :-)

fai così:
- togli il disco usb DOPO che ti sei fatto un backup
- sposta hda su hdc (master su canale secondario)
- riavvia
- tramite
Code: [Select]

smartctl -a /dev/hdb | grep -i capacity
smartctl -a /dev/hdc | grep -i capacity


assicurati che hdc sia uguale o più grande di hdb

se SI, loggati come admin.. dovrebbe dirti che hai un disco (hdc) inutilizzato.. uniscilo al raid

se NO.. cambia disco.. è capitato a molti che due dischi stessa marca e stesso modello fossero di differenti capacità (dell'ordine dei mega.. non di +)

- attendi che il raid sia sincronizzato

OPZIONALE
- spegni il server e sposta hdb su hda (da slave a master sul canale primario)
- riavvia e verifica che tutto sia a posto

ciao

Stefano
Title: Problema raid
Post by: maleficus01 on April 26, 2007, 11:48:54 AM
Al momento non sono dal cliente e quindi non posso fare le varie prove.In tanto ti mando l'output, i dischi sono praticamente uguali:
Code: [Select]
[root@server-dati ~]# smartctl -a /dev/hda (DISCO NUOVO)
smartctl version 5.33 [i686-redhat-linux-gnu] Copyright (C) 2002-4 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model:     ST3160812A
Serial Number:    5LSBGZSH
Firmware Version: 3.AAJ
User Capacity:    160,041,885,696 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   7
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Thu Apr 26 11:37:43 2007 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Disabled

SMART Disabled. Use option -s with argument 'on' to enable it.


[root@server-dati ~]# smartctl -a /dev/hdb (DISCO ATTUALMENTE IN USO)
smartctl version 5.33 [i686-redhat-linux-gnu] Copyright (C) 2002-4 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model:     ST3160812A
Serial Number:    5LSBF8C2
Firmware Version: 3.AAJ
User Capacity:    160,041,885,696 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   7
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Thu Apr 26 11:38:57 2007 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Disabled

SMART Disabled. Use option -s with argument 'on' to enable it.


Grazie ancora
Luca
Title: Problema raid
Post by: Stefano on April 26, 2007, 12:03:01 PM
Quote from: "maleficus01"
Al momento non sono dal cliente e quindi non posso fare le varie prove.In tanto ti mando l'output, i dischi sono praticamente uguali..

Grazie ancora
Luca


allora, appena puoi procedi e fammi sapere
ciao

Stefano
Title: Problema raid
Post by: maleficus01 on May 14, 2007, 01:32:47 PM
OK
TUTTO FATTO COME DA TUA SPIEGAZIONE.
Ti ringrazio infinitamente :lol:
Luca