Koozali.org: home of the SME Server

Problème raid1

Offline esperinas

  • ***
  • 52
  • +0/-0
Problème raid1
« on: October 04, 2015, 05:19:47 PM »
Bonjour à tous,

Mon serveur sme 8.1 est équipé de 2 disques miroirs.
Par hasard, j'ai jeté un oeil dans la console admin,
concernant la vérification de la redondance, j'ai ce message :

Quote
Etat actuel du RAID :

Personalities : [raid1]
md1 :   active raid1 sdb1[1] sda[0]
      104320 blocks [2/2] [UU]
md2 :   active raidd1 sdb2[1]
      78019584 blocks [2/1] [_U]
unused devices: <none>

Certains périphériques RAID sont endommagés.

Une intervention manuelle peut être nécessaire.

Dois-je conclure qu'un des 2 disque est HS ? Comment l'identifier ?

Merci de vos conseils.
G.

Offline stephdl

  • *
  • 1,523
  • +0/-0
    • Linux et Geekeries
Re: Problème raid1
« Reply #1 on: October 04, 2015, 09:29:05 PM »
plop

il est pas forcement mort mais certainement desynchronisé

1) il est temps de se poser la question du backup....est il a jour ?
2) /dev/sda2 est desynchronisé
3) pour le resynchro

Code: [Select]
mdadm -f /dev/md2 /dev/sda2 -r /dev/sda2 -a /dev/sda2
la doc est la http://wiki.contribs.org/Raid#Resynchronising_a_Failed_RAID

pour surveiller la synchro

Code: [Select]
watch 'cat /proc/mdstat'
See http://wiki.contribs.org/Koozali_Foundation
irc : Freenode #sme_server #sme-fr

!!! Please write your knowledge to the Wiki !!!

Offline esperinas

  • ***
  • 52
  • +0/-0
Re: Problème raid1
« Reply #2 on: October 04, 2015, 10:10:08 PM »
Merci stephdl pour les infos.

A ce stade, lorsque je lance la commande :
mdadm -f /dev/md2 /dev/sdb2 -r /dev/sdb2 -a /dev/sdb2

j'obtiens un message d'erreur :
mdadm: set device faulty failed for /dev/sdb2:  Device or resource busy

Une idée ?
G.

Offline stephdl

  • *
  • 1,523
  • +0/-0
    • Linux et Geekeries
Re: Problème raid1
« Reply #3 on: October 04, 2015, 10:51:27 PM »
Merci stephdl pour les infos.

A ce stade, lorsque je lance la commande :
mdadm -f /dev/md2 /dev/sdb2 -r /dev/sdb2 -a /dev/sdb2

j'obtiens un message d'erreur :
mdadm: set device faulty failed for /dev/sdb2:  Device or resource busy

Une idée ?
G.

peux tu m'expliquer pourquoi veux tu retirer du raid le seul disque vaillant que tu as...cad /dev/sdb, c'est /dev/sda qu'il faut réintégrer

Ton linux est contre les tempéraments suicidaires...quelle chance :p
See http://wiki.contribs.org/Koozali_Foundation
irc : Freenode #sme_server #sme-fr

!!! Please write your knowledge to the Wiki !!!

Offline esperinas

  • ***
  • 52
  • +0/-0
Re: Problème raid1
« Reply #4 on: October 04, 2015, 11:03:02 PM »
Ah ok, ... heureusement qu'il y a des 'gardes-fou' dans sme !!

Le bonne commande serait donc bien celle-ci :
mdadm -f /dev/md2 /dev/sda2 -r /dev/sda2 -a /dev/sda2

Offline stephdl

  • *
  • 1,523
  • +0/-0
    • Linux et Geekeries
Re: Problème raid1
« Reply #5 on: October 04, 2015, 11:48:38 PM »
mdadm -f /dev/md2 /dev/sda2 -r /dev/sda2 -a /dev/sda2
oui, mais de qd ton dernier backup date ????

:p
See http://wiki.contribs.org/Koozali_Foundation
irc : Freenode #sme_server #sme-fr

!!! Please write your knowledge to the Wiki !!!

Offline esperinas

  • ***
  • 52
  • +0/-0
Re: Problème raid1
« Reply #6 on: October 05, 2015, 01:53:47 PM »
Il y a un backup quotidien via un poste distant. De plus, je viens d'effectuer un backup direct sur le serveur.

A présent, la tentative de reconstruction du raid1 déclenche cette erreur :

[root@edge-sc430 ~]# mdadm -f /dev/md2 /dev/sda2 -r /dev/sda2 -a /dev/sda2
mdadm: set device faulty failed for /dev/sda2:  No such device

Une piste ?

Offline Daniel B.

  • *
  • 1,700
  • +0/-0
    • Firewall Services, la sécurité des réseaux
Re: Problème raid1
« Reply #7 on: October 05, 2015, 03:04:22 PM »
Il faut être attentif à la sortie de cat /proc/mdstat

On y voit clairement que le disque /dev/sda est utilisé en entier comme membre du RAID md0 (qui correspond au /boot), sans aucune partition. Il y a donc déjà eu une intervention manuelle là dessus, avec une erreur de manip (ajout de /dev/sda au lieu de /dev/sda1).

Ce qu'il convient de faire maintenant:

- Sortir /dev/sda du volume md0:

Code: [Select]
mdadm --manage /dev/md0 --fail /dev/sda
mdadm --manage /dev/md0 --remove /dev/sda

- Copier la table de partition de sdb vers sda (pour re-créer les partitions sda1 et sda2 avec les bonnes tailles)

Code: [Select]
sfdisk -d /dev/sdb | sfdisk /dev/sda

- Ré-intégrer les bonnes partitions de sda dans leur volume RAID respectif:

Code: [Select]
mdadm --manage /dev/md0 --add /dev/sda1
mdadm --manage /dev/md1 --add /dev/sda2

- Attendre que ça ait fini de resynchroniser

Voilà, ça, c'est les étapes pour réparer. Maintenant l'idéal serait de savoir comment /dev/sda a pu se retrouver membre d'un RAID sans partitionnement, et ça, ça semble pas possible sauf par une erreur humaine
C'est la fin du monde !!! :lol:

Offline esperinas

  • ***
  • 52
  • +0/-0
Re: Problème raid1
« Reply #8 on: October 05, 2015, 03:22:33 PM »
Merci Daniel

L'an passé, j'avais remplacé un disque du raid. Opération physique sans aucune intervention système de ma part :
http://forums.contribs.org/index.php/topic,50910.0.html

Je vais me connecter sur ma console ssh pour lancer les commandes que tu m'as indiquées ...
J'espère que tout va bien se passer ...

Offline esperinas

  • ***
  • 52
  • +0/-0
Re: Problème raid1
« Reply #9 on: October 07, 2015, 01:41:51 PM »
Bonjour,

Je viens de tenter la reconstruction du raid1 mais dès la 1ère ligne de commande j'obtiens ce message d'erreur :

# mdadm --manage /dev/md0 --fail /dev/sda
mdadm: cannot get array info for /dev/md0

 :( :(

Offline Daniel B.

  • *
  • 1,700
  • +0/-0
    • Firewall Services, la sécurité des réseaux
Re: Problème raid1
« Reply #10 on: October 07, 2015, 01:43:04 PM »
Si tu recopies mes bêtises aussi....  :-P

Il n'y a pas de md0 sur SME, remplaces md0 par md1 et md1 par md2
C'est la fin du monde !!! :lol:

Offline esperinas

  • ***
  • 52
  • +0/-0
Re: Problème raid1
« Reply #11 on: October 07, 2015, 01:56:24 PM »
Ok Daniel... franchement je ne comprends pas tout, je n'ai quasi aucune compétence systeme.
Je veux être sûr et je préfère demander, donc voici les commandes que je pense être corrigées :

- Sortir /dev/sda du volume md1:

Code: [Select]
mdadm --manage /dev/md1 --fail /dev/sda
mdadm --manage /dev/md1 --remove /dev/sda


- Copier la table de partition de sdb vers sda (pour re-créer les partitions sda1 et sda2 avec les bonnes tailles)

Code: [Select]
sfdisk -d /dev/sdb | sfdisk /dev/sda

- Ré-intégrer les bonnes partitions de sda dans leur volume RAID respectif:

Code: [Select]
mdadm --manage /dev/md1 --add /dev/sda1
mdadm --manage /dev/md2 --add /dev/sda2

Est-ce bien ça ?

G.

Offline Daniel B.

  • *
  • 1,700
  • +0/-0
    • Firewall Services, la sécurité des réseaux
Re: Problème raid1
« Reply #12 on: October 07, 2015, 01:58:00 PM »
oui
C'est la fin du monde !!! :lol:

Offline esperinas

  • ***
  • 52
  • +0/-0
Re: Problème raid1
« Reply #13 on: October 07, 2015, 02:17:14 PM »
Toujours sur la 1ère ligne de commande :

# mdadm --manage /dev/md1 --fail /dev/sda
mdadm: set device faulty failed for /dev/sda: No such device

?

Offline Daniel B.

  • *
  • 1,700
  • +0/-0
    • Firewall Services, la sécurité des réseaux
Re: Problème raid1
« Reply #14 on: October 07, 2015, 02:18:17 PM »
un cat /proc/mdstat semble pourtant indiquer le contraire, bizarre
C'est la fin du monde !!! :lol: