Remplacement d'un disque défaillant dans la racine ZFS

Concepts d'introduction

Ce document sert de guide aux administrateurs et aux personnes qui possèdent un certain niveau de connaissance des plates-formes matérielles informatiques et des concepts de stockage, tels que le RAID. Si vous avez déjà une bonne compréhension du processus général de défaillance, vous pouvez passer directement aux sections relatives au remplacement d'un disque et à la réparation du pool.

Degrés de verbosité

Lorsqu'un disque tombe en panne ou présente des erreurs, SmartOS enregistre un grand nombre d'informations. Il est nécessaire d'approfondir les détails pour trouver la cause de la défaillance du disque. Les commandes ci-dessous sont classées par ordre décroissant de verbosité :

La commande 'zpool status' fournit une vue d'ensemble de l'état de santé du pool.

iostat nous fournit des comptes d'erreurs de haut niveau ainsi que des informations spécifiques sur les périphériques.

Lacommande fmadm faulty nous aidera à déterminer plus précisément la cause de la défaillance du disque. fmadm est également capable d'effacer les défaillances transitoires ;

La commande fmdump nous fournit un journal des événements de défaillance des {n} derniers jours.

Outre le remplacement des disques défectueux, ces informations peuvent s'avérer extrêmement utiles pour isoler la cause première du problème si celui-ci est plus complexe qu'une simple panne de disque.

Processus général de défaillance

Dans le système, lorsqu'une panne de disque se produit, ZFS n'est pas le premier composant à la détecter et à y répondre. Au lieu de cela, l'ordre général des événements suivants se déroule :

1. L'architecture de gestion des défaillances (FMA) détecte et enregistre la défaillance d'un disque. FMA surveille et gère les défaillances matérielles dans le système.

2. Une fois que FMA a détecté le disque défaillant, le système d'exploitation intervient et retire le disque du système.

3. ZFS, qui est un système de fichiers robuste et évolutif, prend alors connaissance du changement d'état. ZFS détecte que le disque a été retiré et réagit en mettant le périphérique en défaut. La mise en défaut du périphérique signifie que ZFS marque le disque comme défectueux et prend les mesures nécessaires pour maintenir l'intégrité et la disponibilité des données.

Ce processus général de défaillance garantit que toute défaillance de disque dans le système est rapidement détectée, enregistrée et traitée par les composants concernés. FMA commence par identifier le disque défectueux, puis le système d'exploitation le supprime et, enfin, ZFS réagit au changement d'état en mettant le périphérique en défaut. En suivant cet ordre des événements, le système peut gérer efficacement les défaillances des disques et maintenir la stabilité et la fiabilité globales de l'infrastructure de stockage.

Veuillez noter qu'il s'agit d'une description générale du processus de défaillance et qu'elle peut varier en fonction de l'implémentation et de la configuration spécifiques du système.

Comment remplacer un disque

Vue d'ensemble du remplacement d'un disque défaillant dans la racine ZFS

Remarque: avant de procéder au remplacement d'un disque, assurez-vous d'avoir correctement identifié le disque défaillant. Assurez-vous également que vous disposez d'un disque de rechange pour le remplacement.

Guide étape par étape pour le remplacement d'un disque défaillant dans la racine ZFS

Supposons que le serveur dispose de deux disques : /dev/sda et /dev/sdb
L'un des disques est défaillant, par exemple /dev/sdb
Le disque endommagé doit être remplacé.

Tout d'abord, définissons notre pool à l'aide de la commande :

zpool list

Avant de remplacer le disque, il est conseillé de le retirer de la matrice :

zpool detach rpool /dev/sdb

Ensuite, éteignez le serveur si vous ne pouvez pas échanger les disques à chaud, mais tout ce qui est décrit ci-dessous peut être fait sans arrêter le serveur - si vous avez un contrôleur et l'échange à chaud.

poweroff

Remplacez physiquement le disque défectueux.

Déterminer la table de partition (GPT ou MBR) et la transférer sur le nouveau disque

Après avoir remplacé un disque endommagé, vous devez déterminer si la table de partition est GPT ou MBR.
Pour ce faire, utilisez gdisk. Installez gdisk :

apt-get install gdisk -y

Exécutez la commande:

gdisk -l /dev/sda

/dev/sda est un disque valide dans le système RAID.

Pour MBR, la sortie sera approximativement la suivante :

Partition table scan:
MBR: MBR only
BSD: not present
APM: not present
GPT: not present

Pour le GPT, la sortie est approximativement la suivante :

Partition table scan:
MBR: protective
BSD: not present
APM: not present
GPT: present

Avant d'ajouter un disque à la matrice, il doit être partitionné exactement comme un bon disque sda. Cela se fait différemment en fonction du partitionnement du disque.

Copie du partitionnement pour GPT

Pour copier le partitionnement GPT:

Remarque :le premier est le disque sur lequel le partitionnement est copié, et le second est le disque à partir duquel le partitionnement est copié. Si vous les mélangez, le partitionnement du disque utilisable à l'origine sera détruit.

sgdisk -R /dev/sdb /dev/sda

Attribuez un nouvel UUID aléatoire au disque :

sgdisk -G /dev/sdb

Copie du partitionnement pour le MBR

Pour copier le partitionnement MBR:

Remarque !
Ici, vous écrivez d'abord le disque à partir duquel vous transférez le partitionnement et ensuite le disque sur lequel vous le transférez.

sfdisk -d /dev/sda | sfdisk /dev/sdb

Si les partitions ne sont pas visibles dans le système, vous pouvez relire la table de partition à l'aide de la commande:

sfdisk -R /dev/sdb

Installer le bootloader

Après avoir partitionné le disque, vous devez y installer le chargeur de démarrage:

grub-install /dev/sdb

Ajout d'un disque

Spécifiez le disque que nous allons remplacer (dans notre cas, il s'agit de /dev/sdb3) :

zpool replace rpool /dev/sdb3

Ajout d'un disque au raid:

zpool online rpool /dev/sdb3

Attendre la fin de la synchronisation de la matrice :

zpool status

Conclusion

En suivant ces instructions, vous pouvez remplacer avec succès un disque défaillant dans la racine ZFS sans compromettre l'intégrité de vos données. Il est essentiel de prendre des précautions et d'effectuer les étapes de sauvegarde et de vérification afin d'éviter toute perte de données potentielle et d'assurer un fonctionnement sans heurts.

How useful was this article?

VAT

  • Other

    Other

    0%
  • austria

    Austria

    20%
  • Belgium

    Belgium

    21%
  • Bulgaria

    Bulgaria

    20%
  • Croatia

    Croatia

    25%
  • Cyprus

    Cyprus

    19%
  • Czech Republic

    Czech Republic

    21%
  • Denmark

    Denmark

    25%
  • Estonia

    Estonia

    22%
  • France

    France

    20%
  • Finland

    Finland

    24%
  • Germany

    Germany

    19%
  • Greece

    Greece

    24%
  • Hungary

    Hungary

    27%
  • Ireland

    Ireland

    23%
  • Italy

    Italy

    22%
  • Latvia

    Latvia

    21%
  • Lithuania

    Lithuania

    21%
  • Luxembourg

    Luxembourg

    17%
  • Malta

    Malta

    18%
  • Netherlands

    Netherlands

    21%
  • Poland

    Poland

    23%
  • Portugal

    Portugal

    23%
  • Romania

    Romania

    19%
  • Slovakia

    Slovakia

    20%
  • Slovenia

    Slovenia

    %
  • Spain

    Spain

    21%
  • Sweden

    Sweden

    25%
  • USA

    USA

    0%
european
states
  • Other
  • canada
  • poland
  • european-union
  • france
  • germany
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria