Zamenjava okvarjenega diska v korenskem sistemu ZFS

Uvodni koncepti

Ta dokument služi kot vodnik za skrbnike in posameznike, ki imajo določeno raven znanja o računalniških strojnih platformah in konceptih shranjevanja, kot je RAID. Če že dobro poznate splošni postopek odpovedi, lahko preskočite poglavja o zamenjavi pogona in popravilu sklada.

Stopnje grobosti

Ob vsaki okvari ali napaki pogona sistem SmartOS zabeleži veliko informacij. Če želite ugotoviti, kaj je vzrok za okvaro diska, je treba podrobneje raziskati podrobnosti. Spodaj so ukazi v padajočem vrstnem redu po razlagi:

Ukaz "zpool status" omogoča pregled stanja bazena.

ukaziostat nam zagotovi število napak na visoki ravni in posebne informacije o napravah.

fmadm faulty nam bo pomagal natančneje ugotoviti, kaj je povzročilo okvaro diska. fmadm lahko tudi odpravi prehodne napake;

Ukaz fmdump nam zagotovi dnevnik dogodkov napak v zadnjih {n} dneh.

Poleg zamenjave okvarjenih diskov so te informacije lahko zelo koristne pri odkrivanju osnovnega vzroka težave, če je težava bolj zapletena od preproste okvare diska.

Splošni postopek okvare

Ko v sistemu pride do okvare diska, sistem ZFS ni prva komponenta, ki jo zazna in se nanjo odzove. Namesto tega se zgodi naslednji splošni vrstni red dogodkov:

1. FMA (Fault Management Architecture) zazna in zabeleži okvaro diska. FMA spremlja in upravlja napake strojne opreme v sistemu.

2. Ko FMA zazna okvarjen disk, operacijski sistem ukrepa in odstrani disk iz sistema.

3. Sistem ZFS, ki je robusten in skalabilen datotečni sistem, se nato zave spremenjenega stanja. Sistem ZFS zazna, da je bil disk odstranjen, in se odzove z okvaro naprave. Napaka naprave pomeni, da sistem ZFS označi disk kot okvarjen in sprejme potrebne ukrepe za ohranitev celovitosti in razpoložljivosti podatkov.

Ta splošni postopek odpovedi zagotavlja, da so vse odpovedi diska v sistemu takoj zaznane, zabeležene in da se ustrezne komponente nanje odzovejo. FMA najprej prepozna okvarjeni disk, nato ga operacijski sistem odstrani in nazadnje se sistem ZFS odzove na spremenjeno stanje z okvaro naprave. Z upoštevanjem tega vrstnega reda dogodkov lahko sistem učinkovito obravnava okvare diska ter ohranja splošno stabilnost in zanesljivost infrastrukture za shranjevanje podatkov.

Upoštevajte, da je to splošen opis postopka okvare in se lahko razlikuje glede na specifično izvajanje in konfiguracijo sistema.

Kako zamenjati disk

Pregled na visoki ravni zamenjave okvarjenega diska v korenskem sistemu ZFS

Opomba: Preden nadaljujete s postopkom zamenjave diska, se prepričajte, da ste pravilno identificirali okvarjeni disk. Prav tako se prepričajte, da imate na voljo rezervni disk za zamenjavo.

Vodnik po korakih za zamenjavo okvarjenega diska v korenskem sistemu ZFS

Predpostavimo, da ima strežnik 2 diska: /dev/sda in /dev/sdb
Eden od diskov je odpovedal, na primer /dev/sdb
Poškodovani disk je treba zamenjati.

Najprej z ukazom definirajmo naš bazen:

zpool list

Pred zamenjavo diska ga je priporočljivo odstraniti iz polja:

zpool detach rpool /dev/sdb

Nato izklopite strežnik, če diskov ne morete zamenjati z vročo zamenjavo, vendar lahko vse, kar je opisano spodaj, storite brez zaustavitve strežnika - če imate krmilnik in vročo zamenjavo

poweroff

Fizično zamenjajte okvarjeni disk.

Določitev tabele razdelkov (GPT ali MBR) in njen prenos na nov disk

Po zamenjavi poškodovanega diska morate določiti, ali je tabela razdelkov GPT ali MBR.
To storite s programom gdisk. Namestite gdisk:

apt-get install gdisk -y

Zaženite ukaz:

gdisk -l /dev/sda

kjer je /dev/sda veljaven disk v RAID.

Za MBR bo rezultat približno naslednji:

Partition table scan:
MBR: MBR only
BSD: not present
APM: not present
GPT: not present

Za GPT je izpis približno naslednji:

Partition table scan:
MBR: protective
BSD: not present
APM: not present
GPT: present

Pred dodajanjem diska v polje ga je treba razdeliti na particije natančno tako kot dober disk sda. To se izvede različno, odvisno od razdelitve diska na particije.

Kopiranje razdelitve za GPT

Kopiranje razdelitve GPT:

Če ju pomešate, bo razdelitev na prvotno uporabnem disku uničena.

sgdisk -R /dev/sdb /dev/sda

Disku dodelite nov naključni UUID:

sgdisk -G /dev/sdb

Kopiranje razdelkov za MBR

Kopiranje razdelitve MBR:

Opomba!
Tu najprej zapišite disk, s katerega prenašate razdelitev, in nato disk, na katerega jo prenašate.

sfdisk -d /dev/sda | sfdisk /dev/sdb

Če particije v sistemu niso vidne, lahko tabelo particij ponovno preberete z ukazom:

sfdisk -R /dev/sdb

Namestitev zagonskega programa

Ko ste razdelili disk, morate nanj namestiti zagonski program:

grub-install /dev/sdb

Dodajanje diska

Določite, kateri disk bomo zamenjali (v našem primeru je to /dev/sdb3):

zpool replace rpool /dev/sdb3

Dodajanje diska v RAID:

zpool online rpool /dev/sdb3

Počakajte, da se sinhronizacija polja konča:

zpool status

Zaključek

Z upoštevanjem teh navodil lahko uspešno zamenjate okvarjeni disk v korenskem sistemu ZFS, ne da bi ogrozili celovitost podatkov. Da bi se izognili morebitni izgubi podatkov in zagotovili nemoteno delovanje, je treba sprejeti previdnostne ukrepe ter izvesti korake varnostnega kopiranja in preverjanja.