Content
- Uvodni koncepti
- Stopnje grobosti
- Splošni postopek okvare
- Kako zamenjati disk
- Vodnik po korakih za zamenjavo okvarjenega diska v korenskem sistemu ZFS
- Določitev tabele razdelkov (GPT ali MBR) in njen prenos na nov disk
- Kopiranje razdelitve za GPT
- Kopiranje razdelkov za MBR
- Namestitev zagonskega programa
- Dodajanje diska
- Zaključek
Zamenjava okvarjenega diska v korenskem sistemu ZFS
Uvodni koncepti
Ta dokument služi kot vodnik za skrbnike in posameznike, ki imajo določeno raven znanja o računalniških strojnih platformah in konceptih shranjevanja, kot je RAID. Če že dobro poznate splošni postopek odpovedi, lahko preskočite poglavja o zamenjavi pogona in popravilu sklada.
Stopnje grobosti
Ob vsaki okvari ali napaki pogona sistem SmartOS zabeleži veliko informacij. Če želite ugotoviti, kaj je vzrok za okvaro diska, je treba podrobneje raziskati podrobnosti. Spodaj so ukazi v padajočem vrstnem redu po razlagi:
Ukaz "zpool status" omogoča pregled stanja bazena.
ukaziostat nam zagotovi število napak na visoki ravni in posebne informacije o napravah.
fmadm faulty nam bo pomagal natančneje ugotoviti, kaj je povzročilo okvaro diska. fmadm lahko tudi odpravi prehodne napake;
Ukaz fmdump nam zagotovi dnevnik dogodkov napak v zadnjih {n} dneh.
Poleg zamenjave okvarjenih diskov so te informacije lahko zelo koristne pri odkrivanju osnovnega vzroka težave, če je težava bolj zapletena od preproste okvare diska.
Splošni postopek okvare
Ko v sistemu pride do okvare diska, sistem ZFS ni prva komponenta, ki jo zazna in se nanjo odzove. Namesto tega se zgodi naslednji splošni vrstni red dogodkov:
1. FMA (Fault Management Architecture) zazna in zabeleži okvaro diska. FMA spremlja in upravlja napake strojne opreme v sistemu.
2. Ko FMA zazna okvarjen disk, operacijski sistem ukrepa in odstrani disk iz sistema.
3. Sistem ZFS, ki je robusten in skalabilen datotečni sistem, se nato zave spremenjenega stanja. Sistem ZFS zazna, da je bil disk odstranjen, in se odzove z okvaro naprave. Napaka naprave pomeni, da sistem ZFS označi disk kot okvarjen in sprejme potrebne ukrepe za ohranitev celovitosti in razpoložljivosti podatkov.
Ta splošni postopek odpovedi zagotavlja, da so vse odpovedi diska v sistemu takoj zaznane, zabeležene in da se ustrezne komponente nanje odzovejo. FMA najprej prepozna okvarjeni disk, nato ga operacijski sistem odstrani in nazadnje se sistem ZFS odzove na spremenjeno stanje z okvaro naprave. Z upoštevanjem tega vrstnega reda dogodkov lahko sistem učinkovito obravnava okvare diska ter ohranja splošno stabilnost in zanesljivost infrastrukture za shranjevanje podatkov.
Upoštevajte, da je to splošen opis postopka okvare in se lahko razlikuje glede na specifično izvajanje in konfiguracijo sistema.
Kako zamenjati disk
Pregled na visoki ravni zamenjave okvarjenega diska v korenskem sistemu ZFS
Opomba: Preden nadaljujete s postopkom zamenjave diska, se prepričajte, da ste pravilno identificirali okvarjeni disk. Prav tako se prepričajte, da imate na voljo rezervni disk za zamenjavo.
Vodnik po korakih za zamenjavo okvarjenega diska v korenskem sistemu ZFS
Predpostavimo, da ima strežnik 2 diska: /dev/sda in /dev/sdb
Eden od diskov je odpovedal, na primer /dev/sdb
Poškodovani disk je treba zamenjati.
Najprej z ukazom definirajmo naš bazen:
zpool list
Pred zamenjavo diska ga je priporočljivo odstraniti iz polja:
zpool detach rpool /dev/sdb
Nato izklopite strežnik, če diskov ne morete zamenjati z vročo zamenjavo, vendar lahko vse, kar je opisano spodaj, storite brez zaustavitve strežnika - če imate krmilnik in vročo zamenjavo
poweroff
Fizično zamenjajte okvarjeni disk.
Določitev tabele razdelkov (GPT ali MBR) in njen prenos na nov disk
Po zamenjavi poškodovanega diska morate določiti, ali je tabela razdelkov GPT ali MBR.
To storite s programom gdisk. Namestite gdisk:
apt-get install gdisk -y
Zaženite ukaz:
gdisk -l /dev/sda
kjer je /dev/sda veljaven disk v RAID.
Za MBR bo rezultat približno naslednji:
Partition table scan: MBR: MBR only BSD: not present APM: not present GPT: not present
Za GPT je izpis približno naslednji:
Partition table scan: MBR: protective BSD: not present APM: not present GPT: present
Pred dodajanjem diska v polje ga je treba razdeliti na particije natančno tako kot dober disk sda. To se izvede različno, odvisno od razdelitve diska na particije.
Kopiranje razdelitve za GPT
Kopiranje razdelitve GPT:
Če ju pomešate, bo razdelitev na prvotno uporabnem disku uničena.
sgdisk -R /dev/sdb /dev/sda
Disku dodelite nov naključni UUID:
sgdisk -G /dev/sdb
Kopiranje razdelkov za MBR
Kopiranje razdelitve MBR:
Opomba!
Tu najprej zapišite disk, s katerega prenašate razdelitev, in nato disk, na katerega jo prenašate.
sfdisk -d /dev/sda | sfdisk /dev/sdb
Če particije v sistemu niso vidne, lahko tabelo particij ponovno preberete z ukazom:
sfdisk -R /dev/sdb
Namestitev zagonskega programa
Ko ste razdelili disk, morate nanj namestiti zagonski program:
grub-install /dev/sdb
Dodajanje diska
Določite, kateri disk bomo zamenjali (v našem primeru je to /dev/sdb3):
zpool replace rpool /dev/sdb3
Dodajanje diska v RAID:
zpool online rpool /dev/sdb3
Počakajte, da se sinhronizacija polja konča:
zpool status
Zaključek
Z upoštevanjem teh navodil lahko uspešno zamenjate okvarjeni disk v korenskem sistemu ZFS, ne da bi ogrozili celovitost podatkov. Da bi se izognili morebitni izgubi podatkov in zagotovili nemoteno delovanje, je treba sprejeti previdnostne ukrepe ter izvesti korake varnostnega kopiranja in preverjanja.