Procedury usuwania awarii podsystemu dyskowego | INTROSERV

Procedury usuwania awarii podsystemu dyskowego

Wprowadzenie

Stabilność dysków ma kluczowe znaczenie dla utrzymania ciągłości usług i ochrony danych. Chociaż infrastruktura INTROSERV wykorzystuje sprzęt klasy korporacyjnej, nadal mogą wystąpić problemy spowodowane usterkami sprzętowymi, degradacją RAID lub błędami systemu plików. Niniejszy dokument wyjaśnia rodzaje problemów z dyskami, które mogą wystąpić, co można zrobić, aby je rozwiązać oraz w jaki sposób nasz zespół pomocy technicznej obsługuje procedury odzyskiwania danych.

Infrastruktura INTROSERV: Ochrona danych

INTROSERV stosuje wielowarstwowe podejście do niezawodności dysków. Serwery INTROSERV są wyposażone w dyski HDD, SSD i NVMe klasy korporacyjnej oraz przetestowane kontrolery RAID. Większość serwerów obsługuje dyski typu hot-swap, co oznacza, że wymiana może być przeprowadzona bez wyłączania serwera. Na życzenie możemy również monitorować stan i wydajność pamięci masowej.

Rodzaje problemów z pamięcią masową

W każdym środowisku serwerowym może wystąpić kilka rodzajów problemów związanych z dyskami:

  • Fizyczna awaria dysku - dysk przestaje odpowiadać lub zgłasza krytyczne błędy SMART. SMART (Self-Monitoring, Analysis and Reporting Technology) wykrywa wczesne oznaki problemów z dyskiem.
  • Degradacja RAID - jeden z dysków w macierzy RAID jest offline, a system działa w trybie zmniejszonej pojemności. W tym stanie serwer pozostaje dostępny (jeśli macierz ma redundancję), ale wydajność może ulec pogorszeniu, a ochrona danych jest tymczasowo ograniczona.
  • Awaria RAID - Wiele dysków jest w trybie offline lub nie można uzyskać dostępu do macierzy RAID. Wymaga to natychmiastowej interwencji.
  • Błędykontrolera - Problemy z kontrolerem RAID lub jego modułem pamięci podręcznej uniemożliwiają prawidłową komunikację z dyskami.
  • Uszkodzenie systemu plików - struktury danych na dysku ulegają uszkodzeniu. System może automatycznie przełączyć się w tryb tylko do odczytu, aby zapobiec dalszym uszkodzeniom.
  • Spadek wydajności - występują nietypowe skoki opóźnień podczas operacji odczytu i zapisu, co może wskazywać na pojawiające się problemy z dyskiem.
  • Problemy z zewnętrzną pamięcią masową - Problemy wpływające na zdalne systemy pamięci masowej używane w niektórych konfiguracjach serwerów.

Gdy skontaktujesz się z pomocą techniczną, nasz zespół inżynierów oceni incydent, określi jego wagę i wybierze odpowiednią procedurę odzyskiwania. Zalecamy skonfigurowanie monitorowania serwera w celu wczesnego wykrywania problemów z dyskami.

Co można sprawdzić przed skontaktowaniem się z pomocą techniczną

Chociaż większość awarii dysków wymaga interwencji technicznej naszych inżynierów, możesz zebrać przydatne informacje diagnostyczne, które pomogą nam szybciej rozwiązać problem. Jeśli serwer jest nadal dostępny, możesz wykonać następujące czynności:

  • Przejrzyj dzienniki systemowe - W systemie Linux, uzyskaj dostęp do dzienników systemowych za pomocą dmesg (wyświetla komunikaty jądra) lub journalctl (wyświetla wpisy dziennika systemowego). W systemie Windows użyj Podglądu zdarzeń, aby sprawdzić dziennik systemowy. Dzienniki te często zawierają komunikaty o błędach związane z problemami z dyskami.
  • Uruchom diagnostykę SMART - w systemie Linux użyj polecenia smartctl, aby sprawdzić kondycję dysku, lub nvme-cli dla dysków NVMe. W systemie Windows bezpłatne narzędzia, takie jak CrystalDiskInfo, mogą wyświetlać dane SMART. Informacje te pomagają naszym inżynierom szybciej zdiagnozować problem.
  • Sprawdź stan macierzy RAID - w przypadku programowej macierzy RAID użyj wbudowanych narzędzi systemu operacyjnego (mdadm w systemie Linux, Storage Spaces lub Disk Management w systemie Windows). W przypadku sprzętowej macierzy RAID należy skorzystać z narzędzia producenta kontrolera (takiego jak MegaCLI, StorCLI lub interfejs sieciowy kontrolera). Informacje te są cenne dla diagnozowania degradacji lub awarii.
  • Tworzenie kopii zapasowychważnych danych - jeśli system pozostaje częściowo dostępny, należy rozważyć utworzenie kopii zapasowej krytycznych danych w innej lokalizacji.

Obszar klienta INTROSERV zapewnia podstawowe informacje o konfiguracji serwera. Aby uzyskać szczegółowe dzienniki i diagnostykę sprzętu, należy uzyskać dostęp do interfejsu IPMI serwera (iDRAC, IRMC, iLO lub podobnego). Użyj tych informacji, aby przygotować szczegóły przed otwarciem zgłoszenia do pomocy technicznej.

Kiedy skontaktować się z pomocą techniczną

Skontaktuj się z naszym zespołem pomocy technicznej natychmiast, gdy wystąpi którykolwiek z poniższych warunków:

  • Dysk zgłasza błędy SMART
  • RAID przechodzi w tryb awaryjny (jeden lub więcej dysków offline)
  • System zawiesza się, staje się tylko do odczytu lub przestaje odpowiadać.
  • Próby naprawy systemu plików nie rozwiązują problemu
  • Serwer nie wykrywa jednego lub więcej dysków
  • Zauważono nietypowy spadek wydajności, który się utrzymuje

Wsparcie INTROSERV działa 24 godziny na dobę, 7 dni w tygodniu i przetwarza incydenty związane ze sprzętem z wysokim priorytetem. Szybkie skontaktowanie się z nami znacznie przyspiesza czas rozwiązania problemu.

Informacje, które należy uwzględnić w zgłoszeniu do pomocy technicznej

Otwierając zgłoszenie dotyczące problemów z dyskiem, należy podać następujące informacje:

  • Identyfikator serwera, nazwa lub adres IP
  • Jasny opis tego, co zaobserwowałeś (zachowanie systemu, komunikaty o błędach, czas)
  • Dane wyjściowe SMART, jeśli są dostępne
  • Aktualny stan macierzy RAID, jeśli byłeś w stanie go sprawdzić
  • Przybliżony czas wystąpienia problemu
  • Wszelkie czynności wykonane przed otwarciem zgłoszenia Numer seryjny dysku i numer gniazda, jeśli są dostępne. Jeśli dysk nie jest rozpoznawany przez system, należy podać numery seryjne wszystkich innych widocznych dysków.

Obszar klienta INTROSERV zawiera ogólne informacje o konfiguracji serwera. Jednak szczegółowe dane diagnostyczne, takie jak numery seryjne dysków, dane wyjściowe SMART i stan RAID, powinny być zbierane ręcznie przy użyciu narzędzi opisanych powyżej.

Jak nasi inżynierowie radzą sobie z problemami z dyskami

Po otrzymaniu zgłoszenia do pomocy technicznej nasz zespół inżynierów postępuje zgodnie z ustrukturyzowanym przepływem pracy w celu zdiagnozowania i rozwiązania problemu:

Krok 1: Przegląd stanu sprzętu - Za zgodą klienta nasi inżynierowie łączą się z serwerem za pośrednictwem IPMI lub systemu operacyjnego, aby sprawdzić stan sprzętu i stan każdego dysku.

Krok 2: Ocena komponentów - Po uzyskaniu zgody na dostęp do systemu operacyjnego, IPMI lub narzędzia RAID, identyfikujemy wadliwy dysk i potwierdzamy, które dyski działają normalnie.

Krok 3: Określenie sposobu odzyskiwania danych - na podstawie przeprowadzonej oceny określamy, czy wymagana jest wymiana dysku, odbudowa macierzy RAID lub inna procedura odzyskiwania danych. Następnie informujemy o naszych ustaleniach i czekamy na potwierdzenie przed przystąpieniem do dalszych działań. Daje to czas na utworzenie kopii zapasowej danych lub wykonanie innych czynności w razie potrzeby.

Krok 4: Koordynacja konserwacji - jeśli prace wymagają przestoju, koordynujemy z Tobą okno konserwacji, aby zminimalizować zakłócenia.

Krok 5: Wdrożenie i raportowanie - W zależności od problemu, nasi administratorzy rozwiązują go zdalnie lub nasi technicy centrum danych dokonują fizycznej wymiany sprzętu. Po zakończeniu dostarczamy szczegółowy raport z podjętych działań i ich wyników.

Takie podejście gwarantuje, że problem jest rozwiązywany w sposób przewidywalny i przejrzysty, a klient zawsze wie, co dzieje się z jego serwerem.

Procedury wymiany dysków

Gdy dysk wymaga wymiany, wykonują ją technicy z naszego centrum danych. Większość serwerów INTROSERV obsługuje wymianę dysku na gorąco, co pozwala na wymianę dysku bez wyłączania serwera. Jeśli wymiana wymaga wyłączenia serwera, skoordynujemy z Tobą odpowiedni czas konserwacji.

Po wymianie macierz RAID musi zostać odbudowana. Czas trwania odbudowy zależy od rozmiaru dysku i konfiguracji RAID. Podczas procesu odbudowy serwer nadal działa, ale wydajność może się wahać. Zalecamy unikanie dużych obciążeń w tym czasie, chyba że jest to absolutnie konieczne.

Procedury odzyskiwania danych w przypadku poważnych awarii macierzy RAID

Jeśli macierzy RAID nie można odbudować, nasi inżynierowie przeprowadzają szczegółową ocenę wszystkich dysków w celu określenia najlepszego podejścia do odzyskiwania danych. W zależności od stanu sprzętu i konfiguracji serwera, możemy

  • Podjąć próbę częściowego odzyskania danych - odzyskać dostępne dane z nieuszkodzonych sekcji dysków.
  • Przygotować infrastrukturę zastępczą - skonfigurować nowy serwer lub środowisko pamięci masowej i pomóc w migracji danych.
  • Przywrócić dane z kopii zapasowych - jeśli masz włączone usługi tworzenia kopii zapasowych INTROSERV, możemy przywrócić dane z kopii zapasowej.

Nasi inżynierowie omówią z Tobą najlepsze podejście w oparciu o Twoją konkretną sytuację.

Naprawa systemu plików

Jeśli dyski i system RAID działają, ale system plików został uszkodzony, narzędzia diagnostyczne, takie jak fsck (sprawdzanie systemu plików), mogą pomóc w przywróceniu dostępu. Zalecamy następujące podejście:

  • Użyj trybu pojedynczego użytkownika - Uruchom naprawę systemu plików w trybie pojedynczego użytkownika, aby zminimalizować ryzyko dalszych uszkodzeń spowodowanych równoczesną aktywnością systemu.
  • Postępuj zgodnie z naszymi wskazówkami - Nieprawidłowe parametry lub wielokrotne próby naprawy mogą spowodować dodatkowe uszkodzenie danych. Nasz zespół pomocy technicznej zapewni instrukcje krok po kroku, jeśli zdecydujesz się wykonać to samodzielnie, lub możemy to zrobić za Ciebie.
  • Skontaktuj się z pomocą techniczną w złożonych przypadkach - jeśli standardowe narzędzia naprawcze nie rozwiążą problemu, skontaktuj się z pomocą techniczną w celu uzyskania pomocy.

Ochrona danych poprzez tworzenie kopii zapasowych

Kopie zapasowe stanowią najskuteczniejszą ochronę przed trwałą utratą danych. INTROSERV zapewnia kompleksowe usługi tworzenia kopii zapasowych, które automatycznie zapisują dane w oddzielnej infrastrukturze, całkowicie niezależnej od głównego sprzętu serwerowego. Separacja ta oznacza, że awarie dysków na serwerze głównym nie mają wpływu na kopie zapasowe.

Jak korzystać z kopii zapasowych INTROSERV:

  • Zamawianie i włączanie usług tworzenia kopii zapasowych poprzez Client Area
  • Skonfiguruj automatyczne harmonogramy tworzenia kopii zapasowych w oparciu o swoje potrzeby
  • Przywracanie danych bezpośrednio przez Strefę Klienta lub zwrócenie się o pomoc do naszego zespołu wsparcia technicznego.

Jeśli obecnie nie masz włączonych kopii zapasowych, zdecydowanie zalecamy ich włączenie. Zapewnia to najlepszą ochronę krytycznych danych.

Podsumowanie

INTROSERV zapewnia infrastrukturę, narzędzia i wsparcie ekspertów niezbędne do kontrolowania ryzyka związanego z dyskami. Nasze połączenie sprzętu klasy korporacyjnej, możliwości szybkiej wymiany dysków i jasnych procedur odzyskiwania pomaga zminimalizować przestoje i chronić dane. W przypadku wystąpienia problemów nasz zespół inżynierów jest dostępny 24 godziny na dobę, 7 dni w tygodniu. W połączeniu z usługami tworzenia kopii zapasowych INTROSERV, podejście to zapewnia kompleksową ochronę krytycznych informacji.

VAT

  • Other

    Other

    0%
  • austria

    Austria

    20%
  • Belgium

    Belgium

    21%
  • Bulgaria

    Bulgaria

    20%
  • Croatia

    Croatia

    25%
  • Cyprus

    Cyprus

    19%
  • Czech Republic

    Czech Republic

    21%
  • Denmark

    Denmark

    25%
  • Estonia

    Estonia

    22%
  • France

    France

    20%
  • Finland

    Finland

    24%
  • Germany

    Germany

    19%
  • Greece

    Greece

    24%
  • Hungary

    Hungary

    27%
  • Ireland

    Ireland

    23%
  • Italy

    Italy

    22%
  • Latvia

    Latvia

    21%
  • Lithuania

    Lithuania

    21%
  • Luxembourg

    Luxembourg

    17%
  • Malta

    Malta

    18%
  • Netherlands

    Netherlands

    21%
  • Poland

    Poland

    23%
  • Portugal

    Portugal

    23%
  • Romania

    Romania

    19%
  • Slovakia

    Slovakia

    20%
  • Slovenia

    Slovenia

    %
  • Spain

    Spain

    21%
  • Sweden

    Sweden

    25%
  • USA

    USA

    0%
european
states
  • Other
  • canada
  • poland
  • european-union
  • france
  • germany
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria
  • austria