NÁLET

Zálohování vs RAID

Zálohování vs RAID
Zálohy jsou zásadní součástí našeho digitálního života. Každý počítač od obrovských databází po jediný osobní počítač nebo mobilní zařízení potřebuje zálohu. Místo, kde lze nejdůležitější uživatelská data uchovávat po dlouhou dobu a také tak, aby byla v případě potřeby obnovitelná. Můžeme rozlišit mezi daty v našem aktuálně běžícím systému, řekněme to živá data, a zálohovaný data. Ten je uložen mimo aktuální systém, který používá živá data.

RAID se týká živých dat, je to mechanismus, s nímž běžící systém kombinuje více disků do jedné entity úložiště. Data jsou poté rozložena napříč všemi disky takovým způsobem, aby mohla přežít selhání alespoň jednoho (nebo více) fyzických disků. Nejjednodušší typ pole RAID je RAID1 nebo zrcadlení. Toto je místo, kde kopírujete (nebo zrcadlíte) stejná data na dva nebo více disků, takže pokud jeden z disků selže, data mohou stále přežít a stále se aktivně používat. Existují i ​​další konfigurace RAID a o nich budeme diskutovat, jak budeme postupovat.

O RAIDu

RAID neboli redundantní pole levných disků je mechanismus pro ukládání dat mezi disky. Existuje široké „pole“ nastavení RAID, se kterým můžete pracovat, ale dva základní mechanismy, na nichž jsou všechny založeny, jsou následující:

1. Zrcadlení:

Zrcadlení znamená, že vaše datové bloky jsou kopírovány, zrcadleny na více disků. Pokud zrcadlíte svá data napříč třemi disky, můžete v daném okamžiku přežít selhání až dvou disků, pak lze vadné disky vyměnit za nové bez velkých potíží. Podobně, pokud kopírujete data napříč n + 1 disky, vydržíte až n disky selhaly. Nevýhodou je, že získáte pouze úložnou kapacitu rovnající se nejmenšímu disku v poli RAID.

2. Parita:

Druhým přístupem je rozdělení dat na dvě části, pomocí dvou bloků uživatelských dat můžete vytvořit třetí blok „parity“. Všechny tři bloky mají stejnou velikost a jsou rozloženy do různých zařízení. Aby tato konfigurace fungovala, jsou nutná minimálně tři zařízení. Pokud některý z disků selže, můžete znovu vytvořit bloky uložené na tomto disku pomocí dalších dvou bloků. Například pokud dojde ke ztrátě druhého uživatelského bloku, lze k výpočtu druhého uživatelského bloku použít první blok a paritní blok. Pokud vás zajímá, jak to funguje, podívejte se na toto skvělé vysvětlení.

Tuto metodu lze dále vylepšit tak, aby měla 2 nebo dokonce 3 paritní bloky. Více než 3 paritní bloky se však v průmyslu neobjevují tak často. Pokud máte jeden paritní blok, můžete přežít jedno selhání disku. Dva paritní bloky znamenají, že vydržíte selhání dvou disků atd.

Je to efektivnější z hlediska využití úložiště než zrcadlení. Pokud máte jeden paritní blok, potřebujete pouze o 50% více fyzického úložiště na skutečná uživatelská data, která ukládáte. To znamená, že k uložení 1 GB dat budete potřebovat 1.5 GB úložiště (plus metadata mají malou režii). To je mnohem efektivnější než i nejefektivnější schéma zrcadlení, kde potřebujete alespoň 2 GB úložiště k zrcadlení 1 GB dat mezi dvěma disky.

Nevýhodou je, že náhodné operace zápisu se zpomalí, a to díky extra bitové operaci výpočtu a zápisu spojené s paritním blokem. Spolehlivost také není tak dobrá jako spolehlivost n + 1 zrcadlené disky, kde se můžete připravit na selhání libovolného počtu disků.

Konfigurace RAID mohou být tak složité nebo jednoduché, jak se vám líbí, můžete kombinovat strategie parity a zrcadlení a upravit je podle vašich představ. Existují vyhrazené řadiče RAID, ke kterým připojujete fyzické disky, a operační systém poté uvidí jeden logický disk, jak ukazuje řadič. LSI je jedním z takových dodavatelů řadičů RAID. Můžete také provést RAID v softwaru OpenZFS je pravděpodobně nejlepší sázka, kterou v tomto ohledu máte.

Posledním druhem RAID, který získal čestné uznání, je RAID 0. Technicky to není schéma RAID, protože zde není zahrnuta žádná redundance. Myšlenkou RAID 0 je jednoduše rozšířit data na více úložných zařízení bez žádný odolnost proti poruchám disku. Výhodou je, že tím získáte zlepšení výkonu. Pokud zapisujete 1 GB dat na jeden disk, proces je pomalý. Disk může provádět pouze omezený počet operací zápisu za sekundu a váš operační systém musí počkat, až tuto operaci dokončí, než budou zaslána nová data. Pokud rozšíříte stejný 1 GB dat na dva takové disky, můžete z nich psát (a číst) současně a získat tak trochu zlepšení výkonu.

Zpět

Koncept záloh je pravděpodobně důležitější než koncept RAID. Záloha v rámci správy úložiště je známá dobrá kopie dat od daného okamžiku, ze které můžete v případě potřeby obnovit soubory zpět do hlavního systému. Pokud jde o implementaci, existuje mnoho cloud hostovaných řešení a také mnoho offline, které lze použít.

Tarsnap a Backblaze jsou moje oblíbené spravované zálohovací služby pro soukromé i obchodní případy použití. Do této definice a. Můžete také zahrnout Disk Google, iCloud nebo Dropbox záloha řešení, ale jsou zaměřeny více na spotřebitelský trh než na podnik. Základní princip je však stále stejný. Když se přihlásíte k novému iPhonu nebo iPadu, všechna data, vaše kontakty, fotografie, knihovna médií atd. Se z vašeho účtu iCloud synchronizují bez problémů a při dalším používání vašeho zařízení budou novější data tiše zálohována do cloudu a vy nemusíte nemusím si s tím dělat starosti.

Vaše řešení zálohování může být stejně jednoduché jako kopírování dat na externí pevný disk nebo použití rsync (nebo zfs send, pokud používáte OpenZFS) k pravidelnému generování kopie všech příslušných informací. To by mohlo zahrnovat složku Dokumenty, vaši databázi, zdrojové úložiště nebo dokonce celý ikona kořenového systému souborů do plochého zipu nebo tarballu. Důležitá kritéria, která by dobré zálohovací řešení mělo splňovat, jsou následující:

  1. Zálohy by se měly vyskytovat často - Pokud zálohujete data každý měsíc, místo každý týden, riskujete ztrátu dat až za měsíc, když dojde ke katastrofě.
  2. Vaše zálohy by se měly vrátit v čase - Záložní úložiště je konečné. Někdy musíte staré zálohy vyhodit. Čím více úložiště máte, tím lepší mohou být vaše zálohy. Předpokládejme, že budete zálohovat data každý týden, ale vyhoďte zálohy starší než 2 týdny. Pokud dojde k náhodnému smazání souboru, který po dva týdny zůstane bez povšimnutí, nebudete jej moci vrátit zpět.
  3. Vaše soubory by měly být skutečně obnovitelné - pokud jste se nikdy nepokusili obnovit svá data ze zálohy, nemáte zálohu. V kritické době, kdy došlo ke ztrátě dat, byste se neměli naučit, jak obnovit data. Plánujte dopředu a víte, jak obnovit systém z poslední známé dobré zálohy.
  4. Vaše záloha by měla být oddělena od běžícího systému - Když dojde ke katastrofě a všechny vaše soubory na produkčním serveru budou zašifrovány, odstraněny nebo poškozeny, musíte zajistit, aby se to stejné nestalo iu vaší zálohy. Dobrým způsobem, jak to zajistit, je zajistit, aby vaše zálohovací zařízení nebylo „připojeno“ k vašemu produkčnímu prostředí, tj.e, po dokončení zálohování odpojte pevný disk USB a odpojte souborový systém NFS. Alespoň nedávejte produkčnímu systému oprávnění přepsat nebo upravit zálohovaná data. Nastavit pouze pro čtení.

Nyní, když víme něco málo o RAID i zálohování, zdůrazníme některé rozdíly mezi nimi.

Soubory a bloky

RAID se vždy týká bloků dat, nikoli toho, jak souborový systém tato data uživateli poskytuje. Softwarový i hardwarový RAID zpracovává data jako bloky informací, velikost bloků se může pohybovat od 128 KiB do 1 MiB.

Zálohy na druhé straně jsou mnohem flexibilnější. Obvykle se provádějí na úrovni souborového systému, ačkoli pro to neexistuje žádné tvrdé a rychlé pravidlo. Jsou také zrnitější. Pokud je vaše řešení dostatečně flexibilní, můžete ze zálohy obnovit jeden soubor. Pole RAID nejsou zálohy, jsou pouze způsobem šíření dat na více disků. Pokud je soubor odstraněn, všechny jeho zrcadlené bloky a paritní bloky se uvolní. Konec příběhu.

Případy užití

Zálohy jsou pro každého. Přístup a rozsah se mohou lišit od případu osobního použití po podnik, ale každý s digitálním životem potřebuje zálohu. RAID je spíše funkce specifická pro podniky / podniky. Pole RAID vidíte na serverech, úložných zařízeních, jako jsou NAS a SAN, cloudové hypervizory atd. Téměř každé místo, kde se ukládají živá kritická data, používá nějakou formu RAID. I ty servery, na kterých běží vaše zálohy hostované v cloudu, pravděpodobně používají pole RAID. Nejedná se o vzájemně se vylučující technologie.

To neznamená, že nemůžete použít RAID pro svůj případ osobního použití, ale v podnicích má jen větší užitečnost. Důvodem je také to, že v podniku jsou disky bušeny operacemi IO 24/7. V produkčním prostředí, jako je úložiště databáze nebo služby streamování videa nebo cloudový hypervizor, bude úložné zařízení vašeho serveru pod neustálým příšerným zatížením, data jsou z těchto zařízení neustále čtena a zapisována do těchto zařízení a často několika aplikacemi současně. Za těchto podmínek je pravděpodobnější, že vaše disky selžou. Konfigurace pole RAID znamená, že pokud jednotka selže, trpíte malými nebo žádnými prostoji. Většina serverů může fungovat i po selhání disku, takže nepřijdete o nové informace a požadavky přicházející každou sekundu.

Průměrný stolní počítač těžko obnoví stejné stresující podmínky, i když disk zemře, pokud používáte záložní řešení, jako je Backblaze, můžete načíst většinu ztracených dat a ztráta práce za několik hodin je pravděpodobně nejhorší věc, kterou může se stát. I to se díky cloudovým řešením, jako je Adobe Creative Cloud, Office 365 atd., Stává vzácností.

RAID nenahrazuje zálohování

Pokud z tohoto článku chcete odebrat jen jednu položku, mělo by to být toto. RAID NENÍ náhražkou zálohy. Vždy zálohujte svá data! Existuje mnoho lidí, kteří si myslí, že pokud máte RAID, znamená to, že data jsou bezpečná na více discích, takže není třeba je zálohovat. Nic není dále od pravdy. RAID je určen k řešení jediného konkrétního problému - selhání disků nebo vrácení chybných dat. Mít RAID vás neochrání před milionem dalších hrozeb, jako jsou následující:

  1. Chyby uživatelů a náhodné smazání
  2. Chyby aplikace nebo OS způsobující rozsáhlé poškození dat
  3. Ransomware nebo jiný malware, který šifruje, odstraňuje nebo poškozuje vaše data
  4. Selhání samotných řadičů RAID

Data ve vašem poli RAID jsou aktivní. Pokud operační systém, aplikace (nebo uživatel) selhává a odstraní několik souborů sem a tam, bude soubor odstraněn z celého vašeho pole RAID. Samostatná kopie vašich dat, záloha, je jediný způsob, jak se můžete proti tomuto druhu scénáře kdykoli chránit.

Závěr

Pokud se obáváte o svá data, vaším prvním zájmem by mělo být řešení zálohování. Většina uživatelů stolních počítačů, snad s výjimkou zkušených uživatelů, by měla investovat více do spolehlivého zálohování namísto hraní s RAID1, RAID5 nebo RAIDZ. Chcete-li vytvořit vlastní záložní server, musíte myslet na slušné zásady zálohování a spolehlivý back-end úložiště. Tento článek je možná dobrým začátkem. Můžete použít rsync nebo zfs send, abyste si pořídili periodickou kopii svých dat do tohoto backendu.

Pokud jste v podniku a uvažujete o řešení RAID pro uložení všech vašich živých dat. Zvažte použití OpenZFS, nabízí velmi flexibilní řešení, vše od zrcadlení n-disků po RAIDZ1 s jedním paritním blokem po RAIDZ2 a RAIDZ3 se 2 a 3 paritními bloky. Než se rozhodnete, musíte hodně zvážit požadavky vaší aplikace. Mezi výkony čtení a zápisu, odolností a efektivitou úložiště existují kompromisy. Doporučil bych však, abyste na RAID mysleli až poté, co se rozhodnete pro záložní řešení.

Jak používat Xdotool ke stimulaci kliknutí myší a klávesových zkratek v systému Linux
Xdotool je bezplatný a otevřený nástroj příkazového řádku pro simulaci kliknutí myší a stisknutí kláves. Tento článek se bude věnovat krátkému průvodc...
Top 5 ergonomických produktů pro počítačové myši pro Linux
Způsobuje dlouhodobé používání počítače bolest zápěstí nebo prstů? Trpíte ztuhlými klouby a neustále si musíte třást ruce? Cítíte pálivou bolest pokaž...
Jak změnit nastavení myši a touchpadu pomocí Xinput v Linuxu
Většina linuxových distribucí je ve výchozím nastavení dodávána s knihovnou „libinput“ pro zpracování vstupních událostí v systému. Může zpracovávat v...