Redundantní pole nezávislých disků (RAID) si získala popularitu před více než čtvrt stoletím a formalizovala trh bezpečných a spolehlivých úložných systémů podnikové úrovně pro sdílený přístup k datům. Používají je velké společnosti, malé a střední podniky a také jednotliví uživatelé, protože ve srovnání s používáním jednoho pevného disku (HDD) může RAID chránit cenná data před selháním úložných médií a je nákladově efektivnější, kromě zlepšení výkonu a zvýšit odolnost.
Stejně jako různé konfigurace RAID mohou být více či méně vhodné pro danou aplikaci úložiště, existují také různé způsoby konfigurace úložiště připojeného k síti (NAS) a tyto konfigurace se za různých okolností chovají odlišně. Pochopení těchto jemných rozdílů je velmi poučné a užitečné při rozhodování, kterou konfiguraci přijmout.
Variace RAID
RAID jsou tradičně definovány jako sada úložných prostředků nainstalovaných v systému, ale logicky se s nimi nakládá jako s jedním úložným zařízením. Pozoruhodnou funkcí je jeho dostupnost na podnikové úrovni, což znamená, že RAID zůstává v provozu, běží a je přístupný kvalifikovaným uživatelům sítě až na několik minut ročně. Data jsou chráněna buď zrcadlením, nebo pomocí paritního schématu, kde lze ztracená data obnovit jejich přepočtem z informací, které stále existují.
Existuje mnoho způsobů, jak nakonfigurovat RAID a každý má jiné číselné označení, od RAID0 do RAID60. Například RAID0 prokládá data (distribuuje bloky dat na více disků), ale bez zrcadlení (vytvoří úplnou kopii datové sady) nebo parity (přiděluje disk odolnosti proti chybám). V praxi v této konfiguraci nedochází k žádné redundanci a při poruše kterékoli části systému může dojít ke ztrátě dat.
Existuje mnoho způsobů, jak nakonfigurovat RAID a každý má jiné číselné označení, od RAID0 do RAID60
V RAID1 neexistuje striping, tedy rozložení zátěže na více fyzických disků, ani parita, ale bloky jsou replikovány. V RAID5 jsou bloky prokládané a existuje distribuovaná parita. RAID10 se vyznačuje distribuovanými a replikovanými bloky. Zatímco tedy RAID0 a RAID1 lze konfigurovat pouze se dvěma disky, RAID5 se spoléhá na nejméně tři, zatímco RAID10 je obvykle implementován ze čtyř disků a může jít až o libovolný vyšší sudý počet disků.
Network Attached Storage (NAS)
Systémy NAS se skládají z úložného subsystému RAID připojeného k síti a mohou být vybaveny proměnným počtem úložných zařízení.
Úložná zařízení jsou obvykle pevné disky (HDD), i když se někdy používají jednotky SSD (Solid State Drive). Stolní NAS systémy vybavené dvěma HDD jsou dostačující pro mnoho použití, ale konfigurace se čtyřmi disky nejsou neobvyklé a některé mohou pojmout až osm HDD.
Mezitím podnikové systémy, které jsou často konfigurovány ve formátu pro montáž do racku, mohou mít 12, 16 nebo dokonce až 24 jednotek HDD.
Dvou- a čtyřšachtové hodnocení NAS
Právě v tomto scénáři vyvstávají otázky: jak fungují různé konfigurace RAID s různými konfiguracemi NAS? Abychom na tyto otázky odpověděli, provedli jsme v laboratoři Toshiba HDD Lab hodnocení úrovně RAID se zaměřením na oblíbené základní modely NAS se dvěma a čtyřmi šachtami.
Konkrétně jsme testovali několik systémů NAS od různých výrobců, z nichž každý byl rozšířen o 10GbE síťovou kartu, abychom se vyhnuli omezení výkonu v síťové konektivitě. Testování s každým NAS bylo provedeno se dvěma a čtyřmi podnikovými pevnými disky Toshiba 4TB model MG08ADA400E.
Při testování jsme na systém uložili 6TB dat a měřili jeho výkon pro sekvenční zápis 1MB bloků, sekvenční čtení a náhodné čtení 1MB bloků a zatřetí pro smíšenou zátěž pro čtení a zápis kombinace různých velikostí bloků.
Testujeme také konfigurace pomocí hardwarových RAID řadičů nebo softwarového RAID ovládání. Pro dva nebo čtyři disky HHD, ačkoli hardwarový RAID je nejběžnější a nejvhodnější formou správy pro dva nebo čtyři disky HDD, s vysoce výkonným a nákladově efektivním výpočetním výkonem (CPU, DRAM atd.), lze pole RAID spravovat zcela pomocí softwaru, s výhodou nabídky dalších funkcí úložiště, jako jsou snímky, zálohy a další.
Dva testované hardwarové řadiče RAID patří mezi nejoblíbenější na trhu pro systémy s až osmi disky: Broadcom MegaRAID 9560-8i od Broadcom a SmartRAID 3204-8i Microchip od Adaptec®. Pro softwarově definované úložiště jsme testovali souborový systém Zettabyte (ZFS) spravovaný softwarem JovianDSS od Open-E.
Hodnoty sekvenčního výkonu pro NAS s konfiguracemi RAID jsou o něco nižší než u hardwarových řadičů RAID, zatímco náhodný výkon je podobný jako u ZFS bez ukládání do mezipaměti. Ve srovnání RAID5 a RAID10 je RAID5 přibližně o 20 % rychlejší, pokud jde o sekvenční rychlost, a RAID10 je o 20 % rychlejší pro náhodné/smíšené úlohy.
Většina NAS systémů je stále dodávána s rozhraním 1GbE nebo 2,5GbE, takže je nutné zdůraznit, že sekvenční propustnost 200MB/s a vyšší vyžaduje minimálně 10GbE rozhraní. Použití rozhraní 1 GbE omezuje sekvenční rychlost na přibližně 100 MB/s, což je méně než u jednoho pevného disku. Použití 2,5 GbE zvyšuje maximální rychlost na 250 MB/s, což je dostačující pro 2šachtovou konfiguraci RAID1. Pouze s 10GbE můžeme dosáhnout rychlosti vyšší, než je tato úroveň.
Jakékoli kompromisy/optimalizace z hlediska sekvenční rychlosti jsou proto relevantní pouze pro sítě s rychlostí 10GbE nebo vyšší. Pro síťové infrastruktury 1GbE a 2,5GbE stačí dva HDD v RAID1. Jen pro pracovní zátěže s velkým množstvím náhodného přístupu pro čtení/zápis mohou čtyři disky RAID10 poskytnout přibližně 1,5x výhodu rychlosti.
Doporučení po testování
Závěrem lze říci, že správci úložišť by měli při vyhodnocování konfigurací síťových úložišť zvážit řadu faktorů, ať už jde o konfiguraci RAID obecně nebo konfiguraci NAS konkrétně. Mezi tyto faktory patří, jakou kapacitu potřebuji? Jaká je moje typická pracovní zátěž? a existují nějaká omezení vyplývající z připojení hostitele/sítě?
Po testování je naše doporučení pro konfigurace RAID v NAS RAID1 (jednotné zrcadlení) dvou disků s vyšší kapacitou jako konfigurace volby pro systémy NAS rozumně v domácnostech a malých firmách se síťovým připojením 1GbE nebo 2,5GbE.
Pro všechny typy řešení úložných systémů, kde je většina zátěže sekvenční povahy, je nejlepší RAID5 (paritní ochrana) se čtyřmi disky a také poskytuje nejlepší efektivitu úložiště (75 %). Proto je RAID5 vhodný pro vysoké požadavky na čistou kapacitu a nabízí nejkratší možné časy přestavby pro neúspěšné výměny disku.
Mezitím je RAID10 (striping a zrcadlení) se čtyřmi disky lepší pro náhodné/smíšené pracovní zátěže, samozřejmě kompenzuje nižší efektivitu úložiště pouze o 50 %. RAID10 se doporučuje pro lokální serverové úložné subsystémy s obecnou pracovní zátěží, které používají hardwarové řadiče RAID nebo softwarovou technologii RAID.
Autor: Rainer W. Kaese, vrchní ředitel rozvoje obchodu s pevnými disky ve společnosti Toshiba Electronics Europe
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com