EMC: Data Domain Global Deduplication Array

Multiřadičový systém určuje nový standard typových úloh benchmark v oblasti výkonu řešení pro podnikové zálohování a ukládání dat.

EMC: Data Domain Global Deduplication Array
Společnost EMC Corporation, která patří ke světové špičce v oblasti řešení pro informační infrastrukturu představila diskové pole EMCData Domain Global Deduplication Array (GDA), nejrychlejší dostupný inline deduplikační úložný systém určený pro zálohování dat v podnicích. Diskové pole Global Deduplication Array je založeno na novém rozšíření architektury Data Domain s více řadiči a nabízí globální inline deduplikaci a globální obor názvů pro všechna data uložená v systému se dvěma řadiči. Díky propustnosti až 12,8 terabajtů za hodinu (TB/h) pravidelně dosahuje vysokých skóre v typových úlohách v celém spektru běžných metrik pro zálohování v datacentrech. Diskové pole Global Deduplication Array nabízí až 14,2 petabajtů (PB) logické zálohovací kapacity a posouvá tak na novou úroveň jednoduchost konsolidace zálohování v datacentru u natolik různorodých požadavků, jaké představují velmi rozsáhlé databáze, bitové kopie VMware a nestrukturovaná data.

Na rozdíl od většiny deduplikačních systémů s více řadiči je inline diskové pole Global Deduplication Array úzce svázáno se zálohovacím softwarem a díky tomu umožňuje špičkový výkon při inline deduplikaci, dynamické rozdělování zatížení a jednoduchý provoz. Pole Global Deduplication Array distribuuje části procesu deduplikace na zálohovací servery, aby se snížilo zatížení sítě a naopak zvýšila propustnost řadičů GDA. Oproti konkurenčním konfiguracím deduplikace nabízí více než trojnásobnou propustnost při zálohování u jednotlivých řadičů a představuje tak nejrychlejší dostupný inline deduplikační systém. Zmíněné distribuované zpracování deduplikace je zajištěno díky nativní frekvenci vícejádrových procesorů Intel Xeon v řadičích GDA a díky škálovací architektuře Data Domain SISL (Stream-Informed Segment Layout), která minimalizuje počet přístupů na disk nutných během procesu deduplikace. V aktuálním prvotním vydání platforma podporuje software Symantec NetBackup a Backup Exec s modulem plug-in OpenStorage na zálohovacím serveru. V průběhu letošního roku přibude podpora systému EMC NetWorker s využitím integrovaného softwaru.

Diskové pole Global Deduplication Array představuje jediné inline deduplikační úložiště pro zálohovací aplikace u dvou řadičů EMC Data Domain DD880. U rozsáhlých zálohovacích úloh v datacentru se dynamicky a transparentně vyrovnává zatížení mezi jednotlivými řadiči, což zjednodušuje řízení kapacity a výkonu i správu zálohování.

V zálohovacích prostředích, kde se zpracovávají stovky terabajtů dat, mohou správci prostřednictvím zásad směřovat zálohování do diskového pole Global Deduplication Array a využívat společné deduplikační úložné prostředí pro všechna data chráněná těmito zásadami.

  • Diskové pole Global Deduplication Array dokáže zpracovat až 270 souběžných zálohovacích úloh a má propustnost až 12,8 TB/h. Dovoluje tak zvládnout více záloh v kratším čase.
  • Globální obor názvů omezuje na minimum potřebu měnit konfiguraci komplexních zásad zálohování a inovativní technologie globální deduplikace dynamicky vyrovnává zatížení u zásad pro řízení výkonu a kapacity. Tak lze snadno ochránit velmi rozsáhlé datové sady s jednoduchou správou a zároveň maximalizovat celkovou efektivitu deduplikace, což umožní snížit na minimum fyzickou velikost úložiště.

Bezkonkurenční funkce pro replikaci
S volitelným softwarem EMC Data Domain Replicator může diskové pole Global Deduplication Array automatizovat ukládání dat v síti WAN (wide area network) a využít tuto možnost při obnovení po havárii, zálohování vzdálených poboček či konsolidaci pásek z více míst.

  • Jedno diskové pole Global Deduplication Array může s využitím menších deduplikačních úložných systémů, jako jsou například zařízení série Data Domain DD140 či DD600, podporovat konsolidovanou replikaci až 270 vzdálených poboček.
  • Mezisíťová (cross-site) deduplikace dále snižuje potřebnou šířku pásma, protože mezi libovolnými segmenty sítě WAN mezi sítěmi se přenáší vždy pouze první instance dat. Pro rychlé zajištění ochrany dat mimo sídlo firmy a konsolidaci operací s páskami nabízí diskové pole Global Deduplication Array replikační propustnost až 54 TB/h.

Podobně jako všechny systémy Data Domain se nové diskové pole Global Deduplication Array vyznačuje snadnou instalací a dostatečnou flexibilitou, která umožňuje implementaci do stávajících uživatelských prostředí bez narušení provozu. S podporou nepřetržitě poskytovaných podnikových služeb společnosti EMC se toto řešení s využitím softwaru EMC Data Domain OpenStorage bez potíží integruje do zálohovacích prostředí Symantec NetBackup a Backup Exec.

Proč na architektuře záleží
Diskové pole Global Deduplication Array stojí na tomtéž přístupu k inline deduplikaci dat jako všechny systémy EMC

Data Domain – na přístupu, v jehož centru je procesor. Oproti běžnému pojetí, kdy je deduplikace ke stávajícím diskovým polím, systémům Virtual Tape Libraries či zálohovacímu softwaru dodatečně doplněna, nabízejí systémy Data Domain vyšší efektivitu díky následujícím vlastnostem:

  • Škálovací architektura SISL využívá vylepšení procesoru ke zvýšení rychlosti inline deduplikace a přitom minimalizuje závislost na přístupech na disk, což zlepšuje výkon. Systémy Data Domain neustále zlepšují výkon propustnosti, která se v posledních šesti letech zvýšila téměř 90násobně, i kapacitu, jež za stejné období vzrostla více než 225krát. Vzhledem k plánům společnosti Intel v oblasti vývoje procesorů se očekává, že propustnost systému bude i do budoucna významně růst.
  • Vysoký výkon inline deduplikace zajišťuje jednoduchou správu, minimalizuje nároky na systémové prostředky a řeší konkurenční procesy v interním systému.
  • Efektivita úložiště šetří životní prostředí díky menší režii systému a nižší spotřebě energie.
  • Architektura Data Domain Data Invulnerability Architecture zajišťující nezranitelnost dat chrání proti potížím s integritou dat tím, že během ukládání a obnovování provádí průběžné ověřování dat.


Komentáře