Hlavní navigace

Virtualizovaná úložiště přinášejí provoz firmy bez výpadků

 Autor: Shutterstock.com, podle licence: Rights Managed
Principy známé už ze světa mainframů a na druhé straně ultramoderní softwarově definovaná úložiště umožňují vytvořit architekturu maximálně odolnou proti selhání.
21. 9. 2015
MarketVoice Co je to?

Sdílet

V tomto článku si představíme systém Storage HyperSwap od společnosti IBM, respektive obecné přístupy, jak lze především na úrovni úložišť zajistit, aby kritické podnikové aplikace běžely dále i v případě výpadku – dokonce i když k havárii dojde současně v primární a záložní lokalitě, vše bez nutnosti provádět obnovu ze záloh, vytvářet složité skripty pro zotavení nebo riskovat nekonzistenci dat

Složité termíny, jednoduchý princip

Ti z vás, kteří přišli do kontaktu s mainframy IBM, si možná vybaví termín HyperSwap a související zkratku GDPS, která znamená Geographically Dispersed Parallel Sysplex. Tyto výrazy rozhodně nemají za cíl hned na úvod čtenáře odradit. Pocit, že se jedná o zastaralé koncepty světa sálových počítačů nebo drahé, speciální a obecně nedostupné technologie, není správný. Obě technologie totiž bezprostředně souvisejí s požadavky, které řeší každý IT architekt, administrátor, auditor i manažer IT – jak zařídit, aby prostředí IT infrastruktury bylo pro běh aplikací co nejdostupnější, a pokud už náhodou dojde k neplánovaným problémům, jak funkčnost prostředí co nejelegantněji obnovit.

Technologie HyperSwap má za cíl zajistit vysokou dostupnost (availability) a obnovu/zotavení po výpadku (disaster recovery). Infrastruktura skutečně kritických aplikací musí být tak odolná, aby systémy přežily i výbuch v primárním datovém centru. Základní motivace pro nasazení těchto řešení je jednoduchá: zatímco veškeré komponenty systému – servery, síťové prvky, disková pole, software – se dají s přiměřeným úsilím nahradit, ztráta vlastních dat představuje událost nevratné povahy.

Proto se od počátku informační éry řeší, jak data ochránit, duplikovat, zálohovat nebo archivovat. Technologie IBM GDPS a HyperSwap již existuje desítky let, nyní ale procházejí zásadní změnou. IBM některé z osvědčených konceptů z prostředí mainframů přenáší i do světa otevřených systémů; tím se stávají za velice příznivých podmínek (včetně cenových) dostupné pro široké spektrum zákazníků.

Redundance a kopie dat

Řešení typu disaster recovery znamená vždy určitou úroveň redundance. Princip si ukážeme na příkladu dvou vzdálených datových center, která mají vzájemně zástupný hardware a v každém okamžiku identickou kopii dat. Typicky se v produkčním datovém centru nachází aktivní primární kopie, která slouží jak pro zápisy, tak pro čtení a v druhé lokalitě kopie sekundární (někdy také DR kopie). Sekundární kopie je pasivní a může být využita pro čtení, nikoliv pro současný zápis, neboť by pak docházelo k nekonzistenci dat. V okamžiku přechodu provozu do druhého datového centra máme úlohu ulehčenou, protože data jsou již na místě, a nemusíme tedy provádět zdlouhavou obnovu ze záloh.

To, že máme kopii produkčních dat k dispozici ve druhé lokalitě, ještě ale neznamená, že s nimi lze ihned pracovat. Je třeba je zpřístupnit a učinit sérii poměrně komplexních kroků, které mají za cíl takzvaně „zvednout” systémy v záložní lokalitě a nastartovat aplikace, které s těmito daty pracují. To všem pokud možno ihned, na úspěchu často závisí přežití firemního byznysu.

Pro ulehčení se tedy často vytvářejí sady skriptů s automatizovanými příkazy a stejný smysl má snaha o budování geograficky vzdálených serverových clusterů. Mainframový paralelní sysplex GDPS zajišťuje přesně toto. V okamžiku katastrofického výpadku primárního datového centra mohou aplikace běžet plynule a bez přerušení v záložním datovém centru. Technologie HyperSwap, respektive její varianta, softwarové řešení Storage HyperSwap, zase umožňuje kontinuální poskytování diskových kapacit v obou lokalitách současně. Místo aktivní a pasivní kopie dat jsou obě kopie aktivní, což přináší obrovské zjednodušení při startování systémů a aplikací v záložním centru. Celá skriptovací mašinerie odpadá, o vše se postará logika Storage HyperSwap zabudovaná ve virtualizační vrstvě řadičů úložišť.

Jak HyperSwap funguje

Základní funkcionalita softwaru Storage HyperSwap umožňuje, aby každý datový svazek byl prezentován dvěma skupinami vstupu a výstupu (I/O Groups) namísto jediné. I/O Group je dvojice redundantních diskových řadičů, která má na starosti datový svazek (volume). Přes rozhraní I/O Group procházejí na disky veškeré požadavky na čtení a zápis vstupních a výstupních operací. Jedná se zároveň o vyrovnávací paměť (cache), která příslušné operace urychluje.

Trik spočívá v tom, že obě I/O Groups mohou být geograficky oddělené a stejný datový svazek je díky tomu v obou lokalitách reprezentován stejně. Díky vzájemné synchronizaci má každá skupina identickou kopii dat. Přístup serverů na „správnou” kopii je zajištěn nastavením hostitelského řadiče (host multipathing driver).

IBM host multipathing má implementovanou tzv. site awareness logiku, dokáže tedy rozpoznat umístění jednotlivých serverů, takže zbytečně nezatěžuje přístupové linky mezi lokalitami. Je tedy možné definovat příslušnost jednotlivých serverů k lokalitě. To má zásadní výhodu v okamžiku kombinace s modelem active/active preferovaných cest. Je možné dynamicky měnit, jakým způsobem jsou prezentovány cesty ke svazkům na základě příslušnosti k lokalitě.

Pro vysvětlení principu se podívejme na obrázek níže. Zelené cesty jsou preferované, červené cesty jsou nepreferované. Je zřejmé, že stejný svazek je prezentován v obou lokalitách, ale charakter cest, zda jsou preferované či nepreferované, se mění v závislosti na tom, do jaké lokality patří hostitelské servery a virtualizační řadičové uzly úložišť. Díky tomu lze velmi jednoduše (a bez nutnosti uživatelské rekonfigurace) zajistit, že serverová data nebudou křižovat vzdálené linky – až na situaci, kdy k tomu budou přinucena kvůli výpadkům v lokalitě.

Pomocí preferovaných tras lze ušetřit pásmo sítě mezi lokalitami

Je-li systém Storage HyperSwap správně nakonfigurován, dokáže se dokonce vypořádat se současnou havárií jednoho řadiče a celé lokality. Jinak řečeno, řešení zvládne dva výpadky najednou, z toho jeden totální. Během automatických synchronizací dat se s obrazy disků pracuje pomocí technologie tzv. golden image tak, že data jsou chráněna před nekonzistencí.

Softwarově lze definovat i úložiště

Systém Storage HyperSwap tedy představuje softwarové řešení pro úložné systémy. Patří do světa softwarově definovaných úložišť (Software Defined Storage), což je v poslední době jedna z nejvíce diskutovaných a nejrychleji se rozvíjejících oblastí v rámci technologií pro ukládání dat. V době virtualizace a podobných technik lze ostatně softwarově definovat prakticky cokoliv, od disku po síťové komponenty.

Speciálně v oblasti úložišť existuje k důrazu na software ještě jeden důvod. Všichni výrobci diskových úložišť dnes sdílejí stejné základní (komoditní) hardwarové komponenty – disky, procesory, rozhraní atd. Jediný způsob odlišení je tedy právě softwarové vybavení, které charakterizuje jednotlivá řešení a vytváří přidanou hodnotu, kterou lze přizpůsobit potřebám konkrétního zákazníka.

Softwarově definovaná úložiště jsou založena na úplné virtualizaci a vyznačují se oddělením funkcionality (inteligence) v řadičích úložišť od vlastních úložných médií – flash disků, klasických pevných disků, případně i pásek.

Dostupnost

Společnost IBM dnes poskytuje softwarově definovaná virtualizovaná úložiště pro oblasti blokových i souborových ukládání dat. Jádrem tohoto řešení je produktová řada Spectrum Software Family. Nová technologie HyperSwap zvyšuje flexibilitu a možnosti implementace těchto řešení, zajistí vysokou dostupnost i obnovu po havárii.

Funkcionalita HyperSwap je dokonce k dispozici bez příplatku a je standardní součástí licence pro vzdálené zrcadlení. Cenová politika činí toto řešením dnes dostupné jak pro velké společnosti, tak i pro segment středních a malých podniků.

Podrobnější informace o popisovaných technologiích přináší následující whitepaper: https://www-03.ibm.com/support/techdoc­s/atsmastr.nsf/WebIndex/WP102538

Trocha historie

IBM disponuje v oblasti inteligentních storage řešení rozsáhlými zkušenostmi. První virtualizační řadiče pro úložiště uvedla společnost na trh v roce 2003, přičemž vlastní vývoj započal již v roce 1999. Dnes se nabízí již osmá generace těchto řešení a ve světě je nasazeno přes 100 000 SVC/Storwize kontrolérů, které virtualizují obrovské množství dat. V rámci virtualizační vrstvy je podporováno více než 260 modelů diskových polí od všech výrobců. Analýza IDC umístila IBM loni v segmentu softwarově definovaných úložišť na první místo. IBM vidí tuto oblast jako strategickou pro svůj další rozvoj, důkazem je i letos ohlášená investice 1 miliardy dolarů na vývoj softwarových řešení v rámci produktové řady Spectrum Software Storage Family.

Systém Storwize V7000 ve své nové verzi podporuje přístup softwarově definovaných úložišť. Nabízí 4 porty pro gigabitový ethernet, port T pro vstupní konfiguraci systému, 2 porty USB, 3 porty pro rozšiřující karty a 2 externí porty 12Gb pro připojení disků SAS