Hlavní navigace

Pro digitální oblaka je povolena nulová poruchovost

Cloud je dnes všude. Ovládá diskuse o informačních technologiích na veletrzích a kongresech. Některé firmy jsou však stále skeptické, zda cloud splňuje potřebná kritéria bezpečnosti a dostupnosti.
21. 9. 2012

Sdílet

Poskytovatelé cloudových služeb těmto obavám čelí pomocí řady opatření a strategií, které zajistí bezvýpadkový provoz.

Během veletrhu CeBIT v březnu 2012 nastal u Facebooku mnohahodinový výpadek. Kvůli technickým problémům byla tato sociální síť nedostupná miliónům uživatelů na celém světě. Byly postiženy i mobilní aplikace pro chytré telefony a tablety. Takovéto výpadky většinou stojí hodně peněz. Podle studie Aberdeen Group, která oslovila 125 firem na celém světě, přišel v roce 2011 několikaminutový výpadek za rok v průměru na 70 000 dolarů. Odpovídající 99,999% dostupnosti však dosáhla jen 4 procenta z oslovených. Tento nízký počet překvapuje vzhledem k tomu, že podle odhadů odborníků stojí hodinový výpadek výroby kolem 60 000 dolarů a v případě internetového obchodu pak kolem 100 000 dolarů. Nejvyšší ztráty mají samozřejmě banky, které při hodinovém výpadku přicházejí až o 2,5 miliónu dolarů.

Vysokou spolehlivost provozu lze dosáhnout u privátních cloudů

K získání důvěry skeptiků důsledně usilují provozovatelé datových center provozem systémů IT zaměřených na odstranění výpadků. Patří k tomu vysoká dostupnost služeb, což podle definice Harvard Research Group odpovídá provozní spolehlivosti na úrovni 99,999%, respektive maximálně pětiminutovému výpadku ročně, přičemž se do výpadků nepočítají modernizace, aktualizace či migrace dohodnuté se zákazníkem. Je však tak vysoká dostupnost vůbec reálná, a jestliže ano, lze ji dosáhnout a důsledně ji dodržovat?

Provozovatel, který si vytyčí za cíl provozování bezvýpadkových cloud služeb, musí závady rozpoznat dřív, než se projeví, a musí jim umět zabránit všemi technicky proveditelnými prostředky. Příčinu každé případné závady je mimoto třeba přesně analyzovat. Více výpadků koneckonců vyplývá z chyb softwaru než z cloudové architektury samé. A i zde existují rozdíly, které plynou z podstaty věci: u veřejného cloudu, který se nalézá ve veřejném internetu, nemohou uživatelé počítat s bezproblémovým provozem. Za to zde však mají mnoho služeb zdarma. Mohou například zdarma ukládat gigabajty do síťového úložiště. Naproti tomu se však musí obejít bez servisní podpory.

Několikanásobné zajištění

Jinak to vypadá v privátním cloudu: pomocí vlastních kompletních individuálně navržených síťových řešení mohou poskytovatelé služeb garantovat vysokou dostupnost, za předpokladu že jejich ICT architektura vykazuje vysokou odolnost k chybám, je transparentní, obsahují preventivní nástroje a trvalý provozní dohled zobrazuje všechny události na síti. Mimo to musí být provozovatel schopen pomocí inteligentního softwaru obnovit provoz automaticky, bez ručního zásahu, aby uživatelé mohli dále pracovat, aniž by zaznamenali výpadek.

Příkladem vysoké chybové tolerance jsou systémy RAID (Redundant Array of Independent Disks). Ukládají shodná data souběžně na dvou nebo více navzájem oddělených discích. Vypadne-li jeden disk, neprojeví se to na dostupnosti celého systému, protože systém dále pracuje bez přerušení. Uživatel si ničeho nepovšimne. Systémy RAID navíc disponují poruchovými systémy včasné výstrahy a většinu chyb korigují samy bez zásahu techniků.

Pro provoz IT je kritické identifikovat takzvané Single Point of Failure, zkráceně SpoF. Jsou to jednotlivě se vyskytující prvky IT infrastruktury – úložišť, počítačů a sítí, které mohou při poruše ochromit celé systémy. Vzhledem k tomu, že zálohování některých prvků infrastruktury může být poměrně obtížné a nákladné, mnoho poskytovatelů IT na sebe bere toto riziko a od jejich zálohování upouští. Kdo však sází na bezporuchový provoz, eliminuje i toto riziko. A samozřejmě též chrání datové centrum zajištěním nepřerušované dodávky proudu.

Dojde-li k výpadku aplikace, i při rychlém přechodu na náhradní systém vzniká chvilkový výpadek, například ve formě ztracených transakcí. Systém na to musí samostatně reagovat a po přepnutí na zálohu musí všechny vypuštěné kroky doplnit.

Platí to i pro ochranu dat

Mnoho podniků podle průzkumů pohlíží s obavami i na ochranu dat. Chtějí, aby se jejich informace zpracovávaly v souladu s platnými zákony na ochranu dat. To však lze do důsledků zajistit, jen pokud je výpočetní centrum v České republice nebo v rámci EU. Cloudové služby s prokazatelnou úrovní kvality služeb a provozem v bezpečných datových centrech v ČR nabízí například společnost T-Systems.

V rámci Evropské unie v podobě Směrnice EU 95/46EG ovšem existuje vcelku odpovídající minimální standard pro ochranu dat. EU v současné době navíc pracuje na technických a právních standardech pro cloud. Je toho naléhavě zapotřebí: jednotné evropské směrnice skýtají poskytovatelům cloudu a jeho uživatelům vyšší bezpečnost při plánování. Podpořilo by to rychlejší rozvoj cloudu v celé Evropě.

Kvalita nejde bez zaměstnanců

Poskytovatelé cloudu musejí ohledně jednotných standardů a procesů motivovat své zaměstnance ve všech lokalitách i napříč časovými pásmy. Přes 50% všech výpadků podle studií připadá na konto lidského selhání. Školení se musí zaměřovat na řízení kvality jako základní součást firemní kultury. Patří k tomu ústřední plán školení, globálně jednotné příručky a obsažné informace od nejvyššího vedení. 

Každý zaměstnanec musí přispívat k tomu, aby se zamezilo již samému vzniku potenciálních chyb. S tím souvisí otázka možných příčin. Heslo zní: „protipožární ochrana místo hašení“. Zaměstnanci nesmějí mít navíc obavu přiznat chybu, aby se jí bylo příště možno vyhnout. K rychlému hledání řešení a jejich využití v celém podniku mimoto přispívá organizovaný odborný tým. Tým svolává v případě závažného výpadku co nejrychleji vedoucí provozu. V postižené zákaznické firmě sledují dění spolupracovníci prostřednictvím komunikačního systému.

Řízení kvality je průběžným procesem trvalého a systematického rozmnožování potřebných znalostí. Dosažení zcela bezproblémového provozu cloudu tak sice nebude nikdy možné zaručit – to nedokážou ani ti nejlepší – avšak dostupnost vyšší než 99,999% je v rámci dosažitelného. Firmy si ji mohou smluvně zajistit od poskytovatelů služeb.