Hlavní navigace

IBM poskytuje nativní platformu pro objektovou storage

Co je to Objektová Storage? Také se v tom ztrácíte? Jak to, že je tolik různých typů storage řešení, když všechny používají již desítky let stále ty samé disky?

Proč potřebujeme SAN, NAS, Object, kde se uplatní grid architektury, tierované architektury, scale-out, all-flash a mnoho dalších? To nepočítáme nepřeberné množství softwarových vlastností a speciálních produktů, které má každý výrobce. Realita je taková, že vše je čím dál složitější a primární důvod storage systémů, tedy něco uložit a po čase bezpečně přečíst je často zamlžen právě těmito technickými buzzwordy. A jedním z nich je také objektová storage neboli storage speciálně vyvinutá a optimalizovaná pro objektový přístup.

Ptáte se, co je to objektový přístup? Ukažme si to na analogii z běžného života. Storage mimo jiné znamená i skladiště, v přeneseném významu klidně i parkoviště. Pojďme tedy parkovat. Rodinka se rozhodla navštívit obří show v Las Vegas a vyrazí samozřejmě autem. Zastaví před hlavním vchodem, všichni pohodlně vystoupí, u auta se objeví boy, převezme klíčky, výměnou předá ticket a někam s autem odjede. Po skončení show se rodinka ještě zastaví na párty, vyjde úplně jiným východem, objeví se opět boy, převezme ticket a za nějakou chvíli předá zpět klíčky i s autem. Všimněte si, že tento způsob parkování, neboli uložení auta za účelem pozdějšího vyzvednutí je poměrně bezstarostný.

No a nějak takto funguje platforma pro objektové datové úložiště, s tím rozdílem, že může být globální. Tedy vytvořím data, pošlu je na nějakou IP adresu, vrátí se mi univerzální identifikátor, se kterým lze dále pracovat v jiných aplikacích, sdílet jej apod. Jedná se o vhodný přístup pro globální sdílená úložiště, 

Trocha historie – IBM Cloud Object Storage

Americká firma Cleversafe byla založena v roce 2004 v Chicagu za podpory privátních investorů. Společnost si dala za cíl vyvíjet řešení, jejichž neodmyslitenou součástí jsou nové úrovně škálovatelnosti, zabezpečení dat, efektivity ukládání, dostupnosti a spolehlivosti, s volbou implementace v rámci datového centra či napříč regiony. Řešení Cleversafe mají zákazníky prokázanou schopnost škálovat na stovky petabytes a více při zachování extrémní jednoduchosti kombinované s ochranou a zabezpečením dat. Díky své unikátní erasure coding technologii přichází s významně nižšími náklady než řešení, která spoléhají na vícenásobné prosté kopie dat pro splnění požadavků na spolehlivost.

Inovativní technologie nese jméno dsNet – Dispersed Storage Network. Platforma dsNet může být nasazena jako čistě softwarové řešení na existující infrastruktuře, jako hardwarová appliance, nebo na kvalifikovaném hardware třetích stran. IBM provedla akvizici společnosti Cleversafe v roce 2015 včetně všech příslušných patentů. Od roku 2016 se pak nabízí dsNet technologie pod názvem IBM Cloud Object Storage (COS).

IBM rozšířila nabídku i jako čistě cloudové řešení v rámci vlastních cloudových datových centrech. Je možné vybudovat i hybridní řešení s propojením cloudového a on-premise nasazení.

IDC MarketScape umísťuje každoročně IBM Cloud Object Storage do pozice Leader v rámci kategorie Object Based Storage.

internetové prostředí a nestrukturovaná data.

Je to tedy celé o rozhraní mezi aplikací a úložištěm? Víceméně ano. Klasický přístup k datovým úložištím pro nestrukturovaná data je souborový (NAS přes rozhraní NFS, SMB, FTP), funguje dobře v rámci jednoho datového centra, případně stejné IP sítě. Naopak pro internetové prostředí příliš vhodný není. Vezměme si tedy klasický NAS souborový přístup a aplikujme jej na naši rodinku ve Vegas. Parkovací dům je obrovský a velmi strukturovaný (podobně jako NAS file systém) je třeba nejdříve vybrat a najít ten správný vjezd a navíc si být jist, že tam bude povolen přístup (podobně jako přístupová práva na files share). To pro řidiče musí samozřejmě někdo dopředu zařídit, t.j. schválit a ještě správně nastavit. Závora se otevírá, řidič vjíždí do bludiště podlaží a parkovacích řad (podobně jako výběr mezi adresáři a podadresáři ve file systému) a hledá volné nevyhrazené místo (quota v adresáři nesmí mít přeplněna). Pro vyzvednutí auta z parkoviště je třeba zvolit stejný postup, tedy přes všechny překážky (zapamatování si adresářové cesty, která se nesmí měnit, security práva apod.) vyjet zácpou u výjezdu konečně ven (limitovaný throughput file systému).

Na tomto pragmatickém příkladě jsme si ukázali proč vývojáři internetových aplikací a poskytovatelé cloudových služeb hledali v minulosti nový inovativní přístup pro překonání zátěže legacy přístupu k datovým úložištím. Motivace ještě samozřejmě zahrnovala další parametry jako neomezená škálovatelnost v řádech stovek a tisíců terabytes, nezávislost na proprietárních technologiích, využívání open standardů a komoditního HW, bezúdržbovost a vysoká odolnost proti poruchám, nízká jednotková cena za kapacitu. K tomu si přidejme ještě inovativní způsoby ochrany a konzistence uložených dat a bezpečnost obecně s minimalizací rizika zcizení či zneužití třetími osobami. No a výčtem výše uvedených parametrů jsme se dostali ke kořenům a důvodům pro vznik nativní objektové ukládací platformy IBM Cloud Object Storage.

Jak funguje IBM Cloud Object Storage

IBM Cloud Object Storage doslova porcuje nestrukturovaná data na kousky a jednotlivé porce rozptyluje mezi vícenásobné nódy nebo i geografické regiony. Tento process používá patentovaný Information Dispersal Algorithm (IDA). Platforma IBM Cloud Object Storage se skládá ze tří elementů: Manager, Accesser a Slicestor. Úlohou Managera je primárně nastavení, správa a údržba platformy. Slicestor je označení pro vlastní storage nódy. Accesser pak poskytuje REST rozhraní pro aplikace a zároveň obsahuje inteligenci pro zašifrování jednotlivých porcí dat a vytvoření potřebné redundance pomocí Erasure Coding algoritmů v rámci zápisu na jednotlivé Slicestor nódy. Podobně Accesser provádí reverzní algoritmus dekódování dat při čtení.

Tento Erasure Coding proces chrání data pro výpadkům disku, serveru, racku i lokality díky tomu, že transformuje originální zapisovaná data do takového počtu porcí, že při následném čtení mohou být data rekonstruována pouze z menší podskupiny originálně vytvořených porcí. Tento přístup je efektivnější než schéma ochrany dat založené na kombinaci RAID a replikaci. Jednou z klíčových vlastností IBM Cloud Object Storage je inherentní bezpečnost a spolehlivost platformy. Zahrnuje takzvaný SecureSlice, tedy bezklíčovou šifrovací technologii. Tato funkce umožňuje, aby byly objekty zašifrovány před tím, než jsou naporcovány a rozptýleny na jednotlivé Slicestor nódy. Data jsou přístupná pouze tehdy, když je načten minimální počet porcí daný prahovou hodnotou. Navíc žádný Slicestor nemá všechny porce z objektu, a to přidává další úroveň zabezpečení. Pro udržení integrity dat – jednak při škálování do velkých kapacit a jednak v čase – obsahuje platforma zabudovanou víceúrovňovou logiku pro kontrolu integrity a dále i background procesy pro opravu dat. 

Kam se poděl tradiční RAID? Pozorný čtenář si jistě všiml, že IBM objektová storage platforma nepoužívá k ochraně před ztrátou dat zapříčiněnou hardwarovými výpadky žádný RAID. Jak je to možné, když všechna tradiční disková pole používají nějakou formu RAIDu? Ochrana dat je totiž založena na tzv. Erasure Coding algoritmech, které spadají do skupiny Forward Error Correction (FEC) kódů. Tyto matematické techniky byly poprvé uplatněny v telekomunikacích ve čtyřicátých letech 20. století a jejich pionýrem byl americký matematik Richard Hamming. Praktickým důvodem vzniku byl digitální přenos informace v zašuměném prostředí, kde vznikaly neustálé chyby. Inovativní myšlenkou Hamminga bylo opatřit vlastní data takovým množstvím přidaných redundantních informací, aby příjemce mohl sám detekovat a opravit případné chyby, které vznikly během přenosu. Je evidentní, že čím více redundantních informací se přidá, tím je systém odolnější, ale zároveň i náročnější. Paritní bit, který se používá v RAID5 storage systémech je speciálním případem Erasure Coding. Umožňuje výpadek jednoho disku v RAID skupině bez ztráty dat.

IBM Cloud Object Storage v rámci Erasure Coding zabezpečení používá uživatelsky nastavitelnou úroveň redundance a například IDA Code 12/7 znamená, že systém “přežije” bez ztráty dat výpadek libovolných 5 nódů z 12. Z toho vyplývá i fenomenální mnohadevítková spolehlivost uložení dat 99.9999999923%.

Uživatelé mohou nastavit úroveň fault tolerance podle počtu lokalit, počtu nódů a velikosti jejich konfigurace.

Nasazení IBM Cloud Object Storage

IBM Cloud Object Storage může být nasazen individuálně v rámci datového centra buď jako plug-and-play appliance, případně lze implementovat i jako sotware na serverech uživatele.

Zároveň lze využít i kombinace on-premise, privátního, veřejného nebo hybridního Cloudu. IBM poskytuje objektovou storage v rámci své nabídky veřejných cloudových služeb ve formě:

  • Vault: veřejná, sdílená, cloudová storage služba pro nepříliš často přistupovaná data, s podporou Amazon S3 API
  • Standard: veřejná, sdílená, cloudová storage služba pro často přistupovaná data, s větším výkonem než Vault, s podporou Amazon S3 API
  • Dedicated: dedikovaná single-tenant storage služba hostovaná v IBM Cloudu
  • System: On-premise software nebo appliance

Tento flexibilní ekosystém umožní uživatelům s on-premise zařízeními implementovat spolehlivou storage hierarchii v rámci svého existujícího IT frameworku. Aplikace s velkými nároky budou moci používat on-premise storage, zatímco další tiery off-premise storage mohou být využity pro méně náročné aplikace. Z krátkodobého pohledu lze využít tento hybridní systém jako efektivní škálovací mechanismus pro řízení nepředvídatelných storage potřeb. Z dlouhodobé a strategické perspektivy se zároveň může stát nedistruptivní cestou pro společnosti, které směřují k zahrnutí cloudových zdrojů do svého mixu infrastruktury.

IBM Cloud Object Storage podporuje širokou řadu standardních rozhraní jako Amazon S3 API, OpenStack Swift, SOH, stejně tak i klasická souborová rozhraní NFS a SMB pomocí cloud-enabled NAS gateways.

Kde lze využít objektovou storage?

Analytici dlouhodobě předpovídají masivní nárůst nestrukturovaných dat a trh víceméně jejich odhady reflektuje. Tato čísla jsou fenomenální a proto se správa dat stává čím dále tím větší výzvou. IBM Cloud Object Storage začal být primárně úspěšný v řadě vertikál jako jsou vládní aplikace, zdravotnictví, media & entertainment a finanční služby. A to především díky své unikátní architektuře datové bezpečnosti.

Využití ovšem nachází i pro velké multimediální soubory, video, audio a obrázky, v oblasti Internet of Things pro uložení dat ze senzorů, uložení dat generovaných z webů a sociálních médií, v oblasti podpory provozu jako backup, archivace, DR, neaktivní a compliance data, bezpečnostní audit log soubory, dále se velmi využívá v globální kolaboraci například pro sdílení souborů a distribuci obsahu. Jinou velkou oblastí je i ukládání a sdílení vědeckých dat – genomických, geospaciálních a HPC.

IBM Cloud Object Storage je zároveň integrovatelná s dalšími IBM technologiemi v rámci IBM Bluemix, IBM Cloud Video Services, IBM Watson apod.

Pro další informace o IBM Cloud Object Storage klikněte na: https://www.ibm.com/cloud-computing/products/storage/object-storage/cloud/

Rudolf Hruška, IBM Information Infrastructure Leader, rudolf_hruska@cz.ibm.com