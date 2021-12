Amazon Web Services (AWS) je největším cloudem světa, který nabízí přes 470 různých typů instancí s tím, že uživatelé každý den spustí 60 milionů nových. „Zákazníci po nás neustále chtějí vyšší výkon s nižšími náklady,“ tlumočí firma s letošním ročním obratem 60 miliard dolarů logické požadavky trhu.

Mezi instancemi AWS proto lze vídat ty, které nepohání tradiční x86 čipy od Intelu nebo AMD, ale architektura ARM. Amazon chce ARM využívat čím dál více, a přispívá tak k plíživému trendu, kdy tato technologie neovládá „pouze“ chytré telefony a tablety, ale proniká do počítačů (Apple M1) nebo právě serverů.

Nejnovějším příspěvkem Amazonu do této oblasti jsou čipy Graviton3 navazující na dvě předchozí verze. Graviton je procesorovou alternativou k Intelu a AMD nasazovanou v serverech AWS. Zákazníci si mohou spouštět virtuální cloudové stroje, které na pozadí běží na ARMu.

AWS s procesory ARM začal intenzivně pracovat v roce 2015, když koupil izraelskou společnost Annapurna Labs. Ta už měla vyvinutých několik čipů, významnou iterací ale byl rozjezd Gravitonu v roce 2018. Amazon začal nabízet čipy s šestnácti jádry Cortex-A72 na frekvenci 2,3 GHz, podporou paměti až 32 GB nebo síťovou propustností až 10 Gb/s.

O rok později přišla generace Graviton2 postavená na 64 jádrech ARM Neoverse N1 s frekvencí až 2,5 GHz. K tomu je možné využít až 512 GB paměti nebo 25Gb síťovou propustnost. Zatímco první Graviton bylo možné pořídit pouze v jednom druhu instancí (EC2 A1), dvojka už nabízí mnohem širší záběr. Nově byly například spuštěny instance kombinující Graviton2 a grafické čipy Nvidia T4G Tensor Core. Určené jsou pro renderování, strojové učení, streamování Android aplikací a podobně. Stejně tak přibyly Gravitonem poháněné instance pro ukládání dat.

AWS uvádí, že Graviton2 oproti srovnatelným x86 instancím nabízí až o 40 procent vyšší výkon s o 20 procent nižšími náklady. Výkon na watt má být až třiapůlkrát vyšší než u jiných procesorů nabízených v AWS. Instance s Graviton2 jsou dostupné v třiadvaceti regionech AWS.

Graviton 3 s DDR5 a PCI Express 5.0

V těchto dnech vstupuje do akce Graviton3 s výkonem o 25 procent vyšším než v případě jeho předchůdce. Výkon v rámci floating point a kryptografie je dvojnásobný. Díky preview lze začít zkoušet nové instance C7g, které s třetím Gravitonem pracují, a navíc obsahují paměti DDR5 (první DDR5 v datacentrech Amazonu), síťovou propustnost až 30 Gb/s a PCI Express 5.0 s 32 vlákny.



Graviton3 je čip vyráběný pomocí 5nm procesu u TSMC (dvojka je postavená na 7nm procesu, jednička na 16nm). Obsahuje 55 miliard tranzistorů oproti třiceti, respektive pěti u předchozích generací. Třetí Graviton má 64 jader ARM Neoverse N2 s frekvencí 2,6 GHz. K dispozici je 8MB L1 cache, 64MB L2 cache a 64MB L3 cache. Propustnost pamětí (DDR5–4800) na socket je 300 GB/s. Nevyužívá se architektura ARMv9, ale ARMv8.5.

Jedním z prvních zákazníků, kteří Graviton3 nasadili v praxi, je Formule 1. Ta AWS využívá mimo jiné pro velmi náročné výpočty související s aerodynamikou a prouděním vzduchu kolem závodních vozů (computational fluid dynamics). Jedním z úkolů bylo navrhnout formule tak, aby mohly jezdit blíže u sebe. „Instance C7g s Graviton3 v našem případě byly o zhruba 40 procent rychlejší než instance C6gn s Graviton2,“ popsal Lupě Rob Smedley z F1, který předtím pracoval jako inženýr pro Ferrari či Williams.

Počet uživatelů Gravitonu se rozšiřuje. Druhou verzi čipů používají například společnosti Snapchat, Twitter, Epic Games, Netflix nebo Lyft. Snapchat na Gravitonu provozuje Messaging Core Service a plánuje přesun dalších služeb. Lyft na Gravitonu spouští projekty postavené na Pythonu a Go a mluví o třicetiprocentním nárůstu výkonu oproti dřívějším x86 instancím.

Do nasazování a propagace Gravitonu u zákazníků se pustily firmy jako Red Hat, Docker, Elastic, SUSE a další. Amazon se snaží na ARMovou loď dostat co nejvíce partnerů. Pokud nasazení vlastních čipů ještě více rozšíří, stane se větším odběratelem u TSMC, díky čemuž mu klesnou výrobní náklady a bude moci realizovat další úspory z rozsahu. Nebude také tolik závislý na odběrech od Intelu a AMD.

AWS v rámci rozšiřování spustil partnerský program Graviton Ready. „Potřebujeme software, integraci, nasazení, bezpečnost a monitoring,“ uvádí firma směrem k softwarovým partnerstvím. Pro Graviton už je například odladěná in-memory databáze SAP HANA. Pořádány jsou rovněž hackathony.

Něco jako Apple

Amazon neuvádí, kolik čipů ARM má v běhu. „Počet nasazených Gravitonů ani jimi poháněných instancí nekomentujeme, jde ale o značné číslo,“ popisuje pro Lupu Ron Diamant, který v AWS působí jako principal engineer.

Diamant zároveň přibližuje, proč se Amazon do vlastních ARMových čipů pustil. „Křemík můžeme úzce specializovat pro využití s našimi aplikacemi a dalším hardwarem. Máme pod kontrolou celý end-to-end vývojový proces, díky čemuž můžeme lépe inovovat, zrychlit dodávky novinek na trh a vše můžeme lépe monitorovat,“ vysvětluje inženýr. Jde o podobný přístup, který volí Apple.

Amazon v tuto chvíli nemá v plánu, že by Graviton dodával na běžný trh mimo instance AWS. Lze si ale pořídit hotové servery AWS Outposts, které lze provozovat jako on-premise instalaci spojenou s AWS a v rámci kterých Graviton běží. Outposts jsou i základem AWS Local Zones, tedy hardwarové infrastruktury, kterou Amazon v příštím roce instaluje i v Česku.

Systém Nitro

Graviton je jen jedna část příběhu ARMu v AWS. Amazon své aktivity kolem této architektury odstartoval v roce 2012, kdy se inženýři začali dívat na to, jak zvýšit výkon výpočetních instancí EC2 tím, že se funkce virtualizace přesunou z běžných serverů do samostatných karet. To položilo základy technologie AWS Nitro System.

To, co se Amazonu s Nitrem povedlo, si lze prohlédnout v přiložené galerii. Shrnout to lze tak, že bylo možné řadu komponent včetně funkcí hypervisoru, bezpečnostního čipu a dalších delegovat do samostatného hardwarového systému. Původní hypervisor Xen byl zcela odstraněn a v AWS běží pouze velmi tenký Nitro Hypervisor. Podle Rona Diamanta to umožnilo skokově navýšit množství nově uváděných instancí.

Pak jsou zde čipy Trainium a Inferentia. První z nich jsou určeny pro trénování deep learning modelů. K dispozici jsou nové instance Trn1 se síťovou propustností 800 Gb/s (Elastic Fabric Adapter), rychlostí 768 GB/s a šestnácti akcelerátory Trainium. Trn1 je první instance v rámci EC2 zvládající 800 Gb/s. Akcelerátory Inferentia jsou zase součástí instancí Inf1. Pěknou analýzu kolem Gravitonu3 a ARMu v Amazonu přináší SemiAnalysis.

Amazon v cloudu začal nabízet ještě jeden ARM, a to EC2 instance s čipy Apple M1. K dispozici jsou stroje Mac mini s osmi CPU a osmi GPU jádry M1 a 16 GB RAM. Služba míří na vývojáře aplikací pro Apple. Zatím jde o preview verzi. Bude zajímavé sledovat, jak AWS v tomto případě bude hýbat s cenami. Původní instance Mac mini s x86 totiž nevycházely levně.