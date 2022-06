Česká republika je první zemí v regionu, kde byl nainstalován hardware od mladé britské společnosti Graphcore. Do provozu ho uvádí ČVUT, konkrétně Research Center for Informatics (RIC) spadající pod Fakultu elektrotechnickou a Fakultu informačních technologií.

Graphcore vyvíjí takzvaná IPU (Intelligence Processing Unit), tedy čipy s architekturou MIMD schopné akcelerovat operace spojené s prvky umělé inteligence a strojovým učením. Od investorů jako Microsoft, Dell, Sequoia Capital, Samsung nebo BMW posbírala 692 milionů dolarů a patří k velkým nadějím britského polovodičového průmyslu.

Graphcore je přímou konkurencí pro podobné akcelerátory od firmy Nvidia. Britské IPU jsou také dostupné v některých cloudech, takže lze rovněž mluvit jako o alternativě k čipům TPU (Tensor Processing Unit) běžících v Google Cloudu.





Základem nabídky Graphcore je IPU čip MK2 GC200. Je vyroben 7nm procesem u TSMC, obsahuje 59,4 miliardy tranzistorů a 1472 procesorových jader. AI výkon v FP16 má dosahovat na 250 teraflops. Tyto čipy dále Graphcore skládá do hotových serverů o několika konfiguracích. Graphcore k tomu dodává i vlastní framework Poplar.

Velká očekávání

Na ČVUT si pořídili jednotku POD4 obsahující server MI2000 se čtyřmi IPU akcelerátory. Jde o nejmenší možnou konfiguraci, jež by měla zvládat až jeden petaflop.

„POD jsme koupili spolu se serverem, který má obdobnou konfiguraci jako naše ostatní uzly v klastru, tedy AMD Epyc s 64 jádry a 128 vlákny, 1 TB paměti, 2 TB NVMe, 200 Gb/s Infiniband a čtyřikrát 100 Gb/s Ethernet. Server je s IPU POD4 propojen 100Gb Ethernetem. K jednomu serveru mohou být připojeny až čtyři bloky POD4, vznikne pak POD16. Navzájem jsou bloky propojeny dedikovanou 400Gb sběrnicí. Máme tedy prostor pro případné další rozšiřování,“ popsal Lupě Daniela Večerka z katedry kybernetiky Fakulty elektrotechnické ČVUT.

Na ČVUT rozjíždí testování. Mimo jiné si chtějí ověřit, jak na tom Graphcore bude ve srovnání s používanými prvky od Nvidie, tedy kartami V100 a A100 a minisuperpočítačem DGX A100, kterých škola pořídila deset.

Výzkumníci mají dle svých slov velká očekávání. „Graphcore primárně chtějí využívat skupiny zabývající se obory machine learning a computer vision. Dle dostupných testů může být IPU v těchto oblastech až pětkrát rychlejší než karty Nvidia Tesla A100, které v klastru RCI máme. Graphcore nabízí velmi snadnou integraci do frameworků PyTorch a TensorFlow, jež primárně používáme. Stačí změnit pár řádků kódu a místo na GPU poběží učení na IPU,“ doplnil Večerka. Graphcore uvádí, že je výkonnější než Nvidia A100.

Model MI2000, který si na ČVUT koupili, vyjde na 36 tisíc dolarů, tedy asi 850 tisíc korun. Pro vzdělávací sektor je cena 28 tisíc dolarů. K tomu se ještě platí tříletá podpora na hardware a software v hodnotě 6850 dolarů. Pro srovnání: jedna samotná karta Nvidia A100 80 GB se prodává za 16,9 tisíce dolarů, pro školy za 13 tisíc.

„Uvidíme, jak se to s Graphcore rozjede. Nvidia s nově ohlášenou H100 zase udělala brutální výkonový skok dopředu, ale taky si to nechá zaplatit. Přesné ceny celého serveru DGX H100 s osmi kartami H100 zatím nezveřejnila. Řeší se, jestli bude postavena na příští generaci Intelu (Sapphire Rapids), který má zpoždění, nebo AMD (Genoa) kvůli PCI Express 5.0. Ale spekuluje se, že cena bude atakovat hranici 500 tisíc dolarů za server. DGX H100 ale bude mít nejlepší poměr výkon/spotřeba a už teď řešíme s některými univerzitami nákup, protože jim to přijde zajímavé,“ uvedl pro Lupu Petr Plodík ze společnosti M Computers, která Graphcore na ČVUT dodala.

ARM v Ostravě

M Computer zastupuje Graphcore ve střední a východní Evropě a firmu sleduje už delší dobu. „Přešlo do ní několik lidí, se kterými jsme v minulosti spolupracovali. Obchod v Evropě řeší Gautier Soubrane, jenž dělal pro PNY nebo DDN. Technický vývoj zaštiťuje Pawel Gepner, který dříve pracoval v Intelu a řešil s námi několik projektů v Čechách,“ nastínil Plodík.

O dodávku Graphcore mělo zájem i národní superpočítačové centrum IT4Innovations na VŠB-TUO v Ostravě. To vypsalo projekt na takzvané doplňkové superpočítačové systémy k hlavním výkonným strojům. Zakázku za devět milionů podle informací Lupy opět vyhrála firma M Computers, jež porazila Atos, Graphcore ale nakonec v instalaci není. Jsou tam ale jiné zajímavé přístroje.

Vyniká zejména jednotka postavená na architektuře ARM a pamětech HBM. V podstatě jde o část superpočítače Fugaku od Fujitsu, který byl s výkonem 442 petaflops donedávna nejrychlejším superpočítačem na světě a nyní drží druhé místo. Česko si tak bude moci otestovat HPC postavené na ARMu. Evropská unie chystá zprovoznění rychlejšího ARM stroje s výkonem 7,2 petaflops, kde budou možnosti ještě větší.

Další jednotka v Ostravě bude využívat Intel Optane Memory ve slotech DIMM a FPGA karty Intel Altera. Třetí jednotka má mít technologie AMD včetně akcelerátorů Instinct MI100 propojených Infinity Linkem s FPGA kartami Xilinx. Čtveřici doplňuje AI edge systém s kartou Nvidia A10 Tensor Core. Většina hardwaru už je v Česku.

IT4Innovations chce letos na podzim soutěžit druhou část komplementárních systémů. I tam budou k vidění zajímavé konfigurace. Jedna využije ARM a GPU a DPU od Nvidie, další IBM Power10, třetí kombinaci procesorů od AMD s high L3 cache a GPU Nvidia a počítá se i s kombinací FPGA Intel Agilex, procesorů Intel Sapphire Rapid a grafik Intel Xe.