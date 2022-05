Autor: Tachyum

Slovenská společnost Tachyum po oznámení univerzálního serverového procesoru Prodigy se 128 jádry přichází s dalším velkolepým prohlášením. Na Slovensku chce rozjet superpočítač za 70 milionů eur, tedy 1,7 miliardy korun, který má ve zpracování AI operací zvládat výkon až 128 exaflops. V případě double-precision výkonu má jít o 500 petaflops při spotřebě devět megawattů.

Současný nejvýkonnější stroj planety, Fugaku od Fujitsu, má 442 petaflops a využívá architekturu ARM. Brzy spuštěný superpočítač LUMI ve Finsku, jehož součástí je i Česko, se má dostat na 552 petaflops.

Slováci oznámili ambice postavit velmi rychlý superpočítač už v roce 2020. Jde o projekt Innovations for Digital Infrastructure (I4DI), jehož členy jsou vedle Tachyum také InoCloud, PosAm, Towercom, Seagate, WWT, VNET a Sylex. Stroj má používat procesory Tachyum, přes 1,6 PB RAM a úložiště 100 PB.

Prodigy od Tachyum se má letos po zpoždění dočkat tape-outu a příští rok jít do masové produkce u TSMC. Firma stále nedodala žádné veřejné testy, což v komunitě budí pochybnosti.

Tachyum plánovaný superpočítač popisuje takto:

Vzduchom chladený rack Prodigy obsahuje 24 4P (štvorprocesorových) 2U serverov (1 Unit je 4,445 cm; 2U je 8,49 cm; ide o špecifikáciu založenú asociáciou Electronic Industries Association, EIA) a 96 čipov Prodigy strednej triedy, ktoré poskytujú až 6,5-krát vyšší výkon pre aplikácie HPC a až 12,6-krát vyšší výkon pre aplikácie AI s až 16-krát vyšším výkonom/TCO než referenčná architektúra NVIDIA H100 DGX POD zahŕňajúca 4× H100 DGX a 32× H100 SMX blokov.

Kvapalinou chladený rack Prodigy pozostáva z 36 4P (štvorprocesorových) 1U serverov a 144 čipov Prodigy najvyššej triedy na rozšírenie výkonu pre HPC aplikácie až na 13,5× a 27× pre AI aplikácie v porovnaní so systémom od spoločnosti NVIDIA. Poskytuje tiež až 13× vyšší výkon pri viac ako 10× nižších TCO v porovnaní s H100 SMX.

Výkon Tachyum Prodigy prevyšuje svoje predošlé konzervatívne ciele. Ako sa dizajn čipu vyvíjal a „dozrieval“, pri overovacích testoch sme namerali oveľa vyšší výkon čipu Prodigy; výrazne presahujúci to, čo sme pôvodne projektovali. S vyšším výkonom, ako aj výkonom v prepočte na dolár a watt, dáva procesor Prodigy možnosť Slovensku obstarať najrýchlejší superpočítač s umelou inteligenciou na svete.

Aktualizovaný systém so 128 exaflopmi výpočtového výkonu pre umelú inteligenciu poskytne dvojnásobný AI výkon za rovnakú sumu (70 miliónov eur), čo umožní zdvojnásobiť AI tréning a inferenciu bez dodatočných nákladov. Slovensko okrem toho bude mať v priebehu nasledujúceho roka možnosť upgradu na výkon jedného DP (Double Precision) exaflopu a 256 AI exaflopov len za 55 miliónov eur, čím získa superpočítač s výkonom jedného DP exaflopu a 256 AI exaflopov za 125 miliónov eur. To je zlomok ceny akéhokoľvek iného riešenia.

Dátové centrum vzduchom chladeného superpočítača s procesormi Prodigy predstavuje 107 rackov počítačových uzlov a 10 rackov pre úložisko. Superpočítač založený na procesoroch Prodigy s kvapalinovým chladením počíta so 48 rackmi s počítačovými uzlami a 10 rackmi úložiska. Budúce nasadenie modulárneho superpočítača na platforme Tachyum Prodigy prvej generácie je škálovateľné až do štyroch DP exaflopov a jedného AI zetaflopu. To všetko pri spotrebe menej ako 70 megawattov a za cenu 500 miliónov eur.

Slovenský superpočítač s procesormi Prodigy by bol v oblasti umelej inteligencie 7× výkonnejší ako NVIDIA Eos, ktorý má mať 18,4 exaflopov, a viac ako 25× výkonnejší ako superpočítač Fugaku, ktorý je momentálne najrýchlejší na svete. Rackové riešenia Tachyum ponúkajú porovnateľne vyšší výkon ako Tesla Dojo aj ako výpočtové systémy Cineca MARCONI100, ktoré dnes patria medzi najväčšie a najvýkonnejšie superpočítače.

Tachyum umožňuje robiť viac za menej zdrojov. S našimi vzduchom či kvapalinou chladenými rackovými riešeniami dokážeme dosiahnuť exponenciálne viac pri ešte lepších úsporách celkových nákladov na vlastníctvo (TCO). Prodigy rieši problém udržateľného rastu dátových centier. Spĺňa požiadavky vyššieho výkonu pri menšej spotrebe. Za rovnakú cenu sme schopní zdvojnásobiť výkon pre AI tréning a inferenciu. S Prodigy navyše môže svet ušetriť tony oxidu uhličitého.

Tachyum Prodigy môže pomocou štandardných programovacích modelov spúšťať aplikácie HPC, konvolučnú AI, vysvetliteľnú AI, všeobecnú AI, bio-AI a neurónové siete, plus bežné zaťaženie dátových centier na jedinej homogénnej procesorovej platforme.

Bez Prodigy musia hyperškálové dátové centrá používať pre rôzne záťaže heterogénnu hardvérovú štruktúru pozostávajúcu z procesorov CPU, GPU a TPU, čo je neefektívne, nákladné a zložité z hľadiska dodávok a údržby. Používanie špecifického hardvéru pre každý typ záťaže (napr. dátové centrum, AI, HPC) vedie k nedostatočnému využitiu hardvérových prostriedkov, náročnejšiemu programovaniu, integrácii a údržbe softvéru, ako aj k väčším problémom s údržbou hardvéru. Schopnosť Prodigy plynulo prepínať medzi rôznymi pracovnými záťažami dramaticky mení konkurenčné prostredie a ekonomiku dátových centier.