Americké úřady před několika dny zadržely spoluzakladatele společnosti Supermicro, která dlouhodobě patří mezi největší výrobce a dodavatele serverů do datových center. Společně s dalšími osobami ho obvinila z pašování výkonných grafických karet (GPU) umístěných v serverech pro provoz umělé inteligence do Číny. Ta už je nějakou dobu pod americkými sankcemi a tudíž AI čipy od Nvidie či AMD nemůže kupovat a americké entity s těmi čínskými nesmí spolupracovat.
Pro Supermicro jde o paradoxní situaci. Firma byla dlouhodobě známá zejména díky svým tradičním serverům, které dodávala za rozumnou cenu, což sehrálo roli i v její oblibě na českém trhu (má u nás sedm autorizovaných partnerů). Společnost se následně jako jedna z prvních chytla vlny serverů s GPU, díky čemuž v poslední době výrazně vyrostla. Zatímco v roce 2022 měla společnost tržby 5,2 miliardy dolarů, loni to bylo skoro 23 miliard dolarů.
Americké ministerstvo spravedlnosti obžalovalo tři osoby. Jednou z nich je Yin-Shyan Liaw (Wally), americký občan a spoluzakladatel Supermicra. Ten krátce poté rezignoval z představenstva podniku. Dále byli obžalováni tchajwanští občané Ting-Wei Sun (Willy) a Ruei-Tsang Chang (Steven). První dva byli zadrženi, třetí je na útěku.
Tato trojice měla do Číny propašovat servery s GPU značky Nvidia v hodnotě 2,5 miliardy dolarů, čímž mělo dojít k obcházení amerických exportních kontrol. Podezřelí měli používat různé metody. Kromě jiného odlepovali sériová čísla z hardwaru a vytvářeli falešené servery pro oklamání celních kontrol.
Hra na citlivém místě
Zákazníci z Číny se díky činnosti obviněných dostali k zakázaným technologiím, pomocí nichž mohou vytvářet vlastní velké jazykové modely a podobně konkurující západním technologiím typu GPT od OpenAI.
Čína se pod americkými sankcemi snaží v polovodičích osamostatnit. Někde se jí to daří. Na Lupě jsme nedávno testovali SSD disk pro PCIe 5.0, který se vyrovná tomu nejlepšímu na trhu. V AI čipech ale Čína tak daleko není, i když například servery od Huawei už se jeví celkem zajímavě a na domovském trhu jsou široce používány.
Američané jsou na situaci kolem čipových sankcí velice citliví. Jak jsme na Lupě podrobně rozebírali, i České republice jednu dobu hrozilo, že nebude moci neomezeně odebírat nejvyspělejší GPU, protože jsme spadli do kategorie druhořadých partnerů. Neprokázalo se však, že by přes Česko grafiky proudily do problematických zemí, i když se o tom spekulovalo.
Otázka zapojení Nvidie
Firma Supermicro uvedla, že spolupracuje s úřady. Ty budou dále vyšetřovat, zda o obcházení sankcí věděla Nvidia, pro níž je Supermicro důležitý partner představující zhruba devět procent tržeb. Je možné, že Nvidia bude muset dodávky pro Supermicro omezit, případně je zcela stopnout. Konkurenti Hewlett Packard Enterprise nebo Dell už registrují zvýšenou poptávku.
Nvidia přitom ještě před pár dny na konferenci GTC 2026 prezentovala Supermicro jako jednoho z prvních výrobců serverů s chystanou novou generací čipů Vera Rubin.
Pro Supermicro jde o už druhou kauzu v krátké době. První problémy začaly v roce 2024, kdy byla firma obviněna z dodávek do sankcionovaného Ruska a z pochybných transakcí s firmami bratrů generálního ředitele Charlese Lianga. Supermicro také odkládalo podání výročních finančních zpráv (10-K) a hrozilo jí vyřazení z burzy Nasdaq. Auditorská společnost E&Y upustila od spolupráce s tím, že nechce být spojována s výkazy, které jí předkládá vedení Supermicra.
Důsledkem je kromě jiného to, že i když Supermicro díky rychle rostoucím prodejům serverů výrazně zvedá tržby (viz výše), nemá důvěru investorů. Akcie se v roce 2024 obchodovaly na 114 dolarech za kus, dnes je to 20 dolarů.
Jak takový server vypadá
Pokud chcete trénovat umělou inteligenci jako jsou velké jazykové modely (LLM), nejvýkonnějším hardwarem současnosti jsou grafické čipy Nvidia Blackwell, konkrétně jejich poslední iterace B300. Nvidia dělá také takzvané superčipy GB300, kde na jedné desce kombinuje dvě B300 a jeden procesor ARM. To vše lze poskládat do serverového rozvaděče (racku) označovaného jako NVL72. Jde o referenční design Nvidie, který jsme na Lupě nedávno ukázali. Partneři na tomto základu dělají racky vlastní, dnes tu tedy máme Supermicro.
Cena podobných systémů hodně rychle roste. Zatímco koncem roku 2025 jedna NVL72 vyšla na něco přes tři miliony dolarů (63 milionů korun), dnes je to kolem čtyř milionů dolarů (více než 84 milionů korun). Vzhledem k tomu, jaká je po nákupu AI infrastruktury stále poptávka, to zřejmě půjde ještě výše. Nvidia by letos měla začít prodávat novou generaci čipů Vera Rubin, kde by jeden rack NVL72 měl vyjít minimálně na šest milionů dolarů (skoro 130 milionů korun), spíše ale sedm.
Supermicro dodává jak vlastní servery s GPU, tak design racků vycházející z NVL72. V naší galerii si můžete prohlédnout model Supermicro Nvidia GB300 NVL72, jehož podrobné specifikace naleznete zde a zde.
Superčip GB300 má 576 GB paměti HBM3e (288 GB na každé GPU) a 480 GB paměti LPDDR5X (poprvé jde o LPCAMM, což mimo jiné umožňuje úsporu místa).
Do NVL72 se vejde 72 grafických karet Blackwell Ultra (B300) a 36 procesorů Nvidia Grace (celkem 2 592 jader ARM Neoverse V2). Celková paměť určená pro grafiky (HBM3e) je až 21 TB a propustnost na úrovni racku dosahuje na 576 TB/s. Celková paměť pro procesory (LPDDR5X) dosahuje až na 17 TB. Osadit lze až 144 systémů s disky PCIe 5.0 (E1.S).
Pro síťařinu lze použít Nvidia Quantum-X800 InfiniBand nebo Spectrum-X Ethernet (SuperNIC Connect-X) o rychlosti až 800 Gb/s. GPU se propojují přes NVLink o rychlosti 1,8 TB/s.
Celková spotřeba je 132 až 140 kW, jedna grafika si bere kolem 1 400 W. Rack se chladí kapalinou. Díky tomu lze mít zajímavou hustotu na rack. Do jednoho 1U serveru se vejdou dvě GB300.
Jednotlivé NVL72 se spojují do velkých clusterů. Jeden rack může dát výkon až 1 440 petaflops pro inferenci (FP4) nebo 720 petaflops pro trénování (FP8/FP6).
Detailní pohled na samotnou GB300 bohužel nemáme, lze se ale podívat na obnaženou předchozí verzi GB200, která má jen o něco horší parametry.
Takto vypadá GB300 NVL72 přímo od Nvidie: