Nvidii chce v provozu AI konkurovat i firma pohánějící velkou část chytrých telefonů. Podívejte se na její kontroverzní techniku

Dnes
Doba čtení: 3 minuty

Sdílet

Qualcomm AI200 má být další konkurent pro inferenci umělé inteligence. V tréninku už není moc prostoru a v inferenci se otevírá prostor i pro jiné hráče než Nvidii.

Americká společnost Qualcomm se vrhá do byznysu s čipy pro chod umělé inteligence. Nezaměří se na trénování, ale na takzvanou inferenci, tedy provoz samotné AI. Kromě Nvidie bude konkurovat firmám jako AMD, Intel, Amazon Web Services (čipy Inferentia) nebo na pamětech SRAM postaveným alternativách typu Cerebras.

Čipové a bezdrátové technologie Qualcommu pohání velkou část mobilního světa (smartphony, mobilní sítě a podobně) a nyní se firma více vrhá také do nové teoreticky lukrativní oblasti. V AI zatím zase tolik úspěchů nemá, soustředila se hlavně na edge AI s vizí, že se AI bude počítat distribuovaně (například u mobilních vysílačů), ale to zatím moc nezafungovalo, mimo jiné z toho důvodu, že se naopak výpočetní síla kolem AI centralizuje v obřích datacentrech.

Vstup do byznysu pro inferenci dává smysl. V trénování není moc velká šance na úspěch, karty jsou do jisté míry rozdány. Pro další rozvoj AI ale bude klíčové srazit cenu za provoz, tedy i inferenci. Nvidia zde nemusí vycházet jako nejlepší volba (i proto investuje 20 miliard dolarů do firmy Groq) a lze vidět investice firem jako OpenAI do nákupu Cerebrasu a podobně. Intel a další firmy tlačí rovněž na inferenci.

Qualcomm proto na veletrhu Mobile World Congress 2026 v Barceloně představil inferenční čipy a pro ně přizpůsobené servery a serverové skříně (racky). Označení ponesou AI200 a AI250. První bude dostupný letos, druhý příští rok.

AI akcelerátory budou postaveny na architektuře Qualcomm Hexagon, jde o takzvané NPU (Neural Processing Unit). Podporují instrukce INT2, INT4, INT8, INT16, FP8 a FP16, 64bitové adresování paměti nebo virtualizaci.

Jeden akcelerátor AI200 bude podporovat až 768 GB paměti LPDDR, což je na inferenci slušné číslo. Rack celkově pojme až 43 TB paměti a může pracovat s 140 až 160 kW. Systémy bude možné škálovat skrze PCIe a ethernet, Qualcomm k tomu využívá technologie od koupené firmy Alphawave Semi.

Qualcomm ukázal model s 350 miliardami parametrů běžící na jedné akcelerační kartě. AI200 má umět škálovat až na bilion parametrů. Design racku AI200 si můžete prohlédnout v naší galerii, servery a čipy jsou chlazeny kapalinou. Detaily o AI250 zatím nebyly zveřejněny.

Platforma Qualcommu má být otevřená, podporovány mají být tradiční softwarové nástroje jako PyTorch, ONNX, vLLM, LangChain, CrewAI a podobně.

Je otázkou, jak moc bude Qualcomm kompetetivní. Odhady mluví o tom, že reálný výkon AI200 by měl být na úrovni AMD Instinct MI355X a Nvidia B200. AI200 zároveň vyjde v době, kdy AMD pošle na trh MI450 a Nvidia zase Vera Rubin, tedy výkonově zase o něco odskočené generace. Takzvaná tokenomika kolem toho bude zajímavá. Je otázkou, zda Qualcomm nepřinese něco, co nebude takzvaně dead on arrival, tedy mrtvé hned při vydání.

AIT26

Prvním velkých zákazníkem Qualcommu má být saúdská společnost Humain, která by měla nasadit AI200 a AI250 o výkonu 200 MW. Technologie má pohánět AI modely Humainu.

Qualcomm prozatím nespecifikoval, jaké procesory budou součástí serverů s jeho NPU. Vzhledem k jeho zaměření na ARM by dávalo smysl nasazení právě ARMu, to ale nebylo potvrzeno.

Takto vypadají čipy a servery, které se obejdou bez monopolu Nvidie. Nervózní jsou také Intel a AMD Přečtěte si také:

Takto vypadají čipy a servery, které se obejdou bez monopolu Nvidie. Nervózní jsou také Intel a AMD

  • Chcete mít Lupu bez bannerů?
  • Chcete dostávat speciální týdenní newsletter o zákulisí českého internetu?
  • Chcete mít k dispozici strojové přepisy podcastů?
  • Chcete získat slevu 1 000 Kč na jednu z našich konferencí?

Staňte se naším podporovatelem

Autor článku

Dlouholetý technologický novinář, kmenový redaktor portálu Lupa.cz. Kromě Lupy publikuje i na webu E15 a v zahraničních médiích.



Nejnovější články

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).