Takto vypadá nová generace AI grafik Nvidia. Nepůjde chladit vzduchem, vyčerpá ještě více pamětí a opět zdraží

Dnes

Nvidia by v druhé polovině roku měla začít dodávat novou generaci čipů pro umělou inteligenci. Půjde o následovníka aktuálního Blackwellu, konkrétně o grafické karty Rubin, procesory Vera (ARM) a jejich kombinaci Vera Rubin (takzvaný superčip). Mezi prvními odběrateli budou největší AI společnosti současnosti, kromě jiného Google. Nvidia na konferenci Google Cloud Next 2026 v Las Vegas ukázala první náznak toho, jak bude Vera Rubin vypadat. Podívat se můžete v naší galerii.

Nová generace Nvidie bude první, kterou zřejmě nepůjde chladit vzduchem, pouze kapalinou (45 stupňů Celsia). Opět výrazně vyroste cena. Například u Blackwellu byla cena jednoho standardizovaného racku (NVL72) tři až čtyři miliony dolarů, u Very Rubin půjde o pět až sedm milionů dolarů. Nvidia k tomu dodává, že až desetkrát klesne cena na generování tokenů, což se uvidí v praxi.

Část technologie kolem Very Rubin se týká i České republiky. Společnost Onsemi, která má výrobu v Rožnově pod Radhoštěm, dodává Nvidii napájecí čipy (power electronics).

Rack Vera Rubin NV72 bude obsahovat 72 grafických karet a 36 procesorů. Novinkou bude použití nejnovější generace pamětí HBM4, do jednoho rozvaděče půjde umístit 20,7 TB s propustností 1,6 PB/s. NVLink dosáhne na 260 TB/s.

Rubin GPU se vyrábí 3nm procesem TSMC (N3P) a obsahuje 336 miliard tranzistorů (Blackwell měl 208 miliard). Na jedno GPU bude až 288 GB HBM4, šířka pásma dosáhne 22 TB/s. NVLink zvládne oběma směry 3,6 TB/s na jedno GPU.

Dalších 6 fotografií

Vera CPU využije 88 jader ARM s označením Olympus, k dispozici bude takzvaný Spatial Multithreading se 176 vlákny. L2 cache bude mít dva MB na jádro, sdílená L3 cache dosáhne na 164 MB. Podpora pamětí bude LPDDR5X s propustností 1,2 TB/s. Integrován bude NVLink chip-to-chip s propustností 1,8 TB/s, což umožní rychlou komunikaci mezi CPU a GPU bez úzkého hrdla v podobě PCIe.

Nvidia v rámci nadcházející generace poprvé začlení technologii LPU od v podstatě koupené firmy Groq. Tyto čipy pro inferenci pracují s ultrarychlou pamětí SRAM, která má propustnost 150 TB/s, což je oproti HBM4 několikanásobek. Nevýhodou je objem, na čip půjde dát 500 MB SRAM a do jednoho racku se vejde 256 čipů s celkově 128 GB SRAM. Nvidia tuto technologii pozicuje na inferenci tam, kde jsou nutné co nejrychlejší výsledky a pro ty, kdo jsou ochotní za to zaplatit.

Google bude v cloudu nabízet instance A5X postavené na Vera Rubin NVL72. V jednom clusteru bude možné mít až 80 tisíc GPU a mezi více clustery až 960 tisíc GPU.

Google ve svém cloudu aktuálně provozuje Blackwelly. Takto vypadá rack s GB200 a GB300, který ve velkých počtech běží v jeho datacentrech. O specifikacích Blackwellů jsme více psali třeba zde.

Dalších 11 fotografií

Vstoupit do diskuse

Zasílat nově přidané názory e-mailem

Našli jste v článku chybu?

Jan Sedlák

Dlouholetý technologický novinář, kmenový redaktor portálu Lupa.cz. Kromě Lupy publikuje i na webu E15 a v zahraničních médiích.

Sdílet

Autor aktuality

Jan Sedlák

Témata:

Anketa

Dali byste si do počítače čínský SSD disk, případně čínské RAM?

Přechod k fyzické eliminaci hackerů, ruská kyberpevnost a dezinformační klony

Babiš chce Klempířův zákon doladit v pracovní skupině, na zrušení poplatků vláda trvá

Letošek bude zlomový, umělá inteligence otočí vývoj softwaru kompletně naruby

E-shopy jsou pod náporem AI botů. Obchody i proto aktivně řeší, jak proniknout do vašich konverzací

V Česku startuje nový ambiciózní cloud. Jde proti americkým šmírovacím zákonům a drahému VMwaru

Patří StarDance do vysílání České televize? Tady jsou fakta k populárnímu pořadu

Česko má kvantovou síť, kvantová komunikace mezi Zemí a vesmírnou stanicí, další kvantový satelit

Francie přejde z Windows na Linux, Ukrajinci z ČR spustili konkurenci Nvidie, český trh drtí ceny serverů

Konec plošného skenování konverzací? Budeme pokračovat, hlásí i přes zrušení výjimky Google, Meta, Microsoft a Snap

„Nebude co vysílat.“ Jaké dopady by měly rychlé rozpočtové škrty v televizi a rozhlase?

Takto vypadá nová generace AI grafik Nvidia. Nepůjde chladit vzduchem, vyčerpá ještě více pamětí a opět zdraží

Sdílet

Autor aktuality

Jan Sedlák

Témata:

Anketa

Dali byste si do počítače čínský SSD disk, případně čínské RAM?

Nejnovější články

Přechod k fyzické eliminaci hackerů, ruská kyberpevnost a dezinformační klony

Babiš chce Klempířův zákon doladit v pracovní skupině, na zrušení poplatků vláda trvá

Letošek bude zlomový, umělá inteligence otočí vývoj softwaru kompletně naruby

E-shopy jsou pod náporem AI botů. Obchody i proto aktivně řeší, jak proniknout do vašich konverzací

V Česku startuje nový ambiciózní cloud. Jde proti americkým šmírovacím zákonům a drahému VMwaru

Patří StarDance do vysílání České televize? Tady jsou fakta k populárnímu pořadu

Česko má kvantovou síť, kvantová komunikace mezi Zemí a vesmírnou stanicí, další kvantový satelit

Francie přejde z Windows na Linux, Ukrajinci z ČR spustili konkurenci Nvidie, český trh drtí ceny serverů

Konec plošného skenování konverzací? Budeme pokračovat, hlásí i přes zrušení výjimky Google, Meta, Microsoft a Snap

„Nebude co vysílat.“ Jaké dopady by měly rychlé rozpočtové škrty v televizi a rozhlase?

Dále u nás najdete

CorelDRAW Graphics Suite 2026: design s Artist Intelligence

Při přípravě newsletteru můžete nativně konzultovat s AI

Češi zbožňují digitální platby, v obchodech je využívá 85 % lidí

Evropa bez amerických plateb: Digitální euro hledá cestu

CreditShare míří na drobné investory, úvěry vybírá přísně

Jak dostat z bytu problémové nájemníky snadno a rychle

Provoz EET 2.0 má stát až 600 milionů korun ročně

Pracujícím důchodcům se zas bude zvyšovat penze

Jaká velikost nádoru slinivky dává šanci na přežití?

Na co se zaměřit, abyste měli na penzi našetřeno co nejvíc

Konec plošného skenování konverzací?

Soud: Mironet má nárok na ušlý zisk po zpackané razii

Perličky z diskuze účetních k JMHZ

U EET musíte nahlásit provozovny, kde přijímáte neevidované tržby

Květnové svátky a nákupy: kdy bude otevřeno?

Sedm trendů, které změní podobu datových center

Google bude tvrdě postupovat proti zneužívání tlačítka Zpět

Prodal byt, aby mohl pražit. Dnes má Michal jednu z nejlepších káv v Evropě

Otestovali jsme za vás novou vlakovou linku z Prahy do Varšavy

Unikla data z Lacoste, Ralph Lauren a Canada Goose