„Zároveň do budoucna chceme využívat architekturu a instrukční sadu vlastní. Nové generace Kunpengu chceme vydávat zhruba každý rok,“ uvádí zástupci čínského kolosu. Huawei se například aktivně zajímá o otevřenou architekturu RISC-V , kterou i další firmy vidí jako možnou alternativu k ARMu. Huawei chce i tak v nadcházejících pěti letech do rozvoje serverových ARM čipů investovat 436 milionů dolarů.

Jednou z těchto vlaštovek je procesor Kunpeng 920 , který navazuje na pokusy z předchozích let a tentokrát má mnohem vyšší ambice. Huawei si pro účely nového Kunpengu licencuje architekturu ARMv8 a hlásí se k současné i budoucí kompatibilitě.

„V dalších deseti letech chceme do této oblasti investovat. Přichází zlatá éra pro nové architektury a výpočetní operace budou diverzifikovány. Vedle x86 zde budou ARM, GPU, NPU a další,“ věří jeden z šéfů Huawei Ken Hu.

Nástup výpočetních operací spojených se strojovým učením a prvky umělé inteligence zároveň začal do prostředí čipů přinášet větší mix architektur (operace na grafických kartách a podobně). Huawei proto věří, že je ideální čas se do změn na tomto trhu zapojit.

Huawei do svých serverů a dalších zařízení běžně instaluje technologie od Intelu, Nvidie a dalších partnerů. Postupně ale přichází s vlastními alternativami, které vycházejí z dlouhodobého vývoje. Firma už v roce 2004 založila samostatnou společnost HiSilicon , která se stará o vývoj a navrhování čipů a procesorů. Nalézt je lze například v telekomunikačních zařízeních a nejvíce známá je rodina system-on-chip z chytrých telefonů označovaná jako Kirin.

Kunpeng Server Board je určený pro dva procesory Kunpeng 920, má management čip Hi1710, podporu GE/10GE/25GE, 32 slotů pro RAM paměti DDR4–2933 či podporu pro PCI-Express 4.0 a NVMe SSD disky. Kunpeng Desktop Board pak zvládne provozovat jeden procesor Kunpeng 920, maximálně 64 GB DDR4–2400 RAM (čtyři sloty) a má i podporu M.2 SSD nebo PCI-Express 3.0.

Základní desky od Huawei:

Huawei v případě Kunpengu spolupracuje také s partnery. Jedním z nich je třeba Tsinghua Tongfang, který se mimo jiné soustředí na výrobu počítačů. „Základní deska pro Kunpeng je stabilní. Huawei nám vedle hardwaru poskytuje také BIOS, nástroje, kompilátor nebo inženýrské kapacity. Počítače s Kunpengem zvládnou plynulé přehrávání 4K videí a další operace,“ prozrazuje alespoň něco o ARMu v počítačích provozní ředitel Tongfangu Li Jianhang.

Další nasazení Kunpengu je v datacentrech. Prvním cloudem postaveným na Kunpengu (vedle nabídky v Huawei Cloudu) je Beijing e-government Cloud, který provozuje pekingská vláda. Jde o rozsáhlou instalaci, kde jen takzvané Safe City (monitoring a řízení dopravy a podobně) běží na více než dvou tisících serverech. Čína chce tento cloud využívat také v rámci služeb pro zimní olympijské hry, které se v Pekingu odehrají v roce 2022.

Procesor pro umělou inteligenci

Druhou procesorovou novinkou je Ascend 910, který už byl oznámen před rokem a nyní finálně míří na trh. Jde o výpočetní jednotku určenou pro strojové učení a AI. Jeden takový Ascend zvládá 256 TLOPS (FP16) a 512 TeraOPS (INT8) při spotřebě 310 wattů. Použitý je 7nm výrobní proces. S Ascendy 910 se jde na jeden server dostat na 2 PFLOPS. Huawei zde míří přímo proti Nvidii.

Architektura Ascendu:

Ascend využívá architekturu Da Vinci, za kterou stojí rovněž Huawei a kterou lze využít jak ve „velkých“ serverových procesorech Ascend 910, mobilních zařízeních (AI koprocesor), tak i menších Ascend 310 používaných v edge computingu (IoT zařízení, kamery, akcelerační karty a podobně). Ascend 910 kombinuje 32 jader Da Vinci s HBM2 pamětí (čtyři jednotky), logickými bloky typu dekódování videa či čipem Nimbus V3 pro I/O. Podporováno je i CCIX.

Ukázkovým referenčním nasazením procesorů Ascend 910 a architektury Da Vinci je cluster nazvaný Atlas 900. Huawei ho označuje za „nejrychlejší cluster na trénování AI na světě“. Konkrétně obsahuje 1024 Ascendů 910, v rámci ResNet-50 zvládl výpočty za 59,8 sekundy a dosahuje na 256–1024 PFLOPS (FP16).

Čínský podnik prozatím neoznámil dostupnost ani ceny na jednotlivých trzích, začíná ho ovšem nabízet v rámci Huawei Cloudu. Atlas 900 se zároveň má stát součástí mezinárodního projektu Square Kilometre Array (SKA), který na území Austrálie a Jihoafrické republiky buduje rozsáhlou síť vysílačů pro monitorování vesmíru.

Cloudový čínský mozek

Nákladný projekt, kde se Čína angažuje se zeměmi jako Kanada, Švédsko, Francie, Itálie, Velká Británie či Japonsko (nikoliv USA), má v budoucnu dosahovat na datové toky až 8 Tb/s. Atlas má sloužit pro zpracování přenášených údajů. Pomocí strojového učení má například analyzovat až stovky tisíc hvězd a vesmírných těles. Centrální datacentrum poběží v Šanghaji a menší „pobočky“ pak budou v několika dalších členských státech SKA.



Autor: Jan Sedlák Plán vývoje procesorů od Huawei

Další důležitou roli bude Atlas 900 hrát v rámci již dříve vyhlášených ambicí Číny stát se mocností v umělé inteligenci. Výzkumné a akademické organizace skrze celou asijskou zemi v současné době pracují na projektu Peng Cheng CloudBrain. Jeho první fáze (CloudBrain 1) operuje s AI clusterem o 100 PFLOPS, cílem je ovšem v rámci CloudBrain 2 vybudovat AI cluster v kategorii exascale, tedy jeden exaFLOPS a více.

CloudBrain má hlavní sídlo v Shenzhenu (Šen-čen), kde je doma i Huawei. Další střediska jsou pak v dalších čínských metropolích – jde například o superpočítačové centrum v městě Tianjin.

„Nad touto clusterovou sestavou vybudujeme otevřenou platformu, díky které budou moci k výpočetní síle přistupovat vědci, studenti a další odborníci,“ vysvětlují technici. Konkrétně jde o prozatím mladý open source projekt OpenI. Ten běží na Kubernetes a dalších dnešních standardech a nabídne vývojářské nástroje, API nebo potřebné frameworky. Cílem je, aby na rozsáhlém AI clusteru bylo možné vyvíjet a spouštět další aplikace a výpočty.

Peníze a open source pro vývojáře

Aby Huawei rozvoj ekosystému kolem svého hardwaru podpořilo, začíná rozšiřovat vývojářský program spuštěný v roce 2015. Do něj se mu v průběhu let podařilo dostat 1,3 milionu vývojářů (značná část je z Číny a Asie), ovšem ambicí je nyní vyrůst na pět milionů skrze celou planetu. Investovat se má 1,5 miliardy dolarů, přičemž miliarda dolarů už byla do rozvoje vložena v předchozích letech.

K rozvoji ekosystému má sloužit i postupné vydávání open source nástrojů. Huawei v následujících měsících uvolní serverový operační systém openEuler vycházející z jeho EulerOS (postavený na CentOS). Vlastní distribuci openEuleru chystá například firma Deepin vyvíjející stejnojmennou linuxovou distribuci. DeepinEuler bude připravený na chod na Kunpeng serverech a nabídne i placenou podporu.

V červnu příštího roku pak dorazí OLTP databáze openGauss, která vychází z GaussDB. Pro čipy Ascend pak byl uvolněn AI framework MindSpore, který může být použit jako alternativa TensorFlow. MindSpore lze vedle Ascendů použít také na další GPU i CPU.

Huawei bude svůj zásah v procesorech a čipech nadále rozšiřovat. Kunpeng míní využívat jako serverové procesory běžící na ARMu, Ascend pro umělou inteligenci na různých úrovních, v roce 2018 představený Hunghu pro „chytré obrazovky“ (televize a spol., které jako první nasadí mobilní operační systém HarmonyOS) a Kirin pak pro chytré telefony. Zde byl nedávno představen 7nm Kirin 990 čítající čtyři jádra Cortex-A76 (2,86 a 2,09 GHz), čtyři jádra Cortex-A55 (1,86 GHz) a GPU Mali-G76 MP16.

Firma dále vyvíjí vlastní 5G modemy Balong, SSD kontrolery, NIC a BMC. Huawei v roce 2018 za čipy utratilo 21,1 miliardy dolarů, což je meziroční nárůst o 45 procent. Celosvětově se tak dostalo na třetí místo za Samsung a Apple a předehnalo Dell a Lenovo.

Čínské procesory x86 Čína pracuje také na vlastních x86 procesorech a řadí se tak vedle Intel a AMD. V roce 2013 byl vytvořený podnik Zhaoxin, který je joint-venture mezi firmou VIA (x86 získala i díky odkupu Cyrixu) a šanghajskou vládou. Zhaoxin doposud dodával 28nm procesory KX-5000, nyní ovšem na trhu přichází s 16nm modely KX-6000. Ty také nejsou nic zásadně oslnivého, octa-core se zhruba vyrovná Core i5–7400 quad-core ze začátku roku 2017. Objevují se nicméně informace o tom, že nová generace KX-7000 už poběží na 7nm procesu, zaznamenává dobré růsty v IPC a má se zhruba vyrovnat architektuře AMD Zen 2. Dostupnost a ambice mimo Čínu a Asii jsou zatím nejasné.

Cestu autora organizovala společnost Huawei.