Martin Děcký dříve jako vědecký pracovník působil na Matfyzu a je jedním z autorů operačního systému HelenOS. Před několika lety dostal nabídku z výzkumného centra čínské společnosti Huawei v Mnichově, kam později nastoupil. Začal se tam věnovat výpočtům na SSD kontrolerech. Poté se přesunul do Drážďan, kde spoluzaložil nový výzkum Huawei zaměřený na operační systémy. Podílí se na tvorbě HongMeng OS, potenciální náhradě Androidu.

Děcký v rozhovoru pro Lupu vyjasňuje, jak to s HongMeng OS a propojením s HarmonyOS je. Popisuje také, jaké je to pracovat pro čínskou společnost, která na západě v poslední době upadla v nemilost. Popsal rovněž aktuální stav kolem HelenOS.

Jak jste se ocitl ve výzkumu Huawei v Německu?

Působil jsem na Matematicko-fyzikální fakultě Univerzity Karlovy, kde jsem na Katedře distribuovaných a spolehlivých systémů dělal doktorát a následně pracoval jako vědecký pracovník. V roce 2017 mě oslovili lidé z mnichovské výzkumné pobočky Huawei, které jsem znal z doslechu na základě jejich práce v akademické sféře. Huawei má zhruba 190 tisíc zaměstnanců po celém světě a 95 tisíc z nich se dá zařadit do R&D.

Což je v rámci IT firem velký podíl.

Ano, je to značné procento. V Evropě máme zhruba dvacet R&D poboček a ta mnichovská je největší. Má šestnáct laboratoří zaměřených na různá témata – antény, hardware, kyberbezpečnost nebo vývoj moderního hardwaru a systémový software. Dostal jsem nabídku podílet se na projektu heterogenního hardwaru, případně disagregovaného hardwaru. Konkrétně šlo o výzkum zpracování dat in-storage. To znamená přenos výpočtů na SSD kontrolery.

Nabídku jsem přijal mimo jiné z důvodu, jak R&D pobočky Huawei fungují. Jsou na půl cesty mezi vývojem firemním a produktovým a základním výzkumem v akademické sféře. Snažíme se vidět dál do budoucnosti než k vydání dalšího produktu, ale zároveň se snažíme být schopní rozlišit, co dává ekonomický smysl a co ne. Nejsou to projekty na dvacet let, u kterých se nedá říct, jestli někam budou směřovat. To má řadu praktických výhod. Dostanete se do kontaktu s chytrými inženýry, kteří vidí praktické aspekty a ví, co by šlo a nešlo udělat. A zároveň máte možnost věci posunout.

Čína a Huawei nyní mnohdy mají v Česku špatné jméno. Jak jste na nabídku od této společnosti reagoval?

Pohled na Huawei a čínské firmy obecně byl před čtyřmi lety jiný, než jaký je nyní. Lidé byli vnitřně různě naladěni, ale byla to jejich interní volba. V té době ještě neexistovala implicitní ostražitost. Když jsem nabídku dostal, čínský původ jsem řešil. Nikdy jsem se netajil tím, že se mi nelíbí, jak čínský politický systém funguje. Bylo to mé osobní dilema. Řekl jsem si, že bych neměl soudit, než věci uvidím na vlastní oči, a že bych neměl soudit na základě nepřímých informací. Naznal jsem, že to zkusím a že když se nejhorší scénáře naplní, odejdu a budu mít hmatatelné informace.

Kdybych byl do podobné situace postavený dnes, jsem téměř přesvědčen, že bych se rozhodl jinak a do Huawei nenastoupil. Jazýček na vahách by se vychýlil.

To by bylo dáno veřejným míněním?

Asi ano. V roce 2017 byste možná dohledal staré kauzy Huawei z devadesátých let, což byla hluboká historie, navíc často nedořešená. Kdežto nyní jsou obvinění aktuální. Ovšem ani jako zaměstnanec firmy Huawei nedokážu říci, zda jsou nařčení pravdivá, nebo nikoliv. Nemám přístup do produkčních systémů a nemohu si hrát na soukromého detektiva.

Na dnešní rozhodování by měly vliv i další aspekty. Nějakou dobu to například v souvislosti s obchodní válkou vypadalo, že člověk, který někdy pracoval pro Huawei, by měl v budoucnu složitou kariéru v amerických firmách. Nevím, do jaké míry to tak skutečně je, či není, ale je to na hraně diskriminace, která by neměla nikde existovat.

Slýcháte od kolegů akademiků, výzkumníků a známých narážky typu, že jste se zaprodal, že čínské peníze nesmrdí a podobně?

V takto vyhrocené podobě jsem to nikdy neslyšel. Jen jednou na Twitteru jistou osobu překvapilo, že zrovna já pracuji pro Huawei, a byly z toho cítit takové ty morální výčitky. Ale bylo to spíš v rovině podivení se, ne odsouzení. Vysvětlil jsem mu, že dělám v R&D a nedělám nic, co by bylo morálně špatné. Kdyby mě někdo do něčeho takového byť jen náznakem tlačil, dal bych výpověď. Člověk nikdy nemůže dát ruku do ohně za všechny lidi, kteří v dané firmě či organizaci pracují. Důležité je, aby sám měl čistý morální kredit.



Autor: Jan Sedlák Martin Děcký

Neunavuje vás, že se vás na podobné věci každý ptá a musíte se obhajovat?

Lidi to oprávněně zajímá a zajímá je můj názor. Ale spíše je to v rovině, že si chtějí popovídat a slyšet pohled insidera. Ten jim rád dám s tím, že svět není černobílý a ani já jako člověk zevnitř firmy jim nemohu poskytnout žádné důkazy pro a proti a sám téma černobíle nevidím. Nijak mě to neotravuje, je to součást běžné debaty. Kolegů z amerických firem se ptám na podobné věci – jaké to tam je, jaká je atmosféra a tak dále.

Narazil jste ve vaší práci kvůli složité situaci, ve které Huawei vlivem amerických sankcí je, na nějaké škrty a omezení?

Na praktická omezení jsme narazili. Chtěli jsme například pokračovat ve spolupráci s jedním univerzitním týmem a z jejich strany to nebylo možné, protože jsme na listině. Daná univerzita ovšem nesídlí v USA, takže není ze zákona nucena řídit se americkými sankcemi, bylo to jejich interní rozhodnutí. V případě řady jiných evropských univerzit žádný problém se spoluprací nemáme.

Obecně nám v R&D sankce znepříjemňují práci, ale není to tak, že bychom ji nemohli vykonávat, museli propouštět nebo neměli peníze. Tak daleko do nedošlo. Produktové části firmy ovšem sankce postihují skutečně velmi citelně.

Takže jste všechno zvážil a nejdříve nastoupil do R&D pobočky v Mnichově. Tam jste začal dělat na projektu kolem in-storage zpracování dat? A co to in-storage je? Není to tak známý pojem jako in-memory.

Větev in-memory kolegové zkoumali také, ale myslím, že to nemělo žádné větší výsledky. Bylo třeba intenzivně spolupracovat s výrobci DRAM pamětí a firma je v té době nevyráběla a žádný přímý kontakt neměla.

My jsme se zabývali tím, jak efektivně přesouvat výpočty na SSD kontrolery. SSD kontroler je v podstatě takový malý počítač, kde jsou flash paměti, RAM paměť na cache a pracovní stav, a také běžný vícejádrový, i když pomalejší procesor ARM. Ten se stará o takzvaný garbage collection a wear leveling nad flash paměťmi, aby měly delší životnost. Naší prací bylo takový kontroler vzít a rozšířit jeho firmware tak, aby kromě provádění běžných operací čtení a zápisu bylo zároveň možné nad daty provádět výpočty. Záměrně jsme se snažili udělat rozšíření NVMe protokolu a nesnažili jsme se vymýšlet vlastní rozhraní. Ale snažili jsme se navrhnout vlastní výpočetní model tohoto offload mechanismu. Chtěli jsme celý systém mít bezpečný, aby operační systém, který k SSD datům přistupuje, mohl mít více uživatelů a tenantů a nikdo nemohl číst a zapisovat cizí data.

V principu je možné na kontroleru nechat běžet libovolný výpočet, ale to moc nedává smysl. Procesor na kontroleru není tak výkonný jako procesor centrální. Celý náš výpočetní model a mechanismu offloadu výpočtů jsme se tedy snažili řešit tak, aby šlo o stream processing. Což připomíná to, co se dělá u síťových karet.

Nebo edge computingu.

Nebo tak. Cílem je, aby se poměrně jednoduchým algoritmem dalo eliminovat hodně datového přenosu mezi SSD kontrolerem a centrálním procesorem. To je situace, která je nejvýhodnější – zmenší se latence komunikace, protože se přenáší méně dat, a výkonný centrální procesor nemusí zbytečně spoustu dat zahodit za poměrně vysokou cenu energie a tak dále.

A to se tedy povedlo?

Měli jsme dva prototypy. Jeden na open source platformě OpenSSD. Tam pro nás práce byla celkem jednoduchá, protože jsme měli přístup k výchozímu firmwaru OpenSSD kontroleru, který jsme modifikovali. Výsledek byl publikovaný na konferenci ACM/IFIP Middleware 2020.

Druhým prototypem byla interní vývojová deska pro kontrolery, které vyrábí naše firma. Zde práce nadále pokračuje, ale už se na projektu nepodílím. Jde o interní věc, takže publikace venku není a do detailů tolik jít nemohu.

Aplikace tohoto výzkumu je zaměřená na servery, nebo také počítače a další hardware?

Nikdy to nebylo omezené. Naše rozhraní a vysokoúrovňové knihovny v uživatelském prostoru, které by aplikacím toto všechno umožnily použít, by se jistě daly využít v databázových serverech, ale i u desktopů, protože řada desktopových aplikací typu internetový prohlížeč pracují s nějakou interní databází. V Číně se používá WeChat, což je nástroj na vše plus komunikátor. Tencent dlouho řešil, že uživatelé, kteří WeChat intenzivně používají, mají dlouhé načítání. Lokálních dat, které má klient v sobě, je hodně. I zde by se offloading dal aplikovat v rámci iniciálního načtení dat. Kolegové na tom dál pracují, mimo jiné v případě cloudového offloadingu v rámci více strojů.

To je to pomezí, o kterém jste mluvil, a sice balanc mezi základním výzkumem a využitím inovace v praxi?

Ano. A zároveň jsme měli snahu vše udělat poctivě z hardwarového a softwarového pohledu. Neměl to být jen jednoúčelový prototyp, na jehož základě se napíše jedna studie a tím to skončí. Napsali jsme monitoring, různé nástroje pro správu a podobně.

Inovace tohoto typu tedy vyvrací západní stereotypy o tom, že čínské firmy vše jen kopírují.

Nejsem si jistý, zda u Huawei někdy tyto stereotypy platily. Produkty Huawei byly vždy postaveny na vlastních technologiích. Nevím, do jaké míry se firma na začátku svého působení inspirovala u Ericssonu či Nokie, ale Huawei rozhodně kopíruje pouze ve stejné míře jako Apple kopíruje od Samsungu, Samsung od Applu a tak dále. Jde o inspiraci a vyzobávání rozinek a žádné tupé překlápění.

Mimo to je sice jádro firmy v Číně, ale poboček po celém světě je hodně. Troufám si tedy tvrdit, že Huawei ani žádná jiná významná technologická čínská firma v dnešní době nedělá hloupé kopírování. Zároveň však všichni stojíme na ramenou gigantů před námi, o tom jistě není pochyb.

Projektem in-storage vaše působení v Mnichově skončilo a vydal jste se do Drážďan?

Zhruba v době, kdy jsem do firmy nastoupil, se v čínské centrále začal vyvíjet mikrojádrový operační systém HongMeng OS. V Mnichově jsem začal pracovat na bezpečnostní certifikaci tohoto systému. Někteří mí kolegové začali pracovat na hypervisoru. V druhé polovině roku 2018 přišla firma s rozhodnutím, že by bylo dobré vytvořit novou pobočku v Drážďanech, která by se na mikrojádrové operační systémy a věci s tím související zaměřila. Naprosto přirozeně jsem se dostal k tomu, že bych měl být po mém čínském šéfovi druhý zaměstnanec této pobočky. Následoval rok víceméně netechnické práce, kdy jsem řídil najímání lidí a přesouval se z Mnichova do Drážďan.

Proč jste otevřeli pobočku zrovna v Drážďanech? Kvůli technické univerzitě?

Univerzita nebyla jedinou motivací, ale byla to motivace velká. Oblast výzkumu mikrojader má na TU Dresden velkou tradici. V současné době se tam ale situace nevyvíjí zcela ideálně. Jeden z hlavních profesorů odešel do důchodu a permanentní náhrada za něj není. Mikrojádra se tam stále budou dělat, ale asi už to nebude mít takový zvuk a prioritu. V Drážďanech je ovšem kolem mikrojader velká a velmi živá komunita a řada firem, takže rozhodnutí Huawei zařadit se po jejich bok je velmi přirozené. Je zde nový Barkhausen Institut, který do značné míry přebírá vědeckou roli univerzity.

V Drážďanech mají továrny na čipy Globalfoundries nebo Bosch, souvisí to s tím také?

Přímá návaznost na mikrojádra zde není. Ale v Drážďanech byl už za komunistického režimu udržovaný vývoj technologií pro výrobu křemíkových čipů. Podobně jako v Rožnově pod Radhoštěm jsou nadále čipové firmy, přestože tam už není přímá návaznost na bývalou Teslu. Mozky se vždy koncentrují do uzlů.

Zpět k HongMeng OS, který bude chtít trochu vysvětlení. Huawei nedávno představilo HarmonyOS 2.0, tedy vlastní alternativu k Androidu. Sama firma HarmonyOS v Číně označuje jako HongMeng OS. Podle všeho jde o dvě různé věci.

Operační systém, který je založený na vlastním mikrojádře a vlastním user space, je vyvíjený zhruba od roku 2017, a to pod názvem HongMeng OS. Má za sebou několik interních iterací, pracuje se na třetím přepisu. Myšlenka byla vždy jasná – je to mikrojádro, nemá nic společného s Linuxem a s code base žádného jiného systému.

Kolem roku 2018 se řešilo, jak systém pojmenovat pro západní trhy, a přišlo se s HarmonyOS. Poté firma veřejně oznámila, že cílem je, aby HongMeng OS/HarmonyOS nahradil Android v našich smartphonech a zároveň byl používaný v našich switcích, routerech, BTS a tak dále. Vývoj systému není triviální a objevily se už probírané geopolitické problémy. Z nějakého důvodu se firma rozhodla věc komunikovat tak, že pod názvem HarmonyOS vydala systém, který s původním HongMeng OS nijak nesouvisí.

HarmonyOS 1.0 je systém postavený na našem real time jádře LiteOS. A HarmonyOS 2.0 je v podstatě Linux plus open source části Androidu a naše interní doplňky. Opět to není HongMeng OS. Podstatné je, že se mikrojádrový systém stále vyvíjí a je plán, že to bude ultimátní náhrada Androidu.

Takže to teď vypadá na nějaké překlenovací období.

Přesně tak, jen komunikace je poněkud zmatená.

A vy v Drážďanech děláte na HongMeng OS?

Systematicky do HongMeng OS přispívá náš virtualizační tým, který zůstal v Mnichově, ale spadá pod naši drážďanskou pobočku. Já osobně na HongMeng OS aktivně dělal asi rok (když nepočítám drobné příspěvky předtím v Mnichově), až stovky inženýrů na něm pracují v Číně. Mám svůj R&D projekt zabývající se flexibilní architekturou operačního systému.

Mikrojádrový multiserverový operační systém je složený z malých izolovaných komponent, každá běží v odděleném adresovém prostoru a tak dále. To je architektura vhodná pro formální verifikaci, certifikaci či běh v safety a mission critical situacích. Ruku v ruce s tím jde režie spojená s komunikací izolovaných komponent. Jsou scénáře, jako třeba chytrý telefon, kde nevadí, že jsou komponenty o něco více monolitické. Flexibilní architektura znamená mít mechanismus, který dovede komponentový systém a jeho architekturu modifikovat tak, aby bylo možné během deploymentu spojovat komponenty v uživatelském prostoru a přesouvat je odsud do jádra a podobně.

Společně s kolegy jsem zhruba rok pracoval na prototypu této flexibilní architektury postaveném přímo na hlavní vývojové větvi HongMeng OS. Bohužel překotný vývoj systému v Číně nám neumožňoval plně rozvinout potenciál naší myšlenky. Proto nyní pracujeme na odděleném interním prototypu, do kterého jsme zakomponovali další inovace. Jakmile budeme s výsledkem spokojeni, máme v plánu naši implementaci opět „překlopit“ do HongMeng OS.



Autor: Jan Sedlák Martin Děcký

Dalo by se to trochu připodobnit procesorové architektuře big.LITTLE?

Je tam jistá podobnost, ale lepší analogií bude softwarově definovaná síť. Tam existují základní mechanismy a čistě softwarovou změnou mohu síť kompletně přestavět.

Jinak u našeho systému není cíl měnit architekturu za běhu, ale v průběhu nasazení. Podle cílového použití se rozhodnu, zda nasadím maximální izolovanost jednotlivých komponent, nebo zda potřebuji šetřit výkonem a komponenty spojím. Během nasazení se odstraní nadbytečné kusy kódu. Cíl je, aby bylo možné v tom úplně extrémním případě ze systému udělat unikernel, kde vše běží v kernelovém prostoru, veškerá meziprocesová komunikace je převedena na volání funkcí, neexistuje interní izolace ničeho a není tam žádná režie.

Tento přístup tedy odpovídá tomu, co Huawei říká – že chce mít jeden systém pro všechny možné druhy zařízení.

Je to tak. Měli bychom mít jednu code base jednoho operačního systému a bude se lišit pouze to, jak bude systém nakonfigurován pro nasazení. Zároveň půjde o general purpose operační systém, který nebude limitován hardwarem a procesorovou architekturou. Primárně cílíme na ARM, ale nic nebrání převodu na RISC-V nebo x86. Do konkrétních plánů kolem čipů nevidím, protože detailně nevím, co naše odnož HiSilicon plánuje. Možná to bude přechod na RISC-V. Ze softwarového hlediska by to nemělo ničemu vadit.

Jak jste ve vývoji daleko?

Máme prototypy. To, na čem v Drážďanech pracujeme, je asi nejpokročilejší prototyp. Raná varianta mikrojádrového systému HongMeng OS běží jako Trusted Execution Environment v chytrých telefonech P20 Pro a novějších, tedy v podobné roli jako varianta mikrojádra seL4 v telefonech od Applu. Od této rané varianty vývoj výrazně pokročil, ale aktuální vývojová větev zatím není v produkci.

Zmínil jste RISC-V. V souvislosti s Huawei a Čínou se o této otevřené alternativě k ARMu hodně mluví, a to i kvůli sankcím Spojených států. V Brně ostatně máme slibnou firmu Codasip. Vy už máte vývojový RISC-V počítač. Jak tuto architekturu vnímáte?

Otevřeným technologiím hodně fandím. Nejsou tam nastaveny umělé a právní bariéry. Z tohoto pohledu se mi RISC-V líbí a byl jsem na několika RISC-V Summitech, abych mohl sledovat vývoj komunity a ekosystému kolem RISC-V z bezprostřední blízkosti.

Jde o rozumný evoluční vývoj RISCových instrukčních sad. Hodně je tam vidět inspirace klasickým MIPSem s tím, že si mohli dovolit odstranit některé omezující výchozí předpoklady, které pro RISCovou instrukční sadu byly nutné v osmdesátých letech například z důvodu omezeného počtu tranzistorů na čipu. Mohou si dovolit procházet stránkovací tabulky v hardwaru, a ne v softwaru a tak dále. RISC-V je postavený na zelené louce a není v něm 40 let nánosu jako u x86 a ARMu. O ARMu se dlouho tvrdilo, že je to oproti x86 čistě navržená architektura, což už samozřejmě v dnešní době neplatí a je to stejný moloch. Nevidím zásadní překážku, proč by RISC-V technicky nemohl být stejně úspěšný jako ARM.

Druhým aspektem je to, kdo a jak je schopný navrhnout fyzický procesor, aby fungoval rychle a efektivně. Na světě jsou maximálně stovky lidí, kteří tohle umí. A pak je zde otázka výroby. Je třeba řada netriviálních kroků, které trvají dlouho. Musí existovat reálné křemíky za rozumnou cenu, které budou schopny soupeřit s ostatními. Vypadá to nadějně a během pár let se něco takového může stát. Může se stát, že tady vedle ARMu a x86 bude silný třetí hráč. Nebo bude osud RISC-V podobný jako v případě PowerPC a SPARC, tedy že se čipy založené na RISC-V sice budou vyrábět, ale zůstanou spíše okrajovou záležitostí.

Otevřenost RISC-V pomáhá i v tom smyslu, že umožňuje doplňovat instrukční sadu o specifická rozšíření, a přitom stále zachovávat kompatibilitu se společnými nástroji, jako jsou překladače. Firmy typu Huawei vidí možnost vyrábět vlastní procesory, které budou univerzálně použitelné, ale zároveň velmi cíleně uzpůsobené pro konkrétní nasazení.

V Číně jsem v Huawei viděl operační systémy EulerOS a openEuler vycházející z CentOS. Přišel jste s nimi do styku?

EulerOS je naše interní distribuce Linuxu. Je to jeden z operačních systémů naší firmy. Už ani nemám přehled, kolik takových projektů máme. Používáme další interní linuxové kvazidistribuce, máme již zmiňovaný LiteOS, popisovaný HongMeng OS, dále tři nebo čtyři hypervisory. Už nějakou dobu běží snaha alespoň sjednotit interní forky linuxového jádra do projektu HULK, tedy Huawei Unified Linux Kernel, abychom měli jednotnou linuxovou code base.

Kolik lidí v Huawei na operačních systémech dělá?

Bude to někde v rozsahu tisíc až deset tisíc lidí, podle toho, koho všeho do té kategorie zahrneme. Huawei ve spoustě oblastí poskytuje end-to-end řešení, kdy sami vyrábíme vše od hardwaru po uživatelské rozhraní a vše mezi tím. Jsme velká firma, týmů máme hodně a neexistuje síla, která by vše koordinovala. Ani by to nedávalo smysl.

Patříte mezi autory operačního systému HelenOS, který vznikl na Matfyzu. Je kolem něho nějaký vývoj?

HelenOS je nyní ve fázi, kdy neprobíhá překotný vývoj, ale stále je to živý a udržovaný projekt. Nedávno jsme měli release, protože se nashromáždily nějaké zajímavé změny. Tempo aktualizace je ale výrazně pomalejší než dříve. V nejvíce aktivních dobách jsme měli několik commitů za den. Kolem roku 2015 to byly jeden dva commity za týden, to teď děláme měsíčně. V současné době bohužel na HelenOS nikdo nepracuje jako na součásti své placené práce. Pro všechny klíčové přispěvatele je to v režimu volnočasové aktivity. Několikrát jsem sice HelenOS využil i v Huawei pro prototypování, takže jsem do něj přispíval v rámci svých pracovních povinností, ale je to skutečně zlomek času ve srovnání s dřívějškem.

Systém zatím nemůže sloužit jako náhrada Windows nebo GNU/Linuxu, ale má všechny hlavní části jako souborový systém, grafické rozhraní, síťový a zvukový stack, GNU aplikace a další. Teď systém vylepšujeme a nutně se musíme zaměřovat na nevděčné věci jako implementace ovladačů pro obrovské množství periferních zařízení, zlepšování uživatelské přívětivosti a podobně. To už člověku nedává ten dopamin, jako když šlo o to navrhnout a implementovat nějaký velký dosud chybějící subsystém. Nadále podporujeme devět hardwarových architektur, což je na mikrojádrový systém stále světový rekord. Nyní by to chtělo nějaký velký plán, jak HelenOS posunout ze stavu velmi pokročilého prototypu do fáze praktické použitelnosti pro většinu lidí.

Byl pro vás HelenOS formující projekt, díky kterému se vám ozvali i z Huawei?

Jednoznačně. Pro mě i většinu kolegů to byl projekt, který nás formoval znalostně a z hlediska obecného nasměrování našich kariér. Je klíčovou součástí mého odborného života. I proto mne mrzí, že je HelenOS aktuálně ve zpomalené fázi a mnohem více času a energie věnuji jiným mikrojádrovým systémům. Nejsmutnější je, že jsem pořád nedotáhl port na RISC-V. Kernel běží, user space zatím ne. Už tři roky slibuji, že to dotáhnu, tak snad teď se SiFive HiFive Unmatched, což je vlastně RISC-V PC, budu mít více motivace. Možností, co s tímto systémem dělat, je hodně. Asi by z toho šel po vzoru jiných firem z Drážďan udělat úspěšný startup. To je sen, který občas osvěžíme, ale zatím jsme se k tomu nedokopali.