Hlavní navigace

Vít Vondrák (IT4Innovations): Evropa v superpočítačích ztrácí. Česko chceme dostat na špičku

Jan Sedlák

Ředitel národního superpočítačového centra IT4Innovations mluví o snaze EU vybudovat síť superpočítačů a proč v tomto ohledu Evropa zaostává za USA a Čínou.

Doba čtení: 17 minut

Evropská unie letos rozjela projekt EuroHPC, jehož cílem je na starém kontinentu vybudovat síť superpočítačů (HPC). Jednou z hlavních motivací je to, že EU v tomto ohledu zaostává oproti Spojeným státům a rostoucí Číně.

Koncem ledna se k EuroHPC, v rámci kterého se bude pracovat s rozpočtem kolem jedné miliardy eur, jako jedna z prvních zemí připojila také Česká republika. Na zdejší úrovni aktivity řeší národní superpočítačové centrum IT4Innovations v Ostravě, které už provozuje superpočítače Salomon (139. nejvýkonnější na světě) a Anselm.

Ředitel IT4Innovations Vít Vondrák v rozhovoru pro Lupu popisuje, jak se Česko v EuroHPC angažuje, jaké jsou české ambice nebo proč Evropa v HPC oproti dvěma velmocím ztrácí.

Česko začátkem letošního roku oznámilo, že se připojuje k EuroHPC. Co se z českého pohledu stalo od té doby?

Stalo se docela dost důležitých věcích. Zapojili jsme se do všech významných skupin, které byly vytvořeny. Jedna z nejvýznamnějších je skupina na „selection of hosting entity“ (oficiální název je Hosting and Procurement Working Group, pozn. redakce). To je skupina, která by měla definovat podmínky a systém výběru pro to, které země budou hostovat největší superpočítačové systémy, jenž mají v rámci EuroHPC vzniknout. Dále jsme ve skupině, která je zaměřená na požadavky uživatelů. Ta řekne, jak by systémy měly vypadat, jakou budou mít kapacitu, co by měly poskytovat. A další skupina je zaměřená na to, jak bychom nefinančně do EuroHPC přispívali. Od členů se očekává finanční příspěvek, ale také nefinanční přispění a tato skupina určí, co se bude započítávat. Pracovní skupiny by do konce roku měly svoji činnost dokončit a nastavit pravidla.

Pak je zde nad tím ještě jedna skupina, kde je garantem naše ministerstvo školství mládeže a tělovýchovy. My, myslím tím IT4Innovations, tam hrajeme roli technického garanta. Jde o takzvanou „sherpa group“. Tam jde o sdílení a šíření informací, co se kolem projektu děje. Ještě jsme v květnu organizovali EuroHPC workshop, kde jsme s ministerstvem školství dali dohromady národní pracovní skupinu. Není to uzavřený kruh, ale zase nesmí mít nějakých 50 lidí, to už se nic nevyřeší. Snažili jsme se vybrat různé odborníky z Česka, kteří mohou přijít s vlastním názorem a mají být o dění informováni. Do budoucna by tato skupina mohla mít velký význam, jakmile se začnou otevírat výzvy na financování výzkumu v rámci EuroHPC, přístupu k EuroHPC systémům a podobně.

Vít Vondrák, IT4Innovations
Autor: IT4Innovations

Vít Vondrák, IT4Innovations

Z jakých lidí je tato skupina složena?

Vybírali jsme zejména po uživatelské stránce. Jsou tam zástupci z Ústavu organické chemie, ČVUT, VUT, Masarykovy univerzity, Akademie věd ČR a podobně. Identifikovali jsme ty, kteří mají co do činění s HPC. Je těžké zapojit všechny a vycházeli jsme z toho, kdo jsou největší uživatelé našeho aktuálního systému.

Jak ona evropská superpočítačová síť bude nakonec vypadat? Ozývají se i skeptické hlasy, že se pouze aktualizují současné superpočítače a bude to.

Já doufám, že to tak nebude. A ani by to k tomu nemělo směřovat. Hlavní myšlenkou je posunout vpřed technologie a dostat se na světovou špici v oblasti superpočítačů. Superpočítače se považují za vrchol ledovce informačních technologií. Je evidentní, že Evropa v posledních letech v tomto ohledu ztrácí. Myšlenkou tedy není investovat do udržení toho, co aktuálně máme, ale opravdu přijít s novými systémy. Směřuje to k vybudování takzvaných exascale systémů. Tyto počítače by technologicky měly být někde úplně jinde. To bude ten hlavní přínos.

Nestane se tak z ničeho nic. Existuje k tomu nějaká cesta. Mají vzniknout petascale systémy, pak pre-exascale systémy a na to naváží exascale. Bude to vyžadovat i změnu v programovacích modelech aplikací, zajištění dostupnosti aplikací, aby byly efektivní. Vyvinout nové algoritmy tak, aby byly efektivní a využily nové systémy, to chce čas. Každopádně to vyžaduje i investici a je otázkou, zda ta současná je dostatečná. Odpovědí je, že rozhodně do toho nedáváme moc peněz. Evropská unie plánuje investovat do celého EuroHPC necelou půlmiliardu eur (jde čistě o EU, dalších 50 procent přidají členské státy – pozn. redakce), zatímco Trumpova administrativa oznámila, že chce do exascale systémů investovat více než 600 milionů dolarů ročně. Schodek zde tedy je. Nejinak to bude v případě Japonska a o Číně netřeba mluvit už vůbec. O jejích plánech moc nevíme, ale peníze tam budou obrovské.

S jakou pozicí jde do debat a aktivit kolem EuroHPC právě Ostrava a potažmo Česká republika? Chcete třeba vybojovat to, že by u nás byl nějaký obří superpočítač? Jaké máme ambice?

Myslím, že získat k nám největší exascale systém není možné, a to z pohledu finančního a připravenosti. Něco takového vyžaduje obrovskou investici a i to je důvod, proč EuroHPC vůbec vzniklo. Česká republika jenom těžko může do něčeho takového vložit vlastní finanční prostředky takového rozsahu tak, jako je to schopné třeba Německo. Vyžadovalo by to také úpravy naší infrastruktury, protože jsme jednoduše nepočítali s tím, že bychom se stali top superpočítačovým centrem na světě.

Nicméně ambice máme. Rádi bychom v rámci EuroHPC pořídili takzvaný petascale systém. V tomto jsme dobře připravení a máme i dobře načasován upgrade současného počítače Salomon na nový systém. To by nám přesně vyšlo do roku 2020. Kdyby se nám podařilo uspět jako „hosting entity“, mohli bychom jeden z těchto systémů hostovat a od EU bychom dostali dalších 35 procent finančních prostředků navíc na pořízení většího systému.

Vít Vondrák, IT4Innovations
Autor: IT4Innovations

Vít Vondrák, IT4Innovations

Takže by se váš superpočítač Salomon upgradoval na něco lepšího?

Ano. Teď už máme petascale a do budoucna by to bylo něco jako multi-petascale. V této šarži bychom se dostali mezi ty nejvýkonnější v Evropě. No a další ambicí je oblast výzkumu. Zde máme co nabídnout. Superpočítače vznikají proto, aby řešily aktuální výzkumné problémy. Česká vědecká komunita samotná je na něco takového připravená a našim uživatelům to přinese nové možnosti. Také jsme schopní přispět vlastním vývojem. Máme zajímavé algoritmy. Testovali jsme je s velkým úspěchem na tehdy třetím nejvýkonnějším superpočítači světa. Tedy v místě, kde je dnes čerstvě instalován nejvýkonnější superpočítač světa (IBM Summit) – v Oak Ridge National Laboratory. Toto je přístup, který může zvolit řada dalších zemí naší velikosti. Země, které si mohou dovolit investovat do těch nejvýkonnějších strojů, jsou Německo a Francie. Pak se můžeme ptát, jestli na to budou mít i Itálie a Španělsko, které jsou stále vhodnými adepty na exascale systémy.

A Velká Británie už je pryč a Švýcarsko není v Evropské unii…

Ano, Británie je mimo hru. Švýcarsko na to má určitě a superpočítače mají, ale nejsou v EU. Takže když se bavíme o tom, čím menší země typu Česko mohou přispívat, tak to jsou petascale systémy a mohou být členy konsorcií pro pre-exascale systémy. Konsorcia jsou schopná dát dohromady větší obnosy peněz a něco slušného vytvořit. To je varianta, kterou bychom také mohli zvažovat. Ale hlavně většina zemí naší velikosti může přispět právě v oblasti výzkumu a vývoje. To je zároveň naše síla. Heterogenita Evropy má význam v tom, že jednotlivá místa umí věci řešit jinak a umí vyvíjet zajímavé věci. To bude určitě potřeba.

Kolik by Česko tedy do celé akce ze státního rozpočtu mohlo dát?

To v danou chvíli nejsem schopný říci, to bych pouze spekuloval. Pouze jsme předběžně diskutovali, že se na to nějaký rozpočet vyhradí. Aktuálně jsme konkrétně my coby národní superpočítačové centrum IT4Innovations schopní do projektu vložit náš budoucí petascale systém.

Evropská komise chce do financování a dalších aktivit EuroHPC vedle rozpočtu EU a jednotlivých zemí zapojit také soukromý sektor. Máte už představy, kdo z Česka by se v tomto ohledu mohl zapojit?

Zatím netuším. Komise zejména předpokládá, že do toho vstoupí firmy z oblasti IT. Nevím, jestli jsme tak silným hráčem jako jiné evropské země. Působí u nás firmy, které do toho mohou vystoupit, ale ty mají sídlo v jiných zemích, jako je Francie a podobně.

Pokud myslíte Atos/Bull, ten už oznámil, že se do aktivity zapojí.

Ano, podobně firmy se zapojí a určitě se zapojí i další. Jinak v Česku máme firmy, které vyvíjí třeba procesory pro embedded systémy, ale nevím, jestli budou schopny a ochotny se adaptovat směrem na HPC. Svolávali jsme workshop, kam byly pozvány i některé firmy působící v ČR, aby byly informovány. Uvidíme, jak se zapojí. Máme malé lokální hráče a do samotného vývoje hardwaru asi mluvit moc nebudou. Možná více do výzkumné a vývojové části.

Vít Vondrák, IT4Innovations
Autor: IT4Innovations

Vít Vondrák, IT4Innovations

Evropská komise také letos spustila European Processor Initiative (EPI), jejímž cílem je vyvinout vlastní evropské procesory. Nejspíše se to postaví na ARMu a RISC-V. Jak důležité je to, aby Evropa měla vlastní procesory?

To je velmi složitá otázka. Jsou dva tábory. Jeden tvrdí, že něco takového v nejbližší době nepotřebujeme, ale připouští, že ze strategického a dlouhodobého hlediska to má svůj význam. Mimochodem, ARM je původem evropský, respektive britský…

A teď už je japonský

Přesně tak. A pak je zde druhý tábor, který říká, že vlastní procesory potřebujeme za každou cenu. Jednou z představ je, že by alespoň jeden ze systémů EuroHPC byl postaven čistě na evropských technologiích. Já osobně jsem v tomto spíše takový konzervativní. Raději bych dohnal špičku, než za každou cenu utratil všechny peníze jenom za to, abychom za každou cenu měli vlastní procesor. To je ale jenom můj osobní názor. Každopádně jsem na té straně, která říká, že z dlouhodobého hlediska by Evropa měla mít vlastní procesor. Je to strategická věc. Význam informačních technologií neustále roste, probíhá digitalizace společnosti, průmyslu a podobně.

Strategická věc je to z pohledu bezpečnosti, duševního vlastnictví, …?

Obecně je to nezávislost na subdodavatelích z jiných zemí. Naprostá většina procesorů pochází ze Spojených států. Do toho nezapočítávám procesory používané v mobilních zařízeních. Tím pádem jsme tedy v Evropě cenově závislí na USA. Nechci předjímat nějaké mezinárodní politické spory, ale už jenom fakt, že by existovalo embargo…

Což jsme teď viděli na případu čínského ZTE, které v podstatě pozastavilo činnost, když na něj USA na chvilku embargo uvalily…

Ano. V tomto smyslu to pro Evropu může být problematické. V době rozvoje digitalizace je to klíčová věc. Byť se asi nedá předpokládat, že by Evropa byla bez procesorů, z hlediska strategického je to ale velice důležité.

Mohl by být RISC-V dobrou cestou?

Budu mluvit za HPC. Nejvýkonnější superpočítač světa IBM Summit je postavený na GPU Nvidia Volta a procesorech IBM Power 9. Výkon se dá nechat celý delegovat na GPU a použít slabší procesory, ale znamená to přepsat programy. Takže se dá použít třeba RISC-V, ale pak se výpočetní výkon přenese na karty od Nvidie. Když se tak zamyslím, kolik uživatelů našeho superpočítače by bylo připravených takový systém využít, tak musím říci, že ne mnoho. Dnes také existuje jeden systém plně postavený na ARMu, ale z pohledu výkonu to není nic zázračného. Energeticky je to úsporné, to ano. Ale energetická úspora s sebou nese také nižší výkon. Balanc je pak složitý. Když se podíváme, kam jde současný vývoj, tak ty nejvýkonnější systémy jsou vždy akcelerovány „many core“ architekturami. Vše se ale může změnit. ARM má své plány ve zvyšování výkonů. Je to teď velký konkurenční boj a neodvažuji si říci, jak dopadne.

Vít Vondrák, IT4Innovations
Autor: IT4Innovations

Vít Vondrák, IT4Innovations

Už jsme nakousli, že Evropa v superpočítačích postupně ztrácí. Čím to je?

Evropa je pozadu v tom, že investice, které do HPC systémů proudí, nejsou tak organizované jako ve Spojených státech, Číně a Japonsku. Hlavním důvodem je to, že investice jsou čistě na členských zemích.

Nemyslím si, že bychom byli špatně organizovaní v přístupu k nejvýkonnějším počítačům. Tam jsme organizováni dobře. Evropa v tuto chvíli má superpočítačovou infrastrukturu, kterou je PRACE (Partnership for Advanced Computing in Europe). Ta je dobře zaběhnutá a Česko je aktivním členem. PRACE dává dohromady přístup k nejvýkonnějším systémům Evropy, organizuje přístup k národním systémům a organizuje vzdělávací a školicí aktivity. IT4Innovations je například součástí rodiny takzvaného PRACE Training Center a organizujeme celou řadu vzdělávacích akcí. Vyměňují se také informace a zkušenosti. To vše je funkční model.

Vedle toho najednou začalo vznikat EuroHPC. Nyní už je trochu jasnější, jak to bude pracovat dohromady. EuroHPC si vezme na starost zajištění části evropského ekosystému s cílem vybudovat špičkové technologie.

Jsou tedy hlavním problémem zaostávání Evropy peníze?

Jak se říká, peníze jsou vždy až na prvním místě. Samozřejmě, peníze jsou velmi důležitým prvkem. Země jako Německo a Francie jsou připraveny investovat samy. Tak to vždycky bylo. Nicméně Německo stále nemá takovou ekonomiku jako celé Spojené státy. Nedá se tedy očekávat, že do toho dají tolik jako USA, a pravděpodobně tedy nedají dohromady nejvýkonnější systém světa. Myšlenka EuroHPC je, že když se peníze složí dohromady, dá se vybudovat něco srovnatelného. Evropa globálně může ztrácet, když nebude mít adekvátní nástroje ke své velikosti. Amerika je také oproti Evropě úspěšnější v transferu technologií do praxe. Naše zaostávání není ani tak v tom, že bychom neměli velké systémy, ale zaostáváme technologicky. Svět jasně deklaruje, že se vydává technologickým směrem, informační technologie hýbou světem. Jakmile zde Evropa začne zaostávat, může mít značný problém. První, kde se to odrazí, je v oblasti vědy. A jakmile nemáte vědu, odrazí se to v průmyslu, zdravotnictví, bezpečnosti… A pak budeme technologicky závislí na našem okolí. Takže myšlenka EuroHPC má racionální základ.

Odráží se situace v Evropě i v tom, že v podstatě jedinou zdejší firmou, která dokáže stavět velké superpočítače, je francouzský Atos/Bull?

Jsou i menší firmy jako Eurotech, ale nejsou tak významné. Stroje se pořizují zejména ze Spojených států. Někdy se objeví z Japonska, jako je NEC, Fujitsu a podobně. A začínají se po světě objevovat i čínské. Atos/Bull dodává zejména v Evropě a není to úplně malý hráč.

Ve Spojených státech je situace jednoznačná. Když ministerstvo pro energetiku řekne, že dostalo na starost vyřešit exascale systém, uzavře dohody s lokálními americkými společnostmi, jako je IBM, Nvidia nebo Intel. Společně vyvíjí a nikdo jiný se tam nedostane. Proto mají tak velké systémy. Investice USA jdou do vlastních firem. V Číně je to také zřejmé a v Japonsku částečně také. V Evropě jsme to tak nedělali a je to jedna z věcí, proč se nad tím Evropská komise zamyslela.

Vy osobně tedy snahy kolem EuroHPC vítáte?

My konkrétně musíme dát k dispozici české vědě ty nejlepší možné nástroje, které prostě potřebuje. To je hlavní cíl. Otázkou je, jestli to budou evropské, americké, japonské nebo čínské technologie. To by měl být druhořadý problém. Když mám uspokojit požadavky našich uživatelů, není pro mě zcela rozhodující, odkud ty technologie jsou. Rozhodující by to mělo být pro politiky. Je to rozhodnutí politicko-strategického charakteru. Já osobně mám zájem o veškeré dobré technologie, které k něčemu jsou.

Čína do nedávného příchodu IBM Summit měla v žebříčku TOP 500 dva nejvýkonnější superpočítače na světě. Už nějakou dobu v něm má také více superpočítačů než Spojené státy. Co se v té Číně děje?

Nárůst čínských systémů je zajímavý. Náš Salomon se po poslední aktualizaci žebříčku propadl a objevilo se nad ním asi 30 čínských systémů, které jsou v podstatě identické a pouze mají jiné lokality. Jsou to nějaké systémy nasazené do cloudové služby. Je to tam i přiznané, že jde o „hosting services“ a podobně. Je to dilema, jak se na něco takového dívat. Takový Amazon má určitě po světě řadu velkých systémů, akorát je nedává do žebříčku a rozhodně ne tolikrát. Jestli to byl ze strany Číny tah, jak zvýšit počet jejich systémů v žebříčku, tak se jim to podařilo. Což bohužel znamená i to, že odsunuli nás, byť chybělo několik teraflops (smích). Takže Čína nyní zvýšila počet superpočítačů v žebříčku, ale kdyby USA započítaly všechny stroje od Amazonu, Googlu nebo Microsoftu, asi by to vypadalo poněkud jinak. Ale oni to nedělají, protože to nepovažují za klasický HPC systém. Kdyby se to takto dělalo, neměl by pak TOP 500 význam, protože by tam bylo 100 identických amerických a 100 čínských systémů.

Na počty systémů bych tedy byl opatrný, spíše bych se díval na technologie. A tam si Čína nestojí špatně. Aktuálně už nevyčnívá tak, jak vyčnívala. Pochopitelně se ale chystá instalovat nové systémy.

Vít Vondrák, IT4Innovations
Autor: IT4Innovations

Vít Vondrák, IT4Innovations

Občas slýchám i to, že Čína sice má jedny z nejvýkonnějších počítačů na světě, ale že ne vždy dokáží využít jejich výkon.

Myslím si, že ho využijí a že ho využívají. Neměli úplně standardní architekturu a museli k ní vyvinout řadu kódů. Pochyby byly třeba u jejich stroje Tianhe-2, který spadá pod čínskou univerzitu obrany. Detaily se tedy logicky příliš nechlubí, ale myslím si, že ten stroj využít umí. Čína je obrovská a řada lidí studovala ve Spojených státech a znalosti si odnesla zpátky domů.

Čína jako jednu ze svých priorit oznámila, že chce vyvíjet vlastní čipy a procesory. Mimo jiné se vrací VIA Technologies podporovaná čínských kapitálem, která jako jedna ze tří firem na světě (mimo Intel a AMD) vlastní licenci na x86. Čína si také začala licencovat x86 od AMD pro svůj trh. Značný průlom v Číně nastává také u různých AI procesorů. Jak se na tyto a další snahy díváte?

Technologicky na to mají, což už prokázali. Know-how už se na západě naučili. Otázkou je, jak se budou schopní rozvíjet do budoucna, ale základnu mají velkou. Pak je zde samozřejmě ještě druhá strana, kterou už jste naznačoval, a to právě ono využití aplikací. Bude se čím dále více využívat složitějších simulací, prvků umělé inteligence, zpracovávat se bude více dat a tak dále. Do jaké míry to bude stát na množství hardwaru a do jaké na efektivitě aplikací, to je druhá věc. Rozumím tomu, že na Čínu dopadlo embargo Spojených států a rozhodla se jít vlastní cestou. Takže nemají moc na výběr. Mají všechny předpoklady k tomu, aby to zvládli.

Podívejte se na superpočítač Salomon v Ostravě:

Jakým směrem se z pohledu architektury vydáte vy v Ostravě? Se strojem Salomon jste velkým partnerem Intelu, ovšem jeho karty Xeon Phi, které také používáte, se neukázaly jako ten největší úspěch.

Spojení s Intelem pro nás bylo velice významné. V době, kdy jsme Salomona instalovali, byl Intel technologická špička a je jí stále. Řadu, kterou jsme u nás instalovali, už dále „netlačí“. Ale není úplně pravda, že by ta technologie zcela zmizela. Řada věcí, které dali do vývoje Xeon Phi, přenáší do standardních procesorů. To znamená, že to, co jsme se naučili a připravili, můžeme velmi efektivně použít na procesory Intel či architekturu x86 obecně. Stále je to nejvíce používaná architektura. Intel nám v době výběrového řízení dal zajímavou nabídku a myslím, že to bylo dobré a udělali jsme řadu zajímavých věcí. Každopádně do budoucna samozřejmě budeme otevření dalším technologiím, které budou vypadat dobře. Jsme sice součástí sítě Intel Parallel Computing Center, ale nechceme se uzavírat pouze jedním směrem. Už jenom z toho důvodu, že nevíme, kam se celá oblast do budoucna bude ubírat.

A druhou věcí je také to, že pokud se rozhodneme stát „hosting entity“ v rámci EuroHPC, tak tam už nebudeme o výběru rozhodovat sami. Tam už by o pořízení systému měla rozhodovat i Evropská unie.

Dotklo se vás nějakým způsobem Spectre/Meltdown?

Extrémně ne. My nesdílíme jeden uzel mezi více uživatelů. Naše nejmenší alokační jednotka je jeden uzel. To znamená, že když dojde k alokaci nějakého výpočetního „jobu“ na uzel, jsou oba procesory využívány pouze jedním uživatelem. Nevím o tom, že by se objevil nějaký extrémní problém. Je také důležité říci, že nemáme nějaké ultrakritické aplikace.

Společně s Vysokou školou báňskou – Technickou univerzitou Ostrava jste rozjeli superpočítačový obor. Jak se to vyvinulo?

Studijní program byl magisterský a doktorský. V tom doktorském máme každoročně asi šest Ph.D. studentů, což je celkem dobré. Aktuálně tedy máme asi 18 studentů. Magisterský obor už byl trochu slabší, zájem nebyl tak velký, jak jsme čekali. Problém byl zejména v tom, že se navazovalo na bakalářské studium. Když se tento systém zaváděl, předpokládalo se, že studenti budou na navazující magisterské studium různě migrovat, ale ono se tak moc neděje a zůstávají u toho, čím začali. Pro studenty asi není úplně atraktivní měnit studijní program. U Ph.D. už to je jiná věc. Budoucnost vidíme v tom, že máme odborníky, kteří jsou schopní připravovat předměty a kurzy pro studenty příbuzných studijních programů. To je v magisterském studiu cesta.

Dále o tématu na Lupě:

Našli jste v článku chybu?