Na Vysoké škole báňské – Technické univerzitě Ostrava v rámci národního superpočítačového centra IT4Innovations vyvinuli softwarový balík, který dokáže optimalizovat, spravovat a monitorovat spotřebu energie v datových centrech. Ostrava do hry přichází v době, kdy vzniká velké množství datacenter zaměřených na umělou inteligenci. Ty kvůli nasazení AI čipů (GPU) mají velké energetické nároky, což způsobuje řadu výzev. Dá se očekávat, že hledání technologií pro optimalizaci spotřeby bude vyhledávaná disciplína.
Software z Ostravy se jmenuje MERIC Software Suite a je k dispozici zdarma jako open source. IT4Innovations k němu provozuje stránku na GitLabu.
“MERIC umožňuje superpočítačům pracovat rychle a zároveň úsporně – měří spotřebu energie, sleduje využití procesorů (CPU) a výpočetních akcelerátorů (například GPU) a podle aktuální zátěže dynamicky upravuje jejich nastavení. Uživatelé tak mohou měřit spotřebu energie na úrovni aplikací nebo jejich součástí, a navíc sami přizpůsobit nastavení systému pro maximální výkon bez plýtvání elektrickou energií. Součástí MERIC Software Suite je i infrastruktura pro sledování spotřeby a teploty v datových sálech, včetně 3D vizualizace, která v reálném čase zobrazuje aktuální stav systémů. To umožňuje správcům lépe identifikovat problematická místa (například v systému chlazení) a lépe pochopit vazby mezi jednotlivými částmi superpočítače. Na administrátorské úrovni poskytuje MERIC pravidly řízené omezení výkonu (takzvaný power capping), které udržuje spotřebu pod stanovenými limity,” shrnuli autoři.
Ondřej Vysocký a Lubomír Říha z IT4Innovations dále MERIC popisují takto:
Díky MERIC jsme u některých výpočtů snížili spotřebu elektrické energie až o 34 %, v průměru kolem 16 %, a to bez výrazného zpomalení výpočtů. Jeho modulární architektura navíc umožňuje snadnou integraci do stávajících systémů správy a monitoringu HPC center. Software je nasazen nejen na českém superpočítači Karolina, ale i na portugalském Deucalionu, které patří do sítě celoevropského společného podniku EuroHPC (EuroHPC JU). V následujících týdnech vyjde nová verze MERIC. Runtime system bude nasazen na všech superpočítačích EuroHPC JU, a umožní tak uživatelům těchto strojů jednotným způsobem vyhodnocovat energetickou efektivitu jejich aplikací.
MERIC nabízí rozhraní pro běžně používané programovací jazyky. Dokáže efektivně pracovat s paralelními aplikacemi a šetřit energii, aniž by snižoval jejich výkon, případně lze vliv na výkon plně kontrolovat. MERIC lze používat na různých typech počítačů – od běžných procesorů až po výkonné výpočetní (například grafické) akcelerátory – a spolupracuje s většinou systémů pro sledování spotřeby energie.
IT4Innovations v roce 2023 zavedlo i omezení provozních frekvencí procesorů superpočítače Karolina, čímž se podařilo snížit spotřebu energie a tím i uhlíkovou stopu. Dopad na uživatele byl minimální – u úloh náročných na výkon procesoru nebo akcelerátoru se doba výpočtu prodloužila maximálně o 16 %, nicméně u úloh závislých na rychlosti paměti systému, které na našich systémech převažují z 80 %, ke zpomalení nedochází.
Dlouhodobý důraz na energetickou efektivitu se odráží i v mezinárodních žebříčcích. V žebříčku energetické efektivity největších superpočítačů světa Green500 se akcelerovaná část Karoliny po svém spuštění v roce 2021 umístila na 15. místě, o půl roku později díky optimalizaci nastavení parametrů ve spolupráci s HPE (dodavatelem počítače) postoupila na osmou příčku, a i po více než čtyřech letech provozu si udržuje pozici v první stovce – aktuálně na 77. místě.
Optimalizace superpočítače Karolina přinesla výrazné výsledky – oproti původnímu stavu se podařilo snížit příkon, což představuje roční finanční úsporu v řádu několika milionů korun. A ekologicky to odpovídá snížení emisí CO₂, jaké by zajistilo přes 12 600 vzrostlých stromů. Energetická účinnost superpočítačů je pro nás klíčová. Naším cílem není jen provozovat výkonné stroje, ale také je provozovat chytře a úsporně.