Radek Tomšů (ČHMÚ): AI modely mohou přinést revoluci v předpovědích počasí

23. 5. 2025
Doba čtení: 15 minut

Sdílet

Radek Tomšů, Český hydrometeorologický ústav
Autor: Jan Vaca
Radek Tomšů, ředitel úseku předpovědní služby Českého hydrometeorologického ústavu.
Meteorologové jsou dnes schopni poměrně dobře předpovědět počasí na zhruba týden dopředu. Nástup modelů založených na umělé inteligenci by tuto hranici mohl ještě o něco posunout.

Když jsme začínali s modelem Aladin, počítal se jen jednou denně, pak dvakrát denně. Teď se počítá čtyřikrát za den,“ popisuje ředitel předpovědní služby Českého hydrometeorologického ústavu (ČHMÚ) Radek Tomšů jednu ze změn, které meteorologům přinesl vývoj technologií.

Zvýšení přesnoti a četnosti předpovědí umožnily především výkonné superpočítače, které dnes dokáží „spočítat“ komplexní model za několik hodin. Na obzoru je ale další vylepšení: předpovědní modely založené na AI zvládají totéž v řádu minut. Fungují ale na zcela jiném principu, vysvětluje v rozhovoru pro Lupu Tomšů.

„Když dnešní situaci porovnám s osmdesátými, devadesátými lety, úplně se otočila. Tehdy jsme byli rádi za každé údaje, které jsme měli k dispozici, abychom je mohli analyzovat. Dnes má meteorolog k dispozici obrovské množství dat a musí si z nich vybírat. Datové toky, které k meteorologům proudí, jsou obrovské, jde o desítky gigabajtů denně,“ dodává.

Stane se meteorologie doménou umělé inteligence? A jak si AI vede při předpovídání extrémních jevů, jako jsou tornáda nebo povodně? Rozhovor si můžete poslechnout ve formě podcastu na svých oblíbených podcastových službách nebo přímo zde:

Nabízíme vám také přepis části podcastového rozhovoru do textu. Podporovatelé Lupa.cz zde mají k dispozici kompletní přepis (využíváme k němu AI služby Whisper a Claude, text je poté redakčně upraven).

Budeme mluvit o umělé inteligenci a předpovědí počasí. Začnu od novinky, která se objevila před pár týdny: Evropské centrum pro střednědobé předpovědi vypustilo nový model, založený právě na umělé inteligenci. Tvrdí, že je zhruba o 20 % lepší než stávající modely. Znamená to, že předpovědi počasí už budou do budoucna záviset jenom na AI?

To je trošku složitější. Deterministické modely se vyvíjely dlouhou dobu. Uplynulo zhruba 40 let, než jsme se od prvopočátků v osmdesátých letech dostali na dnešní úroveň vysokého rozlišení řady hladin v deterministických modelech. Pokrok za tu dobu byl poměrně značný. 

Nicméně je to vyváženo tím, že na ně potřebujeme, řekněme, dost počítačového času. S tím, jak se zvyšuje rozlišení modelů, samozřejmě stoupá náročnost výpočtů, a to sebou nese vysoké náklady. Když to porovnáme s tím, co se v posledních dvou, třech letech odehrává na poli uměle inteligence, vidíme, že máme modely, které vyžadují zlomek toho, co ty deterministické. Jejich nákladnost je výrazně nižší.

Od předloňského roku máme k dispozici první výsledky a porovnání modelů. Samozřejmě jsou tam výhody a nevýhody, o tom by se asi dalo dlouho povídat. Existují rozdíly v tom, jakým způsobem pracují s daty, jak je analyzují z dlouhodobého hlediska a tak dále. A já se domnívám, že výsledkem bude, že nějaký čas budou AI a deterministické modely fungovat vedle sebe a je možné, že v relativně blízké budoucnosti AI modely předpovědi převezmou. 

Ale zatím ta doba ještě nenastala, protože neproběhly důležité evaluace, které nám přinesou výsledky i z dlouhodobého hlediska a na jejich základě potom dojde k rozhodnutí meteorologických služeb, jestli budou tyto druhy modelů využívat a zdá to bude pro ně relevantní. Ale je poměrně hodně úskalí, která se ještě budou muset překonat.

Vy jste začal pracovat na pozici meteorologa v roce 2002 na ústeckém hydrometeorologickém ústavu a máte tedy za sebou 20 let. Jak se za tu dobu změnilo předpovídání počasí?

Změnilo se hodně. Člověku, který v oboru pracuje, ani nepřijde, že ty změny jsou tak velké. Ale když si pak uvědomí, s čím začínal… Poprvé jsem přišel do kontaktu s výsledky meteorologických modelů, když jsem v 90. letech studoval vysokou školu. Tehdy se dávaly poprvé na internet. V tu chvíli jsme měli de facto ještě částečně dobu analogovou, protože veškerá měření na stanicích tehdy probíhala v podstatě manuálně – chodilo se do budek. 

Nastavit proces tak, jak ho známe dnes, že veškerá data máme k dispozici online a veškeré stanice jsou automatizované, trvalo možná 10 nebo 15 let. To znamená, že v těch 90. letech všechno probíhalo velmi zpomaleně, internet se využíval velmi málo a ta doba od mých začátků, což je dneska necelých 30 let, se taky výrazně změnila. My jsme tehdy měli meteorologické modely, které byly globální a fungují dodnes, ale jejich rozlišení tehdy bylo 200 až 300 kilometrů. 

Na Českou republiku třeba v některých modelech vycházel jeden bod, někdy dva, což samozřejmě značně ztěžovalo interpretaci výsledků. Třeba Alpy v tomto rozlišení byly kopce vysoké 1500 až 2000 metrů, přičemž víme, jak jsou Alpy ve skutečnosti vysoké, a rozdíl v předpovědích je pak markantní. Samozřejmě orografie je, obzvlášť ve střední Evropě, poměrně složitá, a i pro dnešní modely s vyšším rozlišením je často velkým úskalím předpovědět velmi dobře srážky a teploty v hodně členitých místech.

Dá se nějak jednoduše popsat, jaké modely se dnes v meteorologii používají?

V podstatě máme dva hlavní druhy modelů. Globální modely jsou provozované těmi největšími meteorologickými službami, ať už je to americká, japonská, německá, britská. Provozování globálních modelů je poměrně náročné ať už na datový prostor nebo na výpočetní výkon. Veškeré tyto modely jsou dneska k dispozici zdarma na internetu a je možné je využívat. My samozřejmě máme linky nastavené tak, abychom od těchto služeb dostávali data.

Druhá skupina jsou regionální modely. Ty se přizpůsobují tomu nejbližšímu, co meteorologické služby v dané zemi potřebují. Pro nás je regionálním modelem dobře známý Aladin, který vypočítává meteorologické prvky v oblasti České republiky a nejbližšího okolí a vychází z globálního francouzského modelu Arpège. Žádný regionální model nemůže žít bez toho globálního, protože z něj bere tzv. okrajová data, a s těmi potom pracuje. 

Regionální modely se dnes vyvinuly tak, že některé z nich poskytují data na tři dny, jako třeba Aladin, některé i na pět dní, takže i v tom nízkém rozlišení jsme schopni velmi dobře pokrýt i několik dnů. Často se ukazuje, že je to klíčové. Například při povodních v září 2024 jsme byli velmi rádi, že máme regionální modely, které daleko lépe predikovaly srážkové úhrny a velmi nám pomohly s tou predikcí v případě povodní.

Když mluvíte o rozlišení, to znamená, na jaké území ten model je počítán?

V rámci rozlišení mluvíme o dvou složkách. Horizontální rozlišení je dnes u regionálních modelů, třeba u Aladina, 2 kilometry, u globálních modelů se pohybujeme kolem 10 km. Regionální model je výrazně podrobnější, dokáže modelovat údolí, v regionálních předpovědích je mnohem lepší. 

Totéž se týká také vertikálních hladin, které jsou mnohem důležitější. Počasí se sice odehrává pro nás na zemi, ale to hlavní se děje v atmosféře. Je velmi důležité to namodelovat a samozřejmě vždycky máme určitou míru nejistoty a nedostatku, protože vertikálních měření není zdaleka tolik jako těch přízemních. Třeba v rámci České republiky jsou pouze dvě vertikální měření. 

Zatím nám ještě moc nepomáhají družice. Máme pomocná data třeba z letů letadel, ale která síť mírně zahušťují. Ale základ je, že v rámci České republiky máme dvě vertikální měření čtyřikrát denně v Praze a dvakrát nebo třikrát denně v Prostějově. A to je v podstatě všechno. 

V jiných zemích to není jiné. Vertikální měřením pomocí sond je drahé, ale velmi nezastupitelné, protože z hlediska toho, co se děje v atmosféře, potřebujeme zejména data ve vertikálních hladinách, zhruba do 15 km, abychom byli schopni velmi dobře předpovědět počasí. 

Nicméně dokážete si asi představit, že existuje řada území nebo i států, kde se neměří a kde se nedostatek dat samozřejmě projevuje. Modely samozřejmě provádí sofistikované interpolace, nicméně jsou to interpolace, takže určitá nepřesnost vzniká už na začátku, ale my bychom chtěli co nejpřesnější výsledek, což je hrozně těžké.

Už jste naznačil, že si nemyslíte, že by v krátké době umělá inteligence plně nahradila jiné předpovědi, a že se modely budou doplňovat. Přesto, jak hodně se tedy liší modely, které jsou založené na umělé inteligenci, od těch tradičních numerických?

Jejich přístup je kompletně jiný. AI modely učíme na situacích, které nastaly v minulosti. Ono se to velmi dobře dá porovnat s tím, jak uvažuje meteorolog. Protože aby se meteorolog dopracoval určité zkušenosti, potřebuje, a teď možná plácnu, pět, deset let, patnáct let. Je to velmi individuální, protože někdo má talent a cit pro to „dobře předpovědět.“ 

My meteorology hodnotíme, takže víme, kterým předpovědi nejlépe vycházejí a snažíme se s tím nějakým způsobem pracovat. A víme tedy dobře, jakým způsobem ten člověk předpovědi interpretuje. Svou letitou zkušenost pak do těch předpovědí promítá. Už má nastudované, jak se chovají určité modely v určitých situacích, co se děje typicky třeba během zimní inverze nebo letní bouřky. Napozoroval si, jakým způsobem se počasí chová a už ví, že konkrétní model třeba něco podhodnocuje. Tato zkušenost se promítá do toho, jak se ten člověk rozhoduje. Přesně to vlastně dělají AI modely, jenže zkušenost, kterou lidský meteorolog nabírá roky, naberou lusknutím prstu.

Předpovědi jsou dnes tvořené uměle pomocí modelů a bez zásahu člověka. To je běžný model, že se v mobilu kouknete do nějaké aplikace a vidíte v ní nějaké výsledky. Na druhé straně existují předpovědi, které tvoříme my, a ty jsou kombinací modelu a zkušeností meteorologa. Když to řeknu zjednodušeně: model sám by měl úspěšnost dejme tomu 70 %, meteorolog sám by měl úspěšnost 80 % a dohromady deterministický model a meteorolog mají úspěšnost 90 %, u velmi krátkodobých předpovědí dokonce 95 %. Úspěšnost dlouhodobě roste především tím, jak se zlepšuje kvalita deterministických modelů.

AI modely dělají v podstatě to, co dlouhou dobu dělal meteorolog: vylepšují na základě zkušeností výsledky a nepřesnosti deterministických modelů. Proto říkám, že nějaký čas pravděpodobně budou fungovat vedle sebe. My dneska například v případě hydrologických předpovědí spolupracujeme s Googlem. Porovnáváme, jak dobře jsou modely schopné predikovat průběh hladin na řekách. Google má svoji AI, která analyzuje srážky, případně další aspekty, a na základě toho predikuje vývoj na řece. Funguje to poměrně velmi dobře, ale zase to chce určitě zkušenosti.

Zlí jazykové říkají, že je to black box, o kterém nic nevíme – a co když v nějaké situaci nevyjde? To je samozřejmě určitým rizikem AI modelů a vzhledem k tomu, že jsou tady poměrně čerstvě, musíme tyto situace analyzovat. Když byly povodně v roce 2024, tak právě některé AI modely nedávaly úplně všude dobré výsledky. Takže budeme AI modely testovat a budeme s daty pracovat několik let a porovnávat, jak předpovědi vycházejí, a pokud se osvědčí, je nástup AI modelů podle mě nevyhnutelný.

Určitě pomůže i to, že AI modely jsou výrazně rychlejší než klasické modely. Četl jsem, že GraphCast od Googlu dokáže vytvořit desetidenní předpověď během pár minut, zatímco tradiční modely za hodiny, přestože používají vysoce výkonné počítače.

Je to tak, rozdíl je dramatický a náklady na provoz deterministických modelů jsou opravdu vysoké. U našeho regionálního modelu Aladin je potřeba jednou za několik let udělat upgrade superpočítače. I to stojí dost peněz, jde o desítky milionů na upgrady a samozřejmě i provoz je náročný. Ale třeba v Evropském centru pro střednědobou předpověď, kde mají obrovská datová centra, je samozřejmě provoz nepoměrně dražší. Na druhou stranu, jak jste říkal, u deterministického modelu trvá předpověď řádově nižší jednotky hodin. V případě regionálních předpovědí jde asi o hodinu a půl třeba nebo dvě hodiny. A u AI modelů jsou to minuty. Rozdíl je zásadní a může opravdu přinést revoluci v tom, jak k předpovědím přistupujeme.

Před čtyřmi roky jsme na Lupě psali, že si ČHMÚ pořídil nový superpočítač, který stál skoro 73 milionů korun. Ještě se používá?

Ano, teď se chystá upgrade. Jak jsem říkal, děje se v řádu několika let, protože se vyvíjí rozlišení modelů. Když jsme začínali s modelem Aladin, počítal se jen jednou denně, pak dvakrát denně. Teď se počítá čtyřikrát denně. Poslední, noční běh, který začínal v 18 hodin večer a byl k dispozici zhruba kolem půlnoci, se kvůli údržbě superpočítače zkracoval, ale dneska jsme ho také rozšířili a teď chystáme nově změnu. U německého modelu ICON ji provedli před dvěma, možná už třemi lety a mají výpočet k dispozici každé tři hodiny. A to samozřejmě vyžaduje náročnější prostor na superpočítači.

Když dnešní situaci porovnám s osmdesátými, devadesátými lety, úplně se otočila. Dneska má meteorolog k dispozici obrovské množství dat a musí si z nich vybírat. Tehdy jsme byli rádi za každé údaje, které jsme měli k dispozici, abychom tu situaci mohli analyzovat. Dnes jsou datové toky, které k meteorologům proudí, obrovské, jde o desítky gigabajtů denně.

Už jste naznačil, že když byly naposledy v Česku povodně, nebyly AI modely v některých aspektech přesné. Dá se říct, jak hodně se AI modely liší od těch klasických v předpovědích závažných meteorologických jevů?

Podle dostupných studií – a jsme stále relativně na počátku – v některých situacích vycházejí poměrně dobře, dokonce v případě GraphCastu, jestli se nepletu, se podařilo některé extrémní situace předpovědět o jeden až dva dny dříve než těm deterministickým modelům. To přináší další zpřesnění toho, jakým způsobem můžeme pracovat s daty. 

My jsme dnes schopni poměrně dobře předpovědět zhruba nějakých sedm dní dopředu. Pro srovnání – když jsem nastupoval, pohybovala se ta úroveň zhruba kolem čtvrtého až pátého dne. Zdá se, že AI modely budou schopné na základě zkušeností tuto hranici ještě o maličko posunout.  

U deterministických modelů se dlouhou dobu zdálo, že se dostáváme na hranici toho, co je možné předpovědět a že je nejde už více zpřesnit. Což je v podstatě pravda. V momentě, kdy zmenšujeme rozlišení, vznikají v modelech další problémy, které se musí řešit. 

Naše oddělení, které se věnuje numerickým předpovědím, každých několik měsíců vydává novou verzi modelu Aladin, které se snaží reagovat na to, co vychází z ověřovacích datasetů. Ověřuje se, jakým způsobem vychází jednotlivé meteorologické prvky, jako jsou srážky, teplota, vlhkost. Důležité jsou i různé hladiny, jak vychází přízemní teplota, musí se tam takzvaně parametrizovat různé hodnoty, ať už se to týká půdy a podobně. 

CIF25 SE debata

Je to často velmi složité, celé týmy odborníků, kteří se tomu na mezinárodní úrovni věnují, tráví vylepšováním modelů spoustu času. A stále je to jenom přiblížení tomu, co se v atmosféře ve skutečnosti odehrává. Snažíme se to napasovat do rovnic a snažíme se, aby ty rovnice odpovídaly realitě, ale ta realita je samozřejmě trošku odlišná.

Začínají nám pomáhat i družice, které mapují atmosféru. Třeba vypuštění poslední družice MTG by mohlo deterministické modely dále zpřesnit. Ale přesto už kroky, které dnes děláme v upřesnění, nejsou tak velké, jako byly na počátku, když se opravdu výrazně zmenšovalo rozlišení. Začínali jsme, jak jsem říkal, na 300 km, dnes jsme na deseti, takže pokrok byl v začátku poměrně velký, ale dnes už je jasné, že každé zmenšení rozlišení znamená výrazný nárůst výpočetního výkonu, která stojí obrovské peníze.

Přepis podcastu je dostupný pouze našim podporovatelům

Můžete se jím stát i vy. Získáte tak nejen přístup k přepisům všech našich podcastů, ale také Lupu bez bannerů, newsletter o zákulisí českého internetu a další výhody.

Seriál: Rozhovory
Neutrální ikona do widgetu na odběr článků ze seriálů

Zajímá vás toto téma? Chcete se o něm dozvědět víc?

Objednejte si upozornění na nově vydané články do vašeho mailu. Žádný článek vám tak neuteče.


Autor článku

Autor je od ledna 2018 ředitelem médií vydavatelství Internet Info. Předtím 6 let vedl zpravodajskou sekci portálu iDNES.cz, ještě předtím byl několik let reportérem celostátní redakce MF DNES. Občas si rád něco napíše.

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).