Hlavní navigace

Tak už i poker hrají stroje lépe než lidé. DeepStack má v sobě i kus českého DNA

Jan Beránek

Experti z Matfyzu a FELu spolupracovali na vývoji programu DeepStack, který na konci loňského roku dokázal porazit profesionálního hráče pokeru. Vytvořili tak další historický milník, kdy lidé v populárních hrách podlehli počítačům. 

Po backgammonu, dámě, šachu a go je tedy dalším v pořadí no-limit poker. Oproti předchozím hrám je tu však jeden zásadní rozdíl. Poker byl dlouholetou výzvou pro umělou inteligenci, říká Michael Bowling, profesor z Albertské univerzity, který výzkumný tým vedl. Je to typická hra s neúplnou informací, ve které hráči během hry nemají stejnou informaci a pohled na hru.

DeepStack hrál proti skupině profesionálních hráčů pokeru. Třicet tři hráčů vybraných Mezinárodní federací pokeru pocházelo ze sedmnácti států. Každý hráč měl možnost hrát 3 000 her během čtyř týdnů. DeepStack tyto hráče v průměru porazil s obrovskou převahou. Každého z jedenácti hráčů, kteří dohráli všech 3 000 her, porazil i individuálně. 

Matematické modely her umožňují popsat situace z ekonomie, aukcí, síťové bezpečnosti, ochrany důležitých cílů nebo kontroly jízdného. V těchto reálných situacích se jednotlivé strany jen velmi zřídka rozhodují na základě úplných a totožných informací. Proto je pokrok v řešení her s neúplnou informací zásadní pro praktické aplikace, vysvětluje Michael Bowling.

Jak už to tak v pokeru bývá, velkou roli sehrála náhoda. Při přátelském rozhovoru s profesorem Bowlingem na konferenci v Montrealu slovo dalo slovo a na stole bylo pozvání odjet na rok do Kanady a stát se členy Mikova týmu s odvážným cílem, který se nakonec povedl, popisují začátky projektu Martin Schmid a Matěj Moravčík z Katedry aplikované matematiky Matematicko-fyzikální fakulty UK. 

Algoritmus DeepStacku je přelomový, protože se nám podařilo přenést myšlenky, které byly klíčové v hrách s úplnou informací, do světa her s neúplnou informací. Doposud nebylo jasné, zda je podobný přístup vůbec možný, dodává Schmid. DeepStack umožňuje vypočítat vhodnou strategii pro situaci v pokeru až v momentě, kdy situace nastane, tedy bez nutnosti uvažovat o úplně celé hře předem naráz, což byl doteď převládající přístup. 

Schopnost uvažovat o jednotlivých pokerových situacích až v momentě, když nastanou, je klíčová pro složité hry, jako je no-limit Texas Hold’em, ve kterých může nastat mnohem víc různých situací, než je počet atomů ve vesmíru, vysvětluje další z českých vývojářů Viliam Lisý. I takto složitou hru hraje DeepStack rychleji než lidi. V průměru potřebuje jen tři sekundy “myšlení” na každé rozhodnutí a funguje i na běžném laptopu s výkonnější grafickou kartou od Nvidie, kterou používá pro své výpočty.

Našli jste v článku chybu?