Experti z Matfyzu a FELu spolupracovali na vývoji programu DeepStack, který na konci loňského roku dokázal porazit profesionálního hráče pokeru. Vytvořili tak další historický milník, kdy lidé v populárních hrách podlehli počítačům.
Po backgammonu, dámě, šachu a go je tedy dalším v pořadí no-limit poker. Oproti předchozím hrám je tu však jeden zásadní rozdíl. Poker byl dlouholetou výzvou pro umělou inteligenci,
říká Michael Bowling, profesor z Albertské univerzity, který výzkumný tým vedl. Je to typická hra s neúplnou informací, ve které hráči během hry nemají stejnou informaci a pohled na hru.
DeepStack hrál proti skupině profesionálních hráčů pokeru. Třicet tři hráčů vybraných Mezinárodní federací pokeru pocházelo ze sedmnácti států. Každý hráč měl možnost hrát 3 000 her během čtyř týdnů. DeepStack tyto hráče v průměru porazil s obrovskou převahou. Každého z jedenácti hráčů, kteří dohráli všech 3 000 her, porazil i individuálně.
Matematické modely her umožňují popsat situace z ekonomie, aukcí, síťové bezpečnosti, ochrany důležitých cílů nebo kontroly jízdného. V těchto reálných situacích se jednotlivé strany jen velmi zřídka rozhodují na základě úplných a totožných informací. Proto je pokrok v řešení her s neúplnou informací zásadní pro praktické aplikace,
vysvětluje Michael Bowling.
Jak už to tak v pokeru bývá, velkou roli sehrála náhoda. Při přátelském rozhovoru s profesorem Bowlingem na konferenci v Montrealu slovo dalo slovo a na stole bylo pozvání odjet na rok do Kanady a stát se členy Mikova týmu s odvážným cílem, který se nakonec povedl,
popisují začátky projektu Martin Schmid a Matěj Moravčík z Katedry aplikované matematiky Matematicko-fyzikální fakulty UK.
Algoritmus DeepStacku je přelomový, protože se nám podařilo přenést myšlenky, které byly klíčové v hrách s úplnou informací, do světa her s neúplnou informací. Doposud nebylo jasné, zda je podobný přístup vůbec možný,
dodává Schmid. DeepStack umožňuje vypočítat vhodnou strategii pro situaci v pokeru až v momentě, kdy situace nastane, tedy bez nutnosti uvažovat o úplně celé hře předem naráz, což byl doteď převládající přístup.
Schopnost uvažovat o jednotlivých pokerových situacích až v momentě, když nastanou, je klíčová pro složité hry, jako je no-limit Texas Hold’em, ve kterých může nastat mnohem víc různých situací, než je počet atomů ve vesmíru,
vysvětluje další z českých vývojářů Viliam Lisý. I takto složitou hru hraje DeepStack rychleji než lidi. V průměru potřebuje jen tři sekundy “myšlení” na každé rozhodnutí a funguje i na běžném laptopu s výkonnější grafickou kartou od Nvidie, kterou používá pro své výpočty.