Hlavní navigace

Jiří Psota (Yieldigo): Každý dnes říká, že má umělou inteligenci, ale není to pravda

Jan Sedlák

Dostáváme od firem otázku, zda jim nahradíme lidi, popisuje praktické zkušenosti šéf české firmy, která využívá AI k tvorbě cen v obchodech.

Doba čtení: 14 minut

Sdílet

Jiří Psota je spoluzakladatelem a technickým ředitelem české společnosti Yieldigo, která pomocí umělé inteligence (AI) pomáhá retailovým řetězcům s cenotvorbou. Vytváří matematický model zákazníka a nastavuje ceny tak, aby zvyšovaly zisk. Firma prý dokáže garantovat navýšení o pět procent, ale někde se dostává až ke dvaceti.

Yieldigo dnes spravuje úhrn zboží v hodnotě tří miliard eur a klientům přinese přes dva miliony eur nových peněz, které by jinak nepřišly. Firma přerostla Českou republiku a má potenciál dělat byznys s největšími retaily světa. Psota v rozhovoru pro Lupu popisuje, jak AI funguje a jaká je budoucnost digitalizovaného retailu.

Zahlédl jsem, že tomu, co děláte, říkáte augmentovaná cenotvorba. Co to přesně znamená?

Přesnější název je „customer centric pricing“. Současný přístup k tomu, jak obchodníci naceňují, je ten, že se podívají na konkurenci a snaží se vůči ní vymezovat. Případně mají ceny od dodavatele a snaží se nad nimi držet marži. Nebo je to kombinace obojího. Jenže ani v jedné z těchto metod se nevyskytuje zákazník a nikdo se ho neptá, zda je cena v pořádku i pro něho.

„Customer centric“ znamená, že simulujeme zákazníka, který stojí před regálem. Musíme vytvořit matematický model zákazníka, což je poměrně složitá věc. Děláme to na základě dat, která dostaneme od našeho klienta. Řekněme, že má dva roky prodejních dat a víme, že třeba na prodejně v Přerově se 5. prosince prodalo deset kusů nějakého cukru, šestého to bylo dvanáct kusů. Díky tomu máme poměrně přesné rozložení toho, co, kde, kdy a jak.

V datech se skrývají informace o zákaznickém chování a my je dokážeme získat tím, že postupně odkrajujeme věci, které nesouvisí s cenou. Může to být senzitivita produktů, promo akce, kanibalizace produktů, vliv počasí a tisíce dalších vlivů. Jakmile toto odkrojíme, dole nám zbude statistický šum a z toho my poznáme, co reálně ovlivňuje pouze cena. A díky tomu zjistíme, jak se zákazník choval v kontextu dané ceny. Cena se v historii měnila, zákazník nějak reagoval, ostatní ceny se také měnily a zákazník opět reagoval.

To dohromady vytvoří velmi komplexní matematický model. Jde o obecně definovaný model, ze kterého vypadnou tisíce koeficientů, které ho dokáží nastavit. Model je unikátní pro každého zákazníka. Když bych něco takového dělal pro Tesco a pro Lidl, u každého to bude úplně jiné, protože jejich zákazníci i segmenty jsou jiné. Imunní to dokonce nebude pouze vůči konkrétní značce, ale i vůči prodejně. Zákazníci se chovají na různých prodejních místech jinak.

Jaká konkrétní data přímo souvisí s cenou?

Hlavní je zjistit cenovou elasticitu, což je klasický ekonomický pojem. Vypadá to jednoduše, ovšem problém je, že aby bylo možné nakreslit křivku, je třeba odfiltrovat vše nepotřebné. Ale opravdu zbude pouze čistá elasticita. To vysvětluje základní chování zákazníka ve vztahu k ceně.

Předpokládám, že se napojujete na ERP systémy vašich zákazníků. Čím vším se při nasání dat musíte „prohrabat“?

Ano, primárně jde o ERP. Jde o očekávaná data, jako jsou názvy produktů, kategorie, aktuální cena či nákupní cena, abychom viděli marži. Ale nejvíce zásadní jsou transakční data. Jednotlivé transakce či jejich agregace. Dostatečná doba jsou údaje za dva roky, díky čemuž se dají odfiltrovat sezónní vlivy a podobně. Jinak v agregované verzi pracujeme se stovkami milionů řádků. U jednoho řetězce to naposledy bylo asi 900 milionů řádků, které zpracováváme každý den. Nemusí se každý den zpracovávat nutně úplně vše, ale algoritmus se musí učit, takže je třeba reflektovat celou množinu.

Jiří Psota, Yieldigo
Autor: Yieldigo

Jiří Psota, Yieldigo

Na pozadí tedy máte neuronovou síť?

Je to tak, máme neuronovou síť a strojové učení. Vše jsme si museli udělat sami. Nástroje, které nabízí třeba Amazon, nestačí. Jejich AI komponenty jsou univerzální a jsou fajn na běžné věci, jako je identifikace obrázků a tak dále. Od základů jsme si tedy vymysleli postup, jak vše dělat. Technicky vzato samotné počítání děláme v R scriptu, což je matematicky velmi příjemné prostředí. Celé to běží v cloudu Azure. Původně jsme pracovali v AWS, ale Azure je výhodný z obchodního pohledu. Naši klienti jsou často velké nadnárodní firmy, které potřebují řadu certifikátů a podobných věcí a Microsoft v tomto více vychází vstříc. Je více „enterprise ready“ a je zde dobrý partner.

Počítáte to tradičně na GPU?

Kupodivu využíváme CPU. Výpočtů naráz máme poměrně hodně. Data natáhneme, rozsekáme si je po kategoriích, protože ceny mají smysl počítat vždy pro celou kategorii, což je ta granuralita, kde potřebujete vidět „overview“. Jednotlivé balíčky se pošlou do procesorových jednotek, což je dost škálovatelný systém, který se dokáže nafouknout podle toho, jak je fronta dlouhá. Podle toho se naškálují VM, na kterých to běží. Můžeme počítat na relativně velké serverové infrastruktuře. Spočítat věci pro jednoho klienta trvá v řádu dvou tří hodin – abychom analyzovali dva roky dat, vytvořili modely, nastavili optimální ceny a dohledali k nim řadu dalších věcí.

Zde bych odbočil. To, co nás primárně živí, je stanovování běžných cen. Nejsou to promo akce, ale běžné ceny, které obchodníkovi reálně vydělávají peníze. Kromě toho řešíme okrajové věci, jako je třeba „alerting“. Umíme projít data a na základě toho říci, kde jsou průšvihy a co je třeba opravit. Spousta velkých firem vůbec netuší, že má špatně zadané nákupní ceny, špatně nastavené marže, špatně propojené produkty do rodin. Rodina znamená, že máte třeba jogurt a jeho různé příchutě a chcete to mít pod jednou cenou.

Vypadnou tedy takovéto datové nedokonalosti. Problém je, že firmy mají spousty dat a neví, co s nimi. Jedna z věcí, kterou nabízíme, je něco, čemu říkáme „insights“. Cílem je manažerovi ukázat, co je třeba pět největších průšvihů, které, když se vyřeší, přinese to takový zisk a takovou úsporu. Snažíme se vést k lepším rozhodnutím a nahradit složitou manuální práci, kterou normálně dělají lidé. Snažíme se to nahradit technikou.

Jednou z otázek, které od firem dostáváme, je ta, zda jim nahradíme lidi. My jim říkáme, že se na to tak také dá koukat, že to umíme. Ale také se na to dá dívat tak, že lidem dáme lepší nástroje a ti lidé se mohou věnovat vytvářením strategie, vyjednávání podmínek a tak dále místo toho, aby se snažili analyzovat data, která člověk analyzovat nezvládne. Kombinací je příliš mnoho.

Zdá se tedy, že máte čím přispět do té nekonečné debaty z posledních let, zda nás nahradí umělá inteligence. Jde o reálnou věc, nebo jsou to „bullshity“ z konferencí?

Dnes každá firma říká, že má umělou inteligenci, to jsem slyšel tisíckrát. Když se s nimi pak bavím, většinou to znamená, že se něco používá v AWS nebo Azure, případně jde o nějaký jednoduchý algoritmus. Firem, které to dělají dobře, je strašně málo. Ale trend k AI spěje – ne k té obecné, ale k úzce zaměřené AI, tedy „narrow AI“. A to je to, co děláme my. Nesnažíme se vyřešit všechny problémy světa, ale nastavit neuronku a vyrobit modely tak, aby to vše v obchodech, drogériích či lékárnách bylo nejlepší na světě. A nastavit ceny tak, jak to nedokáže nikdo jiný.

Dá se skutečně to, co děláte, označit za AI, nebo jde spíše o stochastiku, teorii pravděpodobnosti, statistiku, …?

Na statistických modelech je to hodně založené. Ideově hodně vycházíme z toho, jak se dělá naceňování v aerolinkách. To je ostatně i náš znalostní „background“, to máme nastudované. Snažili jsme se postavit něco podobného, ale v retailu. Aerolinka se snaží vám do poslední chvíle prodat poslední místo za co nejvíce peněz. My potřebujeme dělat něco jiného, a sice aby se zákazník vracel a odcházel s dobrým pocitem a s tím, že mu cena dává smysl. Ale spojitosti tam jsou a matematické modely jsou podobné.

Využíváme tedy matematické modely, ale je to skutečně i o umělé inteligenci. Základní věcí, kterou potřebujeme řešit, je predikovat situace, které se ještě nestaly. Z dat dokážeme odvodit základní vzorce chování, ale také musíme fungovat v různých kombinacích, které ještě nenastaly a které neexistují.

Jiří Psota, Yieldigo
Autor: Yieldigo

Jiří Psota, Yieldigo

A druhým faktem, který potvrzuje, že máme AI, je to, že nejde zpětně dohledat, jak se algoritmus rozhodl či proč se tak rozhodl. Na to jsme samozřejmě museli reagovat. Když přijdete do konzervativní oblasti velkého retailu, kde tečou velké miliardy, a řeknete řediteli, že nevíte, jak daná cena vznikla, nejde o zprávu, kterou chce slyšet.

Ředitele AI v podstatě nezajímá a to, že rozhodnutí o tvorbě ceny nejde vysledovat, je pro něj problém. Museli jsme tedy vytvořit způsob, jak se k informacím zpětně dostat. Klasické dekomponování nejde, takže je třeba vyrobit indicie, které obchodníkovi řeknou, na základě jakých informací se AI rozhodla. Když vidí, že nějaký produkt má určitou míru senzitivity, kanibalizace, elasticity, už to začne dávat smysl.

Musí se postupovat opatrně. Chodíme za lidmi, kteří svoji práci dělají třeba dvacet let. Dělají ji dobře, ale těžko mohou soupeřit s neomezenou výpočetní kapacitou. Člověk dělá půlku věci od citu, ale nemá šanci vidět, že před půlrokem se na druhém konci Čech stala nějaká situace, kterou reflektuje situace, jenž se mu tady na trhu začíná teprve projevovat. AI si pro to sáhne a provede potřebné simulace, to člověk nedokáže.

Dala by se najít nějaká paralela mezi tím, co děláte vy, a tím, jak funguje vysokofrekvenční trading na burzách a co dělají „kvantové“ počítače na Wall Street či v City? Tedy, že z velké části obchodují stroje a člověk do toho zasahuje?

Paralela tam je, ale burzy jsou o co nejrychlejší reakci a co nejrychlejším vyhodnocení. U nás je to spíše o vyhodnocení a nalezení ceny, která bude mít delší platnost. My můžeme každý den dodat dvacet tisíc optimálních cen. Jenže pak by pořád někdo musel chodit po obchodě a neustále na regály lepit nové cenovky. To jsou obří náklady a lidské zdroje. To, co děláme my, je to, že obchodníkovi řekneme, aby si nechal stávající proces a ať si nadále mění pět deset procent cen týdně. Ale my musíme těch pět deset procent cen najít a určit, které budou mít největší dopad.

Když se ve vašem kontextu podíváte na projekty typu Amazon Go, což je bezobslužný obchod řízený formou umělé inteligence, cloudem a senzory, může to být budoucnost retailu?

Může to tak být, byť Amazon Go je krásná předváděčka, ale dostat to do širší praxe bude trvat dlouho. Odvolám se zde na Gartner, který vnímá jako jeden z největších trendů personalizovaný „real time pricing“. To se více a více dostává do kamenných obchodů. Jde o to vyřešit, jak zákazníkům prezentovat jejich vlastní cenu. Zde ještě bude třeba pár let vývoje. Je také třeba řešit to, že lidé špatně vnímají fakt, když by se jim cenovka měla měnit během doby nákupu. Spíše se jde cestou, kdy se personalizovaná nabídka dá vědět předem.

My pracujeme na konceptu s firmou Visa, kde prodejce může snížit plošné promo akce a může oslovovat konkrétní zákazníky tak, že si mohou v jakémkoliv obchodě koupit něco od konkrétní značky a při platbě kartou automaticky dostanou „cash back“ bez toho, aniž by bylo třeba někomu cokoliv hlásit, a stane se to samo. Nejsme jediní, kdo podobné věci řeší.

Nemá smysl se do budoucna zaměřovat spíše na e-commerce než běžný retail?

Zvládáme obojí. Zároveň je běžný retail stále mnohonásobně větší. Náš nejmenší velký retailový hráč je pořád větší než Alza, která je u nás e-commerce králem. Je jasné, že e-commerce bude růst. V USA naposledy rostl o 16 procent, v Evropě o 11 procent. Ale také lze očekávat dobu, kdy začne saturace trhu a kdy se to zastaví. Je to vidět i v tom, jak Amazon koupil Whole Foods a jak se snaží proniknout do kamenných obchodů. Dává tedy smysl dělat obojí. Kdybychom měli Sofiinu volbu, budeme se věnovat retailu, který je násobně větší.

Jiří Psota, Yieldigo
Autor: Yieldigo

Jiří Psota, Yieldigo

Kde skladujete a zpracováváte data, která si od zákazníků stáhnete? Někde v Hadoopu?

Samotné uložení na konci je v něčem jako Hadoop, formát je Parquet. Je to sloupcová databáze, která je ideální na velké počty transakcí, nad kterými je třeba dělat agregaci a paralelní zpracování. Importovací části jsme si museli vyvinout sami. Dat je hodně a je třeba je kontrolovat, očistit, řešit problémy. Data jsou zpravidla plná chyb. Zatím jsme nepotkali žádného klienta, který by měl data úplně v pořádku. To z principu asi ani nejde.

Vytvořili jsme si importér, který z klasických dat, což jsou běžná data, která dokáží obchodníci „vylít“, což si lze představit jako CSV, či při sáhnutí do Keboola Connection, zvládne transformaci do data framů a do Parquetů a nad tím už se dělají další operace. Uložené je to v cloudu a tam je Data Lake. Do velké míry využíváme in-memory zpracování, ale je třeba ho dělat po blocích, protože dat je opravdu hodně.

Jak dlouho trvá implementace?

To, co vždy potřebujeme, aby nám zákazník dokázal „vylít“ transakční data. Je nám více méně jedno, v čem to „vylijí“, ale prakticky všichni to zvládnou v CSV souborech. Máme poměrně lehce konfigurovatelný „parser“, takže garantujeme, že implementaci stihneme do šesti týdnů. Zpravidla to stihneme za dva týdny.

To, co na tom všem trvá nejdéle, je obchodní dohoda a přesvědčit klienta, ať do toho jde. Je to pro něj něco nového. Samozřejmě čím dál více slyší o tom, že se cenotvorba řeší pomocí umělé inteligence, ale je to strašně mladý obor. Takže se rok s někým bavíme a domlouváme detaily a pak to do šesti týdnů zprovozníme.

Dokážete zákazníkům garantovat, že jim zvýšíte zisk?

Ano. To je to, co nás prodává a kde jsme světová špička. Garantujeme navýšení zisku o pět procent a více. U některých segmentů se dostáváme někam k 15 procentům. Nejvíce se nám daří v lékárnách.

Řekněme, že všechny retaily světa nasadí vaši technologii. Co je pak bude odlišovat?

Stále fungujeme v rámci strategie daného zákazníka, a to je pořád jedinečné. Neřídíme se tím, že bychom sledovali ceny konkurence a ty se snažili podstřelovat. My „utilizujeme“ zákazníky, kteří už do obchodu přišli. Pak nastavujeme ceny, aby si toho zákazník ideálně nakoupil více, nebo v lepším rozložení. Nemyslím si tedy, že je zde prostor pro nějakou šílenou spirálu. Přirovnávám to k Formuli 1. Tam mají všichni skoro stejný vůz, ale liší se to pak v nastavení a pilotovi.

Přidanou hodnotou obchodu tedy bude strategie, vize a opět člověk?

Ano, tohle pomůže člověku s věcmi, na které je krátký, ale jeho um bude nadále potřeba. O tom obchod vždy byl. Sortiment za obchodníka také nevybereme my, byť mu umíme říci, který je zbytečný. Můžete třeba zjistit, že prodáváte pět druhů mléka, a když se jeden druh přestane prodávat, ostatní se začnou prodávat o něco více a celkově na tom začnete o něco více vydělávat. Jde o přílišnou kanibalizaci a zároveň špatnou marži.

Jak řešíte ceny, které si účtujete? Naceňování SaaS aplikace je často docela věda.

Prošli jsme si dlouhou iterací toho, jak správně naceňovat. Nejlepší způsob, u kterého jsme skončili, je to, že se na začátku v rámci „trialu“ změří, kolik to zákazníkovi přinese peněz. Pak si nastavíme měsíční pevný poplatek. Dalo by se to přirovnat k „success fee“, ale není to dynamické. Řádově si saháme na dvacet až třicet procent z peněz, které zákazníkovi přineseme.

Budete chtít dělat skutečně globální byznys?

Už jsme celkem začali. Postupně otevíráme nové země, snažíme se angažovat třeba ve Velké Británii nebo Německu. Otevřeli jsme Rusko, Polsko, Austrálii, velký zájem cítíme z Blízkého východu. To, co děláme, je funkční kdekoliv a díky cloudu to také kdekoliv můžeme nasadit.

Takže je reálné, že relativně malá česká firma bude jednoho dne dodávat systém třeba do Walmartu nebo 7-Eleven?

Walmart, to je tedy skutečně velké, ale opravdu se bavíme s největšími evropskými hráči, a to zcela seriózně. Máme problém v tom, že prakticky žádný náš klient nechce, aby se o něm vědělo, že používáme AI na cenotvorbu. Postup je často takový, že to velký hráč chce nejdříve zkusit v nějaké menší zemi a pak se to postupně rozšiřuje. V Rusku děláme s hráči, kteří mají tisíce obchodů, v Polsku se bavíme s jedničkou na trhu, která má pod sebou několik řetězců. Podařilo se nám spojit s obřími hráči (Nielsen a Diebold Nixdorf) a snažíme se postupovat společně.

Druhým kanálem jsou odborné konference, kde se angažujeme a kde potkáváme lidi. Často se nám stává, že něco uděláme v jedné zemi a postupně se dostaneme i do poboček v dalších v zemích. Také rozšiřujeme obchodní tým o hodně zkušené lidi – přišel třeba Jonathan Smith, který vedl Marks & Spencer ve střední Evropě. Ti nám dávají nadhled, který jako mladá firma nemáme.

fin19-tip-applepay

Potřebujete nějakou zásadní doménovou znalost, abyste se zákazníky mohli pracovat?

Potřebujeme poměrně velkou znalost, která ale není tolik navázaná na doménu, jako spíše na cenotvorbu. Nejsme experti pouze na matematiku, ale také na „pricing“. Jeden z našich klíčových lidí přišel například z Metro AG, kde „pricing“ řešil. Tito lidé nám donesli část know-how a rozšířili naše matematické zázemí.