Hlavní navigace

Filip Doušek (Stories): Náš šelmostroj v datech najde, na co se soustředit

26. 9. 2016
Doba čtení: 9 minut

Sdílet

 Autor: Jan Sedlák
Český startup, zainvestovaný v seedu 15 miliony korun, prohrabává firemní data a hledá v nich užitečná doporučení.

Mladá společnost Stories koncem srpna oznámila investici ve výši 15 milionů korun od firmy Logio, která si výměnou vzala podíl ve výši 12,5 procenta. Filip Doušek, jeden ze tří zakladatelů, který v minulosti mimo jiné nasazoval SAP v zahraničí a napsal knihu, v rozhovoru pro Lupu mluví o tom, jak nový český nástroj umožňuje prohledávat a skládat firemní data či o potřebě rychlého financování a růstu SaaS firem.

Co je to Stories? Bez pitchovacích frází.

Řešíme problém komplexity ve firmách. S Peterem Fedoročkem a Vojtou Ročkem jsme prošli několika lety business intelligence (BI) a analytiky, zažili jsme současnou vlnu velkých data a zažili jsme, co se ve firmách děje, když mají s daty pracovat. Hlavní problém, který u nich vždy nastane, je to, že velmi rychle začínají být zahlcené. Najednou mají tolik informací, že to ty firmy bolí. Bolí to analytické oddělení, obchodního ředitele, generální ředitele, ajťáky. My přicházíme v tu chvíli, kdy už firma nějak s daty pracuje a má jich tolik, že se v nich přestává vyznávat a začínají ji zpomalovat.

Přijdeme s naším základem, který jsme psali poslední rok a kterému říkáme šelmostroj. Ten vezme balík dat a analyzuje, co se v něm děje důležitého. V podstatě z velkého množství dat vybere top 10 toho, na co by se firma v dalším období měla soustředit. U firem, se kterými nyní spolupracujeme, se třeba za noc podíváme na milion různých úhlů v jejich prodejních datech a z toho určíme několik nejdůležitějších věcí. Ale tam to nekončí, dále pak umožňujeme s daným problémem pracovat. To znamená, že jsou zde role, a BI konečně začíná vést k akcím. Tradiční BI nevede k akci, tam se přehrabuješ v datech a díváš se, co by tě tak mohlo zajímat.

Co přesně znamená, že už firma nějaká data má a nějak s nimi pracuje?

Orientujeme se zejména na střední a velké firmy. Těmto firmám identifikujeme, jaké jsou na jejich trzích největší příležitosti, a umožňujeme jim je vytěžovat. A tyto firmy už většinou mají nějakou rozumnou datovou platformu. 

Často běží na SAPu, mají datové sklady, mají BI. Jenom je opravdu těžké z toho obrovského množství dat dostat nějaký smysl. Tomu se říká třeba data lake a data swamp. Spousty dat, ale je velice těžké říci, co z nich vytáhnout.

Vaši technologii je možné nasadit na cokoliv, co ve firmě najdete? Je vám jedno, jestli jsou data v Teradatě, Oraclu, či v čemkoliv jiném?

Přesně tak, to je nám úplně jedno.

Filip Doušek, Stories
Autor: Jan Sedlák

Filip Doušek, Stories

Jak probíhá nasazování?

S firmou vybereme oblasti, na které se nejvíce soustředit. Jdeme přímo po mase, musí to přinést co největší obchodní efekt. Vezmeme informace, které firmami létají, a protože máme připravený oborový obsah, systém nakonfigurujeme během dvou, tří dnů.

To jsou nějaké algoritmy? Píšete je na klíč, nebo jsou univerzální?

Vyvíjeli jsme to tak, abychom na velmi vysoké úrovni říkali, co ten byznys zajímá, a k tomu máme napsány sady algoritmů, které v datech hledají takzvané patterny (vzory), které hypotézám odpovídají. Analytická část funguje jako takový „datový antivirus“.

Používáte pro další učení postupy machine learning?

Jasně. Zajímá nás, co firmy s daty dělají, a sledujeme, co na ně pak říkají – tohle je pro nás důležité: tohle je samozřejmost, tohle už mi nehlas. Nad tímhle vším rozvíjíme nějaký ten machine learning.

A systém se učí jenom v rámci dané firmy, nebo provádíte nějaké sjednocování od více zákazníků? Je tam něco jako „kolektivní inteligence“?

Přesně tak, je to kolektivní. Každá firma může využít tu chytrost, kterou se naučila na jiných.

A nejsou na místě obavy, že se data posílají z firem ven?

To je s každým cloudem a každým machine learningem. Jsme primárně cloudová služba, ale tam, kde je něco takového neprůchodné, je možné naší technologii nasadit on-premise přímo u zákazníka. Algoritmické jádro se dá nasazovat v kontejnerech, v Dockeru, Cloud Foundry a podobně. A jinak je samozřejmostí, že machine learning je zcela anonymizovaný. A navíc se přístup ke cloudu v myšlení posouvá. Dnes jsou cloudová úložiště bezpečnější než on-premise.

Jak je to s technickým nasazením? Běžíte v cloudu, takže přes nějaká API, konektory?

Ano, je to živé spojení. U některých dat má aktualizace smysl denně, jinde týdně, někdy i měsíčně. Jinak je třeba spolupracovat lidmi, kteří se ve firmách o ty systémy starají. U takových projektů jsme byli mnohokrát. Já třeba vím, co dělat se SAPovskými věcmi, že potřebuju někoho na tři dny, aby mi naklikal export dat. Pak už to běží. Nastavení je otázkou jednotek dní. V enterprise IT je řada firem, které mají dlouhé nasazovací doby a vlastně prodávají implementaci. My ne.

Každopádně se pouštíte do enterprise IT, kde jsou hodně silní a velcí hráči…

A v tom já se cítím jistě. Během ročního vývoje jsme v týmu měli více matematiků než vývojářů. Neděláme jednoduchý kód. Řešíme, jak se problém komplexnosti dá řešit principiálně. V té celé oblasti před sebou vidíme obrovské příležitosti, které jedna firma nedokáže pokrýt a vytěžit. Všichni směřujeme k větší komplexitě a budeme potřebovat nástroje, jak s ní pracovat. To, že my děláme jeden z těchto nástrojů, nebere prostor všem ostatním. Budu jenom rád, když se tohle pole bude zvětšovat a bude se na něj upírat více pozornosti.

Máte už nějaké zákazníky?

Máme, dokonce už firmy dáváme do pořadníku. A to jsme asi měsíc od oznámení. Zájem je, firmy se ozývají samy, případně přes první partnery. Dobré je, že zájem přichází ze správných pozic, od generálních, obchodních a finančních ředitelů. Cítím, že tam jsme se trefili do reálného problému.

Jak máte nastavené ceny?

Cenový model skládáme dohromady. Cena bude závislá na několika faktorech, primární je počet uživatelů. Počáteční ceny budou v desítkách tisíc za měsíc. S prvními zákazníky ceny přesně ladíme. Cena bude růst s počtem uživatelů a počtem zpracovávaných dat. Objemy dat, které některé firmy mají, jsou skutečně obří, a to už znamená nějaké nároky.

Dá se nějak přiblížit, zobecnit, zprůměrovat, kolik vám takový zákazník třeba měsíčně bude na zpracování posílat dat? Pro představu.

Jsou to gigabajty. Postupně to budeme škálovat, takže řádově desítky gigabajtů a výše. Není problém algoritmicky zpracovat hromady dat, ale pak je prezentovat. De facto se potřebujeme vejít na jednu obrazovku. Problém není analýza, ale syntéza. A tam děláme hodně práce. V tuto chvíli nechceme větší objemy, než jsou jednotky gigabajtů. Takové objemy nám teď chodí i od velkých firem. Řádově gigabajty jsou relevantní pro Česko. Pak nás zajímají třeba data z poboček nadnárodních firem, tam to bude vyšší a zajímavé.

Na jakém cloudu běžíte? A jaké technologie využíváte?

Cloud je Amazon Web Services. Je to slušný mix. Jádro je napsáno v Pythonu a Pandasu, což je knihovna vyvinutá na analýzu finančních dat a algoritmické obchodování. Analytika nám běží v Dockeru, databázi máme několik, pracujeme s MongoDB, PostgreSQL, používáme graphové databáze, jako třeba Neo4j. Pak je tam RabbitMQ, microservices a další. Výpočty jsou paralelizovány.

Mluvil jsi o partnerech, o koho jde?

Náš velký partner je firma Logio. To je fajn partner i investor. Rozumí našemu byznysu. O investici jsme mluvili s více subjekty a byl velmi vidět rozdíl mezi těmi, kteří se s business intelligence setkali a pro které je BI jenom jedna z možností, do které investovat. S Logiem to šlo velmi rychle, mají reálné zákazníky, u kterých vidím problémy, které my řešíme. Logio je vedle role investora také výborný obchodní partner. Napojujeme se i na jejich databázi zákazníků.

Chcete do budoucna více partnerů? Třeba integrátory, kteří vás zahrnou do balíčku nějaké větší IT implementace?

Rozhodně, to je jeden ze směrů. Je řada firem, které chtějí svým zákazníkům dávat služby nad zpracováním dat, a tam my můžeme hrát dobrou roli. Navíc se v podstatě netlučeme s žádným současným BI nástrojem, takže můžeme být další zajímavý nástroj, který lze nasazovat.

Jak jste došli zrovna k investici ve výši 15 milionů korun za podíl 12,5 procenta?

Věděli jsme, kolik peněz potřebujeme, aby to změnilo naší situaci. Věděli jsme, s jakou částí podílu se chceme v seedu rozloučit. A hledali jsme investora, který v nás uvidí hodnotu.

Máte v plánu brát další peníze?

Ano, to máme. Další kola očekáváme. Zejména z toho důvodu, že v technologickém světě je vývoj opravdu ultrarychlý. Software jako služba (SaaS) se možná ještě před deseti lety dal rozvíjet s menším kapitálem a z postupného růstu tržeb a dalo se strávit pět let tím, že se dostáváš na trh. Dnes už to nejde, vlak příležitosti ti ujede.

Takže chcete, podobně jako řada dnešních dalších nejenom SaaS firem, rychle obsazovat trh za peníze investorů?

Ano. Můžeme jít pomalou cestou, a i to může být nějaká naše možná budoucnost – my se uživíme, tím jsem si dost jistý. Ale chceme jít rychleji, šlápnout na plyn. Jít za hranice. Rychlosti pomáhají i technologie. SaaS firmy vyrostlé v posledních čtyřech letech rostou rychle i díky tomu, že staví na technologiích, které se dobře škálují.

Zakladatelé Stories (zleva): Vojtěch Roček, Filip Doušek, Peter Fedoročko
Autor: Stories

Zakladatelé Stories (zleva): Vojtěch Roček, Filip Doušek, Peter Fedoročko

Tento model rychlého růstu z investic je dnes dost běžný. Ale pak se na ty SaaS firmy podíváš a po letech fungování a růstu stále nevykazují zisk, naopak. Třeba Socialbakers mají akumulovanou ztrátu půl miliardy. Je tento model správný? Nebo je to stavba firmy na exit, prodej, zhodnocení peněz investorů?

To je zajímavá ekonomická otázka. Tradičně se kladl důraz na peníze v bance. Dnes je tato metrika prostě příliš pomalá. Firma, která velmi rychle nabírá zákazníky, která v řadě oblastí rychle roste, bude ztrátová, protože musí nabírat lidi. Růst je mnohem rychlejší než cash flow. Můžeš se ptát, jestli je to stále hmatatelný byznys. Odpověď je méně jednoznačná, než když počítáš peníze v bance. Když se budeš dívat jenom na výsledovku, v dnešním technologickém světě budeš příliš opatrný.

Pro nás v několika následujících letech není úplně důležitý hospodářský výsledek, ale validace konceptu. Když validovaný bude, můžeme škálovat ve velkých rozměrech.

V minulosti jsi nasazoval SAP a byl blízko datovým projektům. Často ses mi zmiňoval, že české firmy ještě nejsou na práci s daty připraveny, že ty možnosti nevidí. Změnilo se to tedy už?

Posun tam je. Když firmy prošly nějakým datovým projektem, hodně je to bolelo, ale ve výsledku se posunuly. Teď ví, že tohle je ta cesta, ve které musí pokračovat, a hledají další zajímavé nástroje.

Vnímají manažeři tyto věci spojené s IT jako jednu z priorit, které se musí věnovat? Nebo je IT pořád jenom nutné zlo, servisní jednotka?

Na straně výkonných ředitelů by to mělo jít mnohem dále. Jsou někteří osvícení, ale spousta z nich tuto stránku stále nechává na někom jiném. CEO musí dát jasný signál, že toto je jasná cesta, kudy jít. Jen máloco dnes firmám může přinést takové zvýšení výkonnosti, jako jsou data. Ve firmách už existují datoví pionýři a ti to téma tlačí, ale chce to jít ještě o patro, dvě výš.

UX DAy - tip 2

O big data, analýzách a věcech kolem slýcháme už několik posledních let, IT byznys to tlačí jako velké téma. Reálných nasazení už ale zase tolik nevidíme. Čím to je?

Já bych nesouhlasil. Myslím, že tyto věci vídáme, respektive v dílčích oblastech. Třeba náš investor Logio má desítky zákazníků, kteří díky těmto datovým věcem zvyšují výkonnost logistiky o desítky procent. To, co nevídáme, že by se takové věci děly na strategické úrovni. Na operativní ano, tam už big data mají úspěchy. Ale ještě moc nevystupují CEO, že by posunul firemní kulturu směrem k datům. Ale to už jsme zpět u předchozí otázky.

Byl pro vás článek přínosný?

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).