Hlavní navigace

Michal Hrabí (Phonexia): Uvedení na seznamu WikiLeaks nám v byznysu pomohlo

Autor: Phonexia
Jan Sedlák

Technologie z Brna umí rozpoznávat a analyzovat řeč a dnes ji používají zejména bezpečnostní složky. Phonexia ale chce proniknout i do jiných oblastí.

Brněnská společnost Phonexia vzešla z univerzitního výzkumu rozpoznávání řeči a úspěch má zejména u bezpečnostních služeb, které chtějí pomocí této technologie řešit kriminální případy. Hlasová interakce nicméně v posledních letech rychle proniká i do dalších oblastí a Phonexia chce být u toho. Obměnila vedení a chce využít potenciál svých technologií i v obchodě.

Výkonným ředitelem se stal Michal Hrabí, který dříve šéfoval programu StarCube v rámci Jihomoravského inovačního centra. Hrabí v rozhovoru pro Lupu mluví o dalších plánech nebo o tom, jak firmě pomohlo uvedení na seznamu WikiLeaks.

Phonexia tě najala jako výkonného ředitele, personálních změn ve firmě ale bylo několik. Co za těmito změnami stojí?

Změna ve vedení firmy je nejvíce viditelná, je ale řada věcí, které se děly v pozadí. Phonexia teď v březnu měla 11 let od vzniku. Nejdříve fungovala jako taková akademická firma hodně spolupracující s univerzitou. Složení firmy bylo hodně let podobné. Šlo o lidi nadšené do technologií a analýzy řeči. V posledních letech začala poptávka po tom, co děláme, společnost se začala zvětšovat a dělat nové produkty. V té fázi jsem byl najatý já, byl jsem provozním ředitelem. Spoluzakladatel a výkonný ředitel Petr Schwarz zároveň už neměl tolik času posouvat technologie v rozpoznávání řeči dopředu a zbytek týmu ve vývoji ho potřeboval. Došlo se k tomu, že bych funkci šéfa mohl zvládat já.

Takže je to model, který se u technologických firem občas objevuje – že zakladatelé chtějí dělat spíše produkt než denní provoz?

Co já vím, tak Petr se vždy chtěl věnovat spíše technologiím a ředitele dělal, protože to dříve nikdo nechtěl dělat, a on s tím zároveň měl nejmenší problém. Někdo tu cedulku mít musel.

Michal Hrabí, Phonexia
Autor: Phonexia

Michal Hrabí, Phonexia

Mají tyto změny na firmu nějaké výrazné konkrétní obchodní dopady?

Obrat nám vzrostl, ale nemyslím si, že by se v tom nějak masivně stihlo projevit moje jmenování. Mohlo se v tom projevit to, že jsem předtím byl provozním ředitelem. V té době jsem začal najímat jiné lidi, než jaké firma do té doby najímala. Hodně lidí s velkými zkušenostmi odjinud. Máme zde například bývalého obchodního ředitele Kentico Software (náš článek), máme také člověka, co v AVG programoval licenční server a u nás teď dělá šéfa IT a vývoje interních systémů. Máme rovněž člověka, který je mistr Evropy v robotickém fotbalu (smích). Firma našetřila nějaké peníze, nemáme investora, a bylo možné trochu zariskovat a najmout lidi, kteří nejsou úplně nejlevnější. Do firmy přišlo hodně nových znalostí a už se to začalo projevovat.

Jak jste na tom nyní z pohledu finančních výsledků?

Mezi roky 2015 a 2016 jsme v tržbách rostli zhruba o 42 procent. Letos plánujeme obdobný růst, pravděpodobně ještě o něco větší. Takové tempo je určitě nadále udržitelné. Spíše si dokonce myslím, že toto je ještě taková pomalejší fáze. Lidi, které jsem najímal, do toho šli i kvůli této výzvě, vybudovat z Brna globální technologickou firmu. Z Brna vyvíjíme vlastní unikátní technologii a díky tomu budeme schopní slušně růst.

Jinak tedy v roce 2015 jsme měli tržby 18 milionů, plus také něco z grantů. Ale když se bavím o růstu, mluvím o tom, co jsme vydělali komerčně. V roce 2016 byly tržby 26 milionů a letos plánujeme ke 40 milionům.

Jaký podíl máte na světovém trhu?

Zatím zanedbatelný. To nejsou ani procenta. Když si to rozložíme na různé podtrhy, někde by to procenta mohla být. Ale není to zatím moc. Nejsme velký hráč. Je zde Nuance, která to luxuje, pak je zde firma Agnitio, úspěšná v hlasové biometrii, kterou Nuance koupila. My jsme v biometrii jakási trojka, respektive dvojka. V technologickém smyslu. Teď jde o to umět vše prodat. I proto kluci cítili, že je nějaký limit, co lze v daném rozložení dosáhnout, a že je třeba všemu dát novou energii. I proto ty personální a další změny. Posouváme technologické bariéry a ruku v ruce s tím teď musí jít obchod. Nebudeme nějaká super známá firma pro běžné zákazníky, ale budeme v Česku někdo, kdo dělá technologicky skutečně něco zajímavého a původního. A ne jenom kompilát existujících věcí.

Michal Hrabí, Phonexia
Autor: Phonexia

Michal Hrabí, Phonexia

A když vás Nuance bude chtít také koupit, tak se necháte?

Všechno je otázkou nabídky (smích). Nuance má akviziční politiku, koupili hodně firem, apetit mají veliký. Drtivá většina firem pak po akvizici zmizela. Známe se, víme o sobě, ale jsme pro ně moc malí. Pokud jim v budoucnu více budeme brát obchody a podobně, je možné, že s nějakou nabídkou přijdou. Ale aktuálně není plán firmu prodávat. Chceme v Brně vybudovat něco, z čeho si ve světě sednou na zadek.

A rozvoj tedy platíte kompletně z toho, co si vyděláte?

Ano. A i kdyby teď někdo s investicí přišel, nemáme moc kam peníze vložit. Vždy je nějaká fáze vývoje. Spíše potřebujeme lidi, zaplatit je umíme. Chceme ty nejlepší, a to je na dlouho.

Jak velký může být trh, na který míříte?

Je obrovský. Poskytujeme technologickou platformu, která umožňuje podnikat v různých oblastech. Může pomoci v IoT, při zkvalitňování služeb v call centrech, pomáhat při prokazování viny v kriminalistických ústavech. Každý z těchto trhů má nějakou velikost a dynamiku. Teď jsme největší v bezpečnostním segmentu, tam děláme většinu tržeb. Tento trh neustále roste, ale neporoste raketově. Spíše bojujeme, abychom z něj ukousli větší část koláče na úkor někoho jiného. Daleko větší růst očekáváme v komerčním segmentu, jako jsou banky, call centra, smart home a podobně.

Určitě už ses setkal se stroji jako Amazon Echo nebo Google Home. My děláme přepis řeči včetně identifikace mluvčího. S našimi technologiemi může firma, která vyrábí něco nad Google Home, postavit i věci, jako jsou oprávnění. Když třeba někdo doma může nakupovat a chce tak činit přes hlasového asistenta, náš systém pozná podle hlasu identitu. Tyto věci jde použít pro další aktivity, hlasové zadávání k vytápění a tak dále. Jsem přesvědčen, že Google či Amazon takové věci někdy dodají (do Home čerstvě tato funkce dorazila – poznámka redakce), my jsme schopní to dělat teď. A máme na to zákazníky.

O vizi ovládání hlasem se mluví už nějakou dobu, i v herních konzolích a podobně. Ale zatím to nevypadá na nějaký mega úspěch. Je to tedy něco, k čemu se chcete hodně upínat, nebo spíše k firemním zákazníkům?

B2B segment jedeme přes partnery. Máme pilotní projekty s velkými firmami z automobilového průmyslu, elektrotechniky, vybavení domácností. Tyto firmy cítí, že pokud nebudou schopné jako alternativu nabídnout hlasové rozhraní, může jim ujet vlak. Já osobně to vidím tak, že dříve jsme měli klávesnici a myš, dnes je velký pokrok v dotykových obrazovkách, ale daleko přirozenější je mluvení. To je něco, co není využité. Informace v řeči z drtivé většiny nejsou využité. Můžeme se bavit o desítkách scénářů, kde toto lze využít.

Michal Hrabí, Phonexia
Autor: Phonexia

Michal Hrabí, Phonexia

Existuje reálná šance, že byste se jako jeden z dodavatelů dostali třeba i do přístrojů od Amazonu a Googlu?

Pro firmy jsou nejdůležitější jazyky jako angličtina, španělština. Je řada firem, které chtějí na trh, kde je Amazon, ale chybí jim komponenty či jazyky, které máme my. Hlasová interakce rozhodně nebude všelék, na ulici ne každý bude chtít mluvit do telefonu. Ale řada věcí už se posouvá. Google měl studii, kdy ukazoval, že asi 20 procent hledání už je přes hlas. Řada hlasových vyhledávání, která testoval Seznam, je přes nás.

Když jsem byl letos v lednu na CESu, udivilo mě, že skoro všechno v sobě mělo právě digitální asistentku Alexa od Amazonu. To už trochu vypadá na „hype“, když se mnou hlasem chce komunikovat i zubní kartáček.

My pro nás vidíme stabilitu v bezpečnostním segmentu. Organizovaný zločin, prokazování viny, forenzní analýza. Když někdo zavolá, že je někde bomba, lze prokázat, že to mluvil daný člověk, a tak dále. To jsou oblasti, které bohužel společně se zhoršující se bezpečnostní situací narůstají. To je ten trh, který neporoste moc, ale poroste. Tam jsme stále technologicky dost na špici. Máme mezi zákazníky řadu bezpečnostních složek, bohužel je nemohu jmenovat. Je to zajímavý trh, ale ne na to, aby Phonexia byla desetinásobná.

Do budoucna ale může být zajímavý růst hlavně v oblasti firem. Ty mají mraky nahrávek, které nejsou analyzovány. Typicky v zákaznických centrech. Progresivní firmy chtějí vědět, co se děje, A/B testovat, rychle reagovat. Tady pomáhá automatizovaný přepis hovorů do textu.

Michal Hrabí, Phonexia
Autor: Phonexia

Michal Hrabí, Phonexia

Česká pojišťovna teď zrovna shodou okolností spustila systém EMMA, který je postavený na Watsonovi od IBM a přesně toto dělá. Má to s vámi nějakou souvislost?

V podobných zakázkách figuruje řada dodavatelů. My jsme jedním z dodavatelů, který přepisuje řeč na text. Firmy, jako jsou IBM, pak dělají analytiku nad přepisy, které my vytváříme. Nemohu komentovat konkrétně tento příklad, ale obecně fungujeme na takovéto partnerské bázi.

Teď máme například jednoho partnera ve Spojených státech. Ten má obrovského zákazníka, dalo by se to přirovnat k našemu O2. Tento zákazník má obří call centrum, které je postaveno na textu – chaty, Facebook a podobně. A tento náš partner začal tomuto telco zákazníkovi nabízet textovou analytiku nad všemi zdroji. Většina komunikace ale stále probíhá přes telefon a tam je třeba to také řešit. Pracují na tom s námi a jsou schopní dostávat další metadata, jako jsou věk volajících, pohlaví, nářečí. Toto potřebuje spousta firem. Firmy, které dělají pro zákazníky textovou analytiku, nyní narážejí na potřebu dělat to i s telefony. Dodavatelů řečových technologií je pouze několik.

Jaké třeba?

Obří firmou je právě Nuance. Ta ti poskytne super servis a všechno, ale platíš si tryskáč. Ale ten není potřeba všude. Někde stačí auto, a to jsme my.

Vy jste taková škodovka.

Jsme taková kvalitní škodovka, řekněme oktávka s velmi dobrou výbavou, aspirující na superb. Nejsme předražená věc, která funguje pouze jednoúčelově. Máme ambice být preferovaný poskytovatel řečových technologií z Evropy. Kromě Antarktidy jsme na všech kontinentech. Prodáváme hlavně do ciziny.

Kolik z vašeho obratu dělají bezpečnostní zákazníci?

Je to více než polovina. Je předpoklad, že se to během roku a půl může vyrovnat, a pak by měla převažovat komerční sekce.

Jaká nejčastější řešení tam vedle call center najdete?

Hodně se řeší „fraud detection“. Takže hodně banky a finanční instituce. Trh je zde ještě nezralý a jsou zde nerealistická očekávání. Ale vyvíjí se.

Na jakou přesnost detekce jste schopní se dostat?

Dostáváme se na 99,99 procenta. Tam není problém, vzorek ale musí být několik vteřin dlouhý, nelze mít pouze jednu slabiku. Dělali jsme machine learning ještě dávno předtím, než se z toho stal buzz word. Máme neuronovou síť a tak dále. Teď do produkce nasazujeme jednostavové modely.

Co je dnes v nasazování těchto technologií populárnější? Cloud, nebo tradiční on-premise instalace?

Zatím stále on-premise, ve Státech už ovšem cloud. Tam je on-premise zase tolik nezajímá, i když někteří zákazníci se k tomu vracejí. My jsme vyrostli na on-premise a pak přešli i na cloud. Někteří konkurenti on-premise nemají, zde tedy máme výhodu. Cloud děláme tak, že umíme udělat instalaci do různých cloudů, které zákazníci používají. My nemáme zájem provozovat vlastní službu. Na to máme jiného partnera, který chce naše nástroje zabalit do něčeho, nad čím bude fungovat čistě vývojářské rozhraní. Tento produkt se dokončuje.

O podobné věci se snaží i cloudy od Microsoftu, Googlu či Amazonu – nabídnout v cloudu také nástroje pro práci s řečí a tak dále. To je partner z takto velkého ranku?

Je to menší firma. Není to cloudový provider. Je to software house.

Tým Phonexia
Autor: Phonexia

Tým Phonexia

Kdo v celé oblasti nejvíce edukuje trh?

Je to Nuance. V poslední době to ale také začíná jít přes koncové služby jako Siri, Cortana a Alexa. Ve firmách si pak všímají, že by podobný typ technologií šlo nasadit i tam. Do edukce šlapou Amazon s Googlem. Ale je to nic ve srovnání s tím, co do toho dala Nuance. V oblasti bezpečnostních zákazníků ví i o nás asi každý.

Kolik českých bezpečnostních složek vás používá?

Spíš je otázka, kdo nás nepoužívá. Zdejší trh máme hodně obsazený.

Před časem jste se právě v návaznosti na spolupráci s bezpečnostními složkami poněkud zvláštně objevili i ve WikiLeaks. Má to na vás nějaký vliv?

To nám reálně přineslo byznys, protože si bezpečáci uvědomili, že je tady nějaký dodavatel, který je zajímavý. I když důvod, proč jsme se ve WikiLeaks objevili, byl obskurní. Náš CTO jel na konferenci, kam přijel člověk ještě předtím, než byla založena WikiLeaks, a všechny lidi, kteří na konferenci přednášeli, udal na nějaký seznam. Ale nám to vlastně nevadí, protože nás díky tomu kontaktovala řada policistů a podobně. Děláme pro zákonné odposlechy. Buď bude policista v nějaké kauze sedět celé týdny u nahrávek, nebo má automatizovaný systém, který mu výrazně pomůže. Třeba řekne, že tady a tady v nahrávkách mluví politik, který vás zajímá, a ano, teď se baví o tématu, které je předmětem vyšetřování.

Mají tito klienti nějaké specifické požadavky ve smyslu, že nesmíte stejnou technologii prodávat do některých zemí a podobně?

To, co děláme, je software. Snažíme se náš etický kodex využívat k tomu, aby se náš software nedostával k účelům, které by byly v rozporu se zájmy NATO nebo Evropské unie. Lidé si každopádně pod tím vším představují něco jiného, než se ve skutečnosti děje. My nemáme žádné datacentrum, neděláme žádné šmírování. Máme pouze výpočetní kapacity a trénujeme neuronovou síť na datech, která jsou komerčně získaná z Německa, Polska, Ameriky a podobně. Nebo vytváříme nějaké vlastní sady nahrávek, objednáváme si call centrum, aby volalo a sbíralo vzorky.

KL17_hlasovani

Vaši neuronovou síť provozujete jak a kde?

Pro trénování používáme grafické karty, i když něco běží i na procesorech. Máme několik desítek tisíc jader v grafických kartách, to máme přímo ve firmě. To nám stačí. Možná si budeme nárazově přikupovat cloudové kapacity. Grafiky nejsou tak drahé, stálo nás to desítky tisíc a výrazně zrychlilo trénování. Nejsložitější v tom všem je vyčistit data. Tahle data koupíme od jednoho poskytovatele, další od jiného, nějaká si vyrobíme sami. Výsledek je mix, kde jsou věci různě značkované a nejdříve je nutné informace vyčistit.

Našli jste v článku chybu?