Hlavní navigace

Josef Šlerka: Data už jsou, učíme se je destilovat

19. 1. 2012
Doba čtení: 11 minut

Sdílet

Bývalý divadelní dramaturg, dnes šéf vývoje nástrojů na analýzu sociálních sítí v Ataxu a také učitel nových médií na Univerzitě Karlově, hovořil na prvním letošním NetClubu například o tom, jak destilovat data ze sociálních sítí nebo proč zkopírování jednoduché služby stačí k tomu, aby se člověk stal na českém Internetu hvězdou.

Všechny vaše zájmy se prý podle popisku, který máte u svého jména na každé konferenci, na které v poslední době přednášíte, protínají v jednom bodě – symbolické analýze. Co si pod tím představit?

Je to odkaz na amerického ekonoma Roberta Reicha, člena vlády prezidenta Clintona. Ten říkal, že ve Spojených státech vznikla nová vrstva lidí, kteří se živí analýzou symbolů. Mně přišlo, že je to velmi hezké označení pro to, čím se člověk živí, když vystuduje humanitní školu. Samozřejmě je v tom odkaz také na sémiotiku a s ní spojený byznys.

Co myslíte pod pojmem sémiotika?

Sémiotika je v honosném smyslu tak, jak se to učí na lingvisticky orientovaných oborech, nauka o znacích a v ideálním případě o jazyce. Sémiotiku ale může člověk chápat také daleko méně honosně jako pomocnou metodologickou vědu, jako metodologický systém. Je zajímavý tím, že tvrdí, že nemáme žádné přímé poznání, naopak se pohybujeme v systému nepřímých poznání. Pokud si člověk zvykne pohybovat se v tomto rámci a osvojí si analytické paterny, tak mu to může pomoci napříč různými obory.


Autor: Ondřej Hošt, Lupa.cz

Můžete být trochu konkrétní?

Dělali jsme nedávno například korelaci mezi počtem zmínek o nějakém filmu na sociálních sítích a návštěvností kin. Ta korelace se ukázala jako velmi silná. Klasicky člověk předpokládá, že znaky něco znamenají. Když pak ale začne přemýšlet nad tím, jestli nějaká činnost člověka, třeba to, že chce jít do kina, vyvolává nějakou sociální akci, třeba určité typy příspěvků na Facebooku nebo na Twitteru, a začíná s tím pracovat, tak to může otevřít docela zajímavé prostory. Vše se točí v podstatě kolem jediné věci – jak číst lidské chování z nějakých nepřímých záznamů.

Kdy jste se poprvé dostal k počítači?

Když mi bylo deset let, tak jsem dostal svůj první počítač ZX Spectrum, potom přišlo Atari a můj otec měl takovou ideu, že by se tím člověk mohl živit, a že je to dobré podporovat. Vtipné na tom je, že jsem poté studoval nejdříve divadelní dramaturgii, ze které jsem utekl, následně jsem vystudoval estetiku, ale celou tu dobu jsem se paralelně živil programováním.

Proč jste si vybral ke studiu humanitní obory a nestudoval jste třeba zmiňované programování, kterým jste se ve skutečnosti živil?

Tou dobou tam šla studovat slečna, do které jsem byl zamilovaný. Pak jsem odešel na estetiku, protože jsem se zamiloval do jiné slečny, zatímco do počítače jsem zamilovaný nikdy nebyl.

V čem jste programoval?

Všichni tehdy programovali v BASICu. Atari mělo programovací jazyk Action, což byl bastl mezi elementárním céčkem a BASICem. Nepovažuji se za nějak zdatného programátora, ale rád vzpomínám na to, že můj první placený software bylo jednoduché účetnictví pro Atari 800XL, který jsem napsal v šestnácti letech a pravděpodobně to bylo jediné jednoduché účetnictví pro Atari 800XL, které kdy existovalo.

Tu estetiku jste dostudoval někdy nedávno…

Já ještě studuji. Dělám si doktorát a počítám, že bych chtěl studovat ještě tak tři, čtyři roky.


Autor: Ondřej Hošt, Lupa.cz

Jak jste se jako člověk, který studoval estetiku, dostal do Ataxa na pozici šéfa vývojářů?

Kupodivu právě přes Filozofickou fakultu. Když se nám mělo před šesti lety narodit první dítě, tak žena chtěla, abych si našel nějaké slušné povolání, díky kterému bych nosil domů pravidelnou mzdu, což u freelancování nešlo úplně naplnit. Tak jsem šel na dva roky dělat novináře do vydavatelství Vltava-Labe-Press.

Mezi programováním a psaním článků zase tak velký rozdíl není. Opíšete spoustu kódů a musí to dávat alespoň elementární smysl.  Mezitím jsem dokončil studium estetiky, nastoupil jsem na doktorát a chtěl jsem, aby mi snížili úvazek. Oni ale chtěli buď plný, nebo žádný.

Tehdy jsem potkal Matěje Nováka, který je dnes v Centrum Holdings a je mimochodem vystudovaný filozof. Ten v té době dělal v Ataxu a řekl mi, že Ataxo shání produktového manažera. Když jsem přišel do Ataxa, tak se ukázalo, že sice hledají produktového manažera, ale nemají šéfa vývoje. A tak jsem se stal na čtyři roky dočasným šéfem vývoje Ataxa.

Josef Šlerka bude jedním z řady přednášejících na Konferenci New Media Inspiration, která se koná už tuto sobotu 21.1.2012 v budově Filosofické fakulty, Univerzita Karlova v Praze na Nám. Jana Palacha. Hlavním tématem konference je problematika měření v sociálních sítích a s ní související problémy. Konference je otevřena jak akademickým pracovníkům, tak studentům i zástupcům komerčního sektoru. 

Co dělá takový šéf vývoje?

Říká ne. Největší dovednost, kterou jsem se na té pozici naučil, bylo říkat ne. Všem.

Jak to myslíte?

Člověk musí rezignovat na to, že bude u všech oblíbený. Musí říkat ne jednoznačně a nedávat lidem falešný příslib. Tohle jsem se učil strašně dlouhou dobu, protože žádný šéf nechce být přirozeně neoblíbený. Musíte umět říkat ne všem, kteří si myslí, že jejich požadavek je nejdůležitější ve firmě.

Co Ataxo v současné době dělá?

Ataxo je dnes vlastně Ataxo Group, nemá smysl mluvit o Ataxu jako o jedné firmě. Před rokem koupilo společnost H1, která dělá klasický digitální marketing zaměřený především na segment větších klientů. Vedle toho existuje Ataxo Czech, které pokračuje v tradici byznysu s malými klienty. Třetí pilíř je Ataxo Interactive, ve které působím a to je  vlastně vývojářská firma, která vyvíjí své vlastní produkty, jako je například nástroj pro monitoring sociálních sítí nebo reklamní systém Trixam.

Dnes už nejste šéfem vývojářů, co máte tedy ve firmě na starosti?

Působím jako talking head. Měl bych pomáhat nastavovat dlouhodobou strategii pro rozvoj firmy. Část dne trávím operativou, část pak přemýšlením.

Už jste na něco přišel?

Například jsem přišel na způsob jak vylepšit algoritmus pro analýzu témat v textu v reklamním systému Trixam. Algoritmus vznikl tak, že mě to v jednu chvíli napadlo, ale předcházelo tomu strašně moc čtení a zkoumání. Mám jisté potěšení z toho, že poměrně hodně věcí, které dělám v akademickém prostoru, potom vidím nasazené v byznysu.

Často se říká, že český Internet je malý a občas se objeví názory, že je i trochu zatuchlý. Jak to vidíte vy?


Autor: Ondřej Hošt, Lupa.cz

Jsem v tomto ohledu poměrně kritický, ale nemyslím si, že by byl problém ve velikosti. Česko je pomalu stejně velké jako Bavorsko, ale podoba internetového trhu tam a tady je nesrovnatelná.

Problém je v tom, že český Internet je uzavřený. A právě ta uzavřenost způsobuje, že v Česku je strašně jednoduché udělat z prdu kuličku. Elementárně jednoduchý výkon nebo zkopírování jednoduché služby v Česku stačí k tomu, aby se člověk stal hvězdou. Druhým velkým problémem je fakt, že spousta vlivných lidí v prostředí českého Internetu svým způsobem zastydla před pěti, osmi lety v přístupu k Internetu jako takovému a mají problém se otevírat novým věcem. Úměrně tomu, jak stárnou, nechtějí riskovat žádný problém nebo neúspěch. Třetí problém představuje skutečnost, že lidé tady příliš nečtou.

Můžete uvést konkrétní příklad někoho, kdo takzvaně zastydl?

Může to být například Seznam s tím, jak fatálním způsobem podcenil nástup sociálních sítí. Z nějakého důvodu, který jsem nikdy nepochopil, tento segment opustil a přitom nemusel.  Na druhou stranu asi Seznam z toho konzervativního přístupu udělal svojí strategii. Seznam ale nepochybně mohl se servery, které měl k dispozici, udělat mnohem více.

Je dominantní role Seznamu na českém Internetu spíše pozitivní nebo negativní?

Trhu síla Seznamu z několika důvodů prospívá. Tam, kde ovládl trh Google, klesly razantním způsobem příjmy z reklamy pro vydavatele. V Česku se díky konkurenci udržují ceny na rozumné výši. Silný Seznam navíc nutí Google, aby v Česku spouštěl služby, které by tu jinak vůbec nespustil. Přál bych si, aby stav 50 na 50 (Seznam versus Google) vydržel v Česku ještě dalších padesát let.

Neměl by Seznam například kupovat menší firmy a podporovat tuzemské internetové prostředí tímto způsobem?

Bylo by to fajn. Ale je to otázka strategie firmy a je to jen její rozhodnutí. Kdyby to začal Seznam dělat zbrkle, tak mu to zase nikdo nebude věřit. Seznam by ale mohl například více podporovat developerskou komunitu a více se jí otevírat. Fantastický je nyní blog fulltextu, který dělá Materna.

Mohl ale vůbec Seznam efektivně a dlouhodobě konkurovat Facebooku?

Pravděpodobně by nevydržel vzdorovat, nicméně by byl schopný povzbudit prostředí k úplně jinému zacházení se sociálními sítěmi. A samozřejmě během té doby získat nějakou větší provizní část.

V Česku je Facebooku ve srovnání s ostatními evropskými státy nadprůměrně populární, proč se podobně nedaří Twitteru?

Twitter nebyl v braking pointu, do kterého se Facebook dostal poměrně rychle. V jednu chvíli už bylo jednoduše slušností být na Facebooku, protože tam byli všichni kolem. Facebook je také přirozenější pro komunikaci. Určitou roli může hrát i to, že v českém prostředí nejsou lidé zvyklí pracovat s takovým silným omezením, jako je 140 znaků. Twitter má také stále v Česku pověst spíše geekovské zábavy. Dalo by se to zvrátit, kdyby se určitá část českého zábavního průmyslu rozhodla tweetovat.


Autor: Ondřej Hošt, Lupa.cz

Co je dnes zajímavého v oblasti vývoje sociálních sítí?

Z mého pohledu je zajímavé to, jak se Facebook postupně stává platformou a přestává být webovou stránkou. To je změna, která bude dlouhodobá. Ukazuje se totiž, že sociální prostředí prorůstá napříč zařízeními. Mobilní telefony ztrácí tu ostrou hranu, tady končí můj přístroj – tady začíná sociální síť. Je to samozřejmě velmi zajímavé z hlediska vytěžování dat.

Ataxo provozuje stránku Klábosení.cz, která je ve twitterovské komunitě dobře známa. Kolik českých účtů v současné době sledujete?

Sledujeme český a slovenský Twitter, protože jsou velmi silně propojeny. Sledujeme takové účty, které mají alespoň 15 procent tweetů v češtině anebo se uživatel musí explicitně v profilu přihlásit k Česku nebo některé české lokalitě. Za těchto podmínek nyní evidujeme 90 tisíc účtů. Kdyby existovaly v Česku stejné poměry mezi aktivními a neaktivními uživateli na Twitteru jako ve Spojených státech, tak by to znamenalo, že zhruba dalších 50 tisíc českých a slovenských účtů na Twitteru existuje, jenom se aktivně neprojevují.

Co může Ataxo firmám v oblasti monitoringu sociálních sítí nabídnout a o jaká data je mezi firmami zájem?

Většina firem chce být podle mého názoru v posluchačském módu. Od slavných vajíček pro Paroubka existuje u řady firem představa, že by se na ně někdo mohl domlouvat. To může volně přecházet přes kvalitní zákaznickou péči až marketing, který se snaží objevovat trendy. Myslím si, že v Česku jsou zatím ve hře ty dva první módy tedy pasivní poslouchací, zjišťovací, druhý mód pak reprezentuje určitá forma zákaznického servisu.

Mohl bych například zmínit O2, které vybudovalo pětičlenný social media tým – ekvivalent telefonní linky. Stále je mezi firmami ale zájem také o diskusní fóra například na serverech pro maminky s dětmi.

My nabízíme nástroj, který umožňuje zmínky o firmách na sociálních sítích sebrat, vizualizovat a dál s nimi pracovat. Firmy typu H1 potom nabízejí další služby, kvantitativní či kvalitativní analýzy sebraných dat.

V angličtině není problém určit negativní a pozitivní tweet, obecně sentiment tweetu, jak je na tom v tomto ohledu čeština?


Autor: Ondřej Hošt, Lupa.cz

Problém je, že texty, ve kterých se objeví slovo, které klient sbírá, často nemají žádnou emotivní hodnotu. Zbytek textů, podle toho, jak je firma oblíbená (může to být 15 až 60 procent), je emotivně zabarvených. V angličtině jsou analytické nástroje pro určení sentimentu výrazně sdílené, univerzity publikují výzkumy, spousta nástrojů je open source. V případě češtiny takový ekosystém zatím neexistuje. Když se objeví firma, která si něco takového chce udělat, tak si to snaží držet pro sebe. Čistě statisticky vzato, pokud chcete vědět, zdali je trend negativních zmínek hodně velký či naopak malý, tak vám v podstatě stačí vzorek, řekněme každá pátá zmínka.

Na co se vy konkrétně kromě hledání sentimentu v současné době zaměřujete?

Téma, které mě nyní hodně baví, je identifikace trendů a diskutovaných témat v sociálních sítích na denní bázi.

Mluvili jsme už o korelaci mezi počtem zmínek o nějakém filmu na sociálních sítích a návštěvností kin. Jsou i jiné oblasti, kde může analýza dat ze sociálních sítí něco zajímavého napovědět?

I pro taková obyčejná slova jako plyn či elektřina v různých variacích existuje silná korelace mezi tím, jak se o nich píše v sociálních sítích a mezi tím, jak se hledají na webu. Když se něco často hledá, tak se o tom často píše a naopak. A funguje to i na relativně malých vzorcích.


Autor: Ondřej Hošt, Lupa.cz

Co dneska jako vysokoškolský pedagog považujete za největší problém akademické sféry?

ebf - témata 1

Velkým problémem je například to, že když lidé z univerzity něco umí a odjedou na stáž do zahraničí, tak jich tam hodně zůstane. To je velký problém, protože se ukazuje, že lidé, kteří strávili nějakou dobu v cizině a vrátili se zpět, jsou nositeli změn na univerzitách. Druhým velkým problémem je určitá míra uzavřenosti, protože univerzity mají pocit, že soukromý sektor je chce vytěžit. Což mnohdy chce, ale univerzity nevynaloží ani elementární úsilí na to pochopit, o co soukromému sektoru jde, a obráceně soukromý sektor se zase moc nesnaží pochopit, co dělají univerzity. Třetím velkým problémem je fatálně nesmyslný způsob financování grantů a podobných věcí, které ve finále nutí univerzity a vědecká pracoviště vymýšlet umělé projekty.

Děkuji za rozhovor

Byl pro vás článek přínosný?

Autor článku

Internetové novinařině se věnuje od roku 2005, kdy začal jako redaktor pracovat pro vydavatelství Internet Info.

Autor je novinář a publicista, přispěvující do řady českých médií. V současné době působí mj. jako moderátor NetClubu, diskusí s osobnostmi českého Internetu.
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).