Hlavní navigace

"Český" Twitter má přes 100 000 uživatelů. Jak obtížné je měřit český Twitter?

Daniel Dočekal 24. 5. 2012

Je užitečné mít dva systémy snažící se zmapovat český (a slovenský) Twitter. A pokud jeden z nich ukáže překročení magické hranice 100 tisíc uživatelů, je to dobrý důvod se podívat na aktuální situaci. A pokusit se pochopit, proč je tak obtížné měřit český Twitter.

Klábosení právě archivuje 22 821 47­0 pípnutí od 100 081 českých nebo slovenských uživatelů.“ na www.klaboseni.cz z minulého týdne je jistým důvodem k oslavě, byť je potřeba zdůraznit, že Klábosení.cz do tohoto čísla zahrnuje skutečně české a slovenské uživatele a rozhodovacím kritériem není jenom jazyk příspěvků, ale také prosté „přihlášení se“ územní. Důvod k oslavě tu přesto je, protože „český Twitter“ je se slovenským hodně propojený. A těžko se od sebe odděluje. A když už nebudeme brát v úvahu číslo samotné, je zde stálý viditelný růst.

„Konkurenční“ www.zoomsphere­.com aktuálně pro Českou republiku uvádí, že eviduje 42 229 účtů, ale i zde narazíte na typické problémy s „detekcí“ (hlavně v podobě přítomnosti účtů, které rozhodně nejsou české, problém společný pro oba systémy). Svým způsobem je zajímavé, jak obtížné je určení toho, kolik uživatelů má určitá sociální síť či služba v určité zemi. A jak obtížné je vůbec tyto uživatele najít.

Česky a slovenský Twitter, Zdroj: Klaboseni.cz

Česky a slovenský Twitter, Zdroj: Klaboseni.cz

Český Twitter podle Google

Připomeňme, že Google DoubleClick Ad Planner odhaduje návštěvnost českého Twitteru na 290 tisíc měsíčních unikátních uživatelů a soudě podle grafu je konstantní zhruba od druhé poloviny loňského roku. V případě Twitteru slovenského je odhad 150 tisíc a graf má stoupající tendenci, také od druhé poloviny loňského roku. Celosvětová návštěvnost je Google odhadována na 170 milionů uživatelů.

Samotný Twitter udává, že má 100 milionů aktivních uživatelů (přihlašujících se alespoň jednou měsíčně a jde o údaj ze září loňského roku) a 200 milionů registrovaných účtů (údaj z dubna loňského roku). Podle TwopChars.com je aktuální počet registrovaných účtů 584 milionů a odhady založené na této službě hovoří o tom, že na konci tohoto roku by Twitteru mohl mít až 250 milionů aktivních účtů.

České TOP 15

 

Zoomsphere.com

Klábosení.cz

1. @AwwBieber 171 406 @AwwBieber 171 406
2. @weluvbrazil 109 526 @LoreleiWeb 113 620
3. @PragueBob 73 181 @weluvbrazil 109 526
4. @avast_antivirus 50 069 @PragueBob 73 181
5. @webnode 30 289 @avast_antivirus 50 069
6. @ProSyn 28 172 @webnode 30 289
7. @ZoomSphere 24 492 @ProSyn 28 172
8. @vtipy 21 865 @vtipy 21 865
9. @Roman86_K 21 569 @SmurfyHayden zrušený účet
10. @oriolesland 17 356 @Roman86_K 21 569
11. @computer_zive 16 621 @zdenekstybar 17 552
12. @arkellsmusic 15 521 @computer_zive 16 621
13. @belamionline 15 176 @Cibulkova 16 205
14. @MilanBaross 14 162 @belamionline 15 176
15. @pixmac 13 605 @MilanBaross 14 162

Mezi největšími účty na Twitteru jsou časté záhady

Největší z uváděných účtů @AwwBieber  toho moc českého nenabízí ani nepředstavuje (má ale 171 305 sledu­jících). Stejně tak je otázkou, kam vlastně zařadit @weluvbrazil aneb „Tchecas do brasil“ (najdete na druhém místě s 109 541 sle­dujícími). Stejně tak @OriolesLand není český (v Zoomsphere navíc chybně zaznamenaný odkaz na účet). Mezi těmi největšími (už s „pouhými“ 15 391 sledujícími) pak najdete třeba i @arkellsmusic patřící zjevně do Kanady. A co teprve taková @SilviaSaint_, jejíž webová stránka pouze sděluje, že „SORRY BUT THIS PAGE IS NOT AVAILABLE IN YOUR COUNTRY“. Smutné, když česká porno hvězda nemyslí na své krajany, i tak by se to dalo říci.

Mimochodem, on například @Aw­wBieber je skutečně z Česka, byť to taky nevypadá. A u některých z oněch „záhad“ také nějakou českou vazbu najdete. Byť je do „českého“ Twitteru dokážete pocitově zařadit jenom velmi těžko. 

Slovenský Twitter podle Google

Pro Slovensko ZoomSphere eviduje na Twitteru 5528 účtů, takže pokud to sečteme, dojdete zhruba k 50 tisícům česko-slovenských účtů. Versus 100 tisíc v případě Klábosení. A to v případě Slovenska je (podle Zoomsphere) největší účet @ValBloomberg (21 741 sledu­jících) rozhodně jako „slovenský“ nevypadající. Další dostupné odhady velikosti slovenského Twitteru přitom hovoří o desítkách tisíc účtů.

Klábosení a Zoomsphere.com se v žebříčku patnácti největších účtů liší jenom mírně, můžete se na to ostatně podívat sami ve výše uvedeném přehledu. Občas někde něco přebývá, stejně tak jako občas někde něco chybí.

Co na velmi rozdílné výsledky říká Josef Šlerka z Klábosení.cz?

Prohledáváme sledované a sledující uživatelů Twitteru, které máme a testujeme, zda se buď explicitně hlásí k českému nebo slovenskému prostoru či zda mají alespoň 15 procent tweetů v češtině nebo slovenštině. Možné je, že tak přijdeme na účty, které mají třeba i nízkou frekvenci tweetování. Pokud jde o jazykový detektor, tak si myslím, že máme přibližně 5% false positive. Řekl bych tedy, že číslo 100 000 jsme ještě přímo v Klábosení nep­řekonali, ale už jsme hodně blízko 

Pokud jde Slovensko zvlášť, tak myslím, že číslo 5528 není úplně správné, viz prezentace třeba i konkurenčního projektu http://ww­w.slideshare.net/an­drej_probst/twit­ter-in-slovak-republic

Jakub Mach ze společnosti Micromedia (Zoomsphere.com) k tomu říká:

Do nedívna jsme používali mechaniku podobnou tomu popisu Pepy Šlerky, ale od doby, co jsme globálním projektem, tak řešíme jen TOP 1000 účtů v každé zemi. Sestaveni žebříčku sice předchází také projetí ostatních účtů, ale neděláme si už ambici projíždět každý účet, procházíme jen ty aktivní, které mohou promluvit do žebříčku.

Dan použil číslo, které uvádíme v závorce při výběru země. To číslo nevyjadřuje ale celkový počet registrací, ale de facto spíše počet účtů které jsme vzali v potaz při aktualizaci žebříčku. Každopádně je to naše hloupost, že to tam máme, chápu, že je to zavádějící. Na testovací verzi to není, na ostré jsme to zapomněli odstranit. Omlouvám se za uvedení v omyl.

Přesné číslo počtu registrací v ČR teď neznám. Ono indexovat pouze CR je snadné, ale indexovat všechny účty na Twitteru celosvetově prostě nejde a my se vyvarujeme toho, abychom dělali extrabuřty pro nějakou zemi, tím spíše, že pro ČR to nemá ani moc komerční význam.

Závěr aneb co z toho plyne?

Něco tak zdánlivě jednoduché jako „změřit český Twitter“ vůbec jednoduché není. Na obou příkladech je vidět, že automatické hledání „českých“ účtů selhává a ruční práce se nevyplatí – se stoupajícím počtem uživatelů Twitteru je to více a více obtížné. Samotný Twitter to také neusnadňuje, uživatelské účty toho o sobě moc neříkají. Určovat český účet podle češtiny je jedním z použitelných způsobů, ale vede to k tomu, že nejsou nalezeny neaktivní účty – tedy takové, které jejich uživatelé používají pouze pro sledování.  Ty Klábosení najde prostřednictvím vazeb na další české účty, ale nedokáže už zjistit, jestli je jejich uživatelé skutečně používají, nebo zda to byl jenom ojedinělý pokus a uživatel již Twitter opustil.

Z komentáře od Jakuba Macha plyne i další úskalí. Je lepší být „světoví“, než se věnovat malé české kotlině. Na světovosti lze lépe vydělat. A ze slov Jakuba Macha také plyne, že je lepší „klouzat po povrchu“ a omezit snahu o detailnost či přesnost. Míra pracnosti prostě neznamená odpovídající vyšší přínos. O čemž samozřejmě lze polemizovat, ale tady je podstatné, na koho vlastně ZoomSphere míří.

Našli jste v článku chybu?

24. 5. 2012 12:57

Konec mého dotazu vcelku jasně zní ".... toužím po nějakém vysvětlení. Zejména takovém, které bych mohl použít pro Lupu."

Nedočetl jsi ten jeden odstavec do konce? Co se toho dalšího týče, plyne to z tvého vyjádření a opět zdůrazním, že to chápu. Zejména pokud je to vztaženo k předmětu článku, tedy tomu zda je realistické se věnovat ověřování a detailnímu zjišťování jaký účet je skutečně český či nikoliv. O ničem jiném zde není řeč.

24. 5. 2012 11:33

Jakube, jenom upozorním, že jsem mailem požádal o vyjádření a v tom mailu bylo doslova uvedeno, že žádám o něco, co bude možné použít na Lupu. Což jsem také udělal.

K tomu ostatnímu, není mi jasné proč útočíš, tento článek nikoho nekritizuje. Ukazuje na to, jak nesnadné je ot měřit. A jak to dva zásadní konkurenti dělají. Neřeší jestli to někdo z nich dělá špatně, ale zmiňuje se o úskalích s tím spojených.

Měšec.cz: Zdravotní a sociální pojištění 2017: Připlatíte

Zdravotní a sociální pojištění 2017: Připlatíte

DigiZone.cz: ČT láká na jarní programové tipy

ČT láká na jarní programové tipy

Podnikatel.cz: K EET. Štamgast už peníze na stole nenechá

K EET. Štamgast už peníze na stole nenechá

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

Měšec.cz: U levneELEKTRO.cz už reklamaci nevyřídíte

U levneELEKTRO.cz už reklamaci nevyřídíte

Měšec.cz: Jak levně odeslat balík přímo z domu?

Jak levně odeslat balík přímo z domu?

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu

DigiZone.cz: Další dva kanály nabídnou HbbTV

Další dva kanály nabídnou HbbTV

DigiZone.cz: Flix TV má set-top box s HEVC

Flix TV má set-top box s HEVC

Měšec.cz: Golfové pojištění: kde si jej můžete sjednat?

Golfové pojištění: kde si jej můžete sjednat?

Podnikatel.cz: Babiše přesvědčila 89letá podnikatelka?!

Babiše přesvědčila 89letá podnikatelka?!

Měšec.cz: Finančním poradcům hrozí vracení provizí

Finančním poradcům hrozí vracení provizí

Vitalia.cz: Znáte „černý detox“? Ani to nezkoušejte

Znáte „černý detox“? Ani to nezkoušejte

Podnikatel.cz: 3, 2, 1..EET startuje. Na co nezapomenout?

3, 2, 1..EET startuje. Na co nezapomenout?

Vitalia.cz: Nahradí sluch, ale zvuk je zcela jiný

Nahradí sluch, ale zvuk je zcela jiný

Vitalia.cz: Spor o mortadelu: podle Lidlu falšovaná nebyla

Spor o mortadelu: podle Lidlu falšovaná nebyla

Vitalia.cz: Dáte si jahody s plísní?

Dáte si jahody s plísní?

Podnikatel.cz: Udávání kvůli EET začalo

Udávání kvůli EET začalo

Měšec.cz: Banky mlží o nákladech na předčasnou splátku hypotéky

Banky mlží o nákladech na předčasnou splátku hypotéky

Vitalia.cz: Jsou čajové sáčky toxické?

Jsou čajové sáčky toxické?