Když na setkání s novináři NetMonitor oznamoval změnu metodiky, bylo škarohlídům jasné, že to nemůže dopadnout jinak, než v předchozích případech. Tedy, že se to ne zcela povede.
A také, že bude potřeba dopočítávat. Protože – a to je první důležitá věc – výsledky NetMonitoru vlastně nejsou až tak nezávislé. To, zda bude něco měřit, je dáno tím, že mu to musí někdo zaplatit. A protože je platícím zároveň měřený subjekt, jsou roky existence NetMonitoru také roky tanečků okolo toho, co které straně projde.
Upravená metodika NetMonitoru přináší rychlejší a podrobnější data oznamuje, že od června 2015 došlo ke změně metodiky a tím také některých mechanismů „počítání“ návštěvnosti. Zároveň s tím se zkrátilo zpoždění, se kterým se čísla NetMonitoru dostávala ven – z původních 25 dní o deset. Každého patnáctého tak budou k dispozici kompletní výstupy za uplynulý měsíc a denní čísla RU (reálných uživatelů) by měla být dostupná vždy následující den.
Zásadnější změnou je, že návštěvnost je rozdělena podle zařízení – dozvíme se tak, kolik RU (reálných uživatelů) navštívilo určitou službu na webu přes prohlížeč/počítač, kolik na mobilu a kolik na tabletu.
Tady je nutné zdůraznit, zejména s ohledem na některé známé jedince, kteří rádi sčítají, že tyto tři údaje jsou samostatné a sčítat je nelze. Na to, až bude Netmonitor umět pro určitou službu poskytnout jediné RU, které započítá jednoho člověka s více zařízeními jenom jednou, si budeme muset ještě (dlouho) počkat.
Nejméně do doby, kdy se NetMonitoru podaří vybudovat panel, který toto měření umožní. Tady je nutné dodat, že rekrutace teprve „bude bezprostředně zahájena“. A také to, že po rekrutaci panelu ještě přijde nesnadná fáze: najít „ten správný vzorec“.
Podle jednotlivých platforem jsou k dispozici i celková čísla, tedy počet (RU) internetových uživatelů v Česku – v červnu by mělo jít o 6,5 milionu RU z ČR na počítačích (a noteboocích), 2,8 milionů z mobilních telefonů a 1 milion z tabletů.
Pokud vám ještě není jasné, jak je to s tím sčítáním, tak je nutné si uvědomit, že jeden člověk je běžně započítán na všech třech platformách. A proto je nelze sčítat.
TIP: Nedávno vydané Srovnávat NetMonitor s Google Analytics? Zvláštní nápady a navíc zbytečné vám poskytne dostatek konkrétních informací doplňujících tento článek, pokud chcete vědět víc o tom, jak si NetMonitor stojí „proti“ GA.
Co se změnilo v NetMonitoru
NetMonitor postupně „opouští“ zásadní používání cookies; nahrazeny jsou „Browser ID“ (BID), který ale cookies částečně zachovává a přibírá HTML 5 Local Storage. V případě ztráty cookies (což se děje v jednom měsíci i v desítkách procent) je potom dost často možné uživatele „odhalit“ přes BID uložené v Local Storage.
Přechod na BID může mírně ovlivnit počet zhlédnutí (Page Views), značně počítání RU a poměrně dost Návštěvy (Visits) a trávený čas (Time Spent). Na sociodemografická data by příklon k BID vliv mít neměl, protože ta se určují z panelu (panelů).
Přechod na „něco jiného než cookies“ je nutnost. Mají příliš velkou úmrtnost a na mobilních zařízeních je s „cookies třetích stran“ spousta problémů. Proto HTML 5 Local Storage, které sice není zcela bezproblémové, ale (prozatím) nabízí stabilnější možnosti než cookies.
NetMonitor opustil sedmitýdenní čekání na potvrzení existence cookies; místo toho přešel na výpočet životnosti cookie podle pravděpodobnosti přežití, což umožní o deset dní urychlit kompletní měsíční výstupy.
Denní RU budou dostupné vždy následující den, ale půjde o jejich odhad (sám NetMonitor to řeší kurzívou RU, možná by nebylo od věci používat trochu jiné označení, ale budiž). Jde ale o jiný odhad, než jsou dosavadní RUest. Pokud se v tom trochu začínáte ztrácet, tak asi nejste jediní, ale ono to asi není podstatné. Ona ta čísla jsou obecně odhady tak jako tak.
Původní RUest podle NetMonitoru přestanou mít smysl. Což může být pozitivní, pokud to povede k tomu, že budou k dispozici jenom jedna čísla, ať už budou označená jakkoliv.
TIP: Pokud se ztrácíte ve všech těch různých RU, RUest, Návštěvách, PV a podobně, tak zkuste Unikátní uživatelé, aktivní návštěvníci, návštěvy. Co se vlastně počítá? Dozvíte se tam třeba i to, jak snadno je možné návštěvnost falšovat.
Co se dá vyčíst z metodiky
Pokud se podíváte do nové metodiky trochu důkladněji, zjistíte některé další zajímavosti. A některé podstatné informace, které pomohou lépe pochopit, co vlastně ten NetMonitor je (či není).
Především je dobré vědět, že zde běží v zásadě měření dvě: site-centric využívající gemiusTraffic na webech a user-centric v podobě aplikace netSoftware na počítačích panelistů. Na user-centric části je zajímavé, že podporuje pouze IE, Firefox, Chrome a Operu. Což může být jedna z prvních maličkostí. U server-centric části je pak důležité vědět, že do stránek na měřeném serveru je umístění JavaScript, který slouží k měření návštěvnosti (což je v zásadě totéž, co dělá Google Analytics).
Právě umístění měřicího skriptu je nejčastějším zdrojem problémů, ale také nejčastějším nástrojem podvádění (navyšování zhlédnutých stránek, počítání RU z jednoho média pro jiné, atd). Na řadu podvodů se v minulosti přišlo, některé manipulace byly legitimizovány tím, že se prostě něco začlenilo někam, kam to sice vůbec nepatří, ale pravidlům to pak vyhovovalo.
Netmonitor čísla ze site-centric části spojuje s čísly z user-centric části, a to mu, při použití nějaké té matematiky a statistiky, umožňuje dojít k výslednému RU (reálný uživatel). Protože čísla ze site-centric (cookies, měřící bod) bývají až několikanásobně vyšší, než výsledné RU.
Český Internet a jeho sociální sítě. Tady o žádném optimismu nemůže být řeč. Seznam.cz nádherně pohřbil i Lide.cz. A nezapomeňme, Facebook má přes 4.2 milionu českých uživatelů. Ehm.
Co se user-centric měření týče, tak jde o software, který umožňuje sledovat konkrétního člověka z panelu, o kterém je známa sociodemografie a jeho užívání internetu. Řeší i to, že na jednom počítači může pracovat více lidí, ale nedokáže řešit, jestli se chovají zodpovědně a opravdu se přepínají. Součástí měření je i doplnění User-Agent informace o identifikaci panelisty, což umožňuje propojit a kontrolovat vše vůči site-centric měření.
Gemius, který celé měření realizuje, vše již popsané doplňuje ještě hlídáním návštěvnosti od robotů a crawlerů, snahou o detekci strojově generované návštěvnosti (ta se neprojeví v user-centric části měření), ale třeba i návštěvnosti vyvolané Google Images.
Zajímavou částí této činnosti může být ještě to, že jsou odstraňovány tzv. extrémní browserID (dříve extrémní cookies) – což jsou (mohou být) v zásadě prohlížeče, které mají tak velkou aktivitu, že „nemůže“ být tvořena jedním člověkem. Kritérii jsou aktivita na jednom serveru a 1000 stránek za den, více než 20 hodin denně na internetu, více jak dvě zhlédnuté stránky za sekundu a více než 5 000 zhlédnutí za den při frekvenci jedné stránky za sekundu.
Multiplatformní měření
Ne až takovou novinkou je v NetMonitoru (Gemiusu) multiplatformní měření – v zásadě vychází z toho, že detekuje typ zařízení (podle User-Agent informace samozřejmě) a rozlišuje na několik skupin:
- mobily (ultramobily mající <3" displej, mobily mezi 3" a 6")
- tablety (6–13 palců a dotykové ovládání), e-čtečka (5 palců a e-ink)
- televize (Smart TV, Set top boxy ale i Blue-ray přehrávače)
- videoherní konzole
- počítače
- a „ostatní“
Pod PC přitom u českého NetMonitoru patří vše, co nepatří pod mobily či tablety.
Slabinou multiplatformního měření je hlavně to, že neexistuje jeden identifikátor, který by jednoho člověka spolehlivě identifikoval napříč platformami. On vlastně neexistuje ani jeden identifikátor, který by spolehlivě udržel jednoho uživatele aspoň v rámci jednoho typu zařízení – stačí, když (třeba) na iPadu máte nejenom Safari, ale také Chrome. Nezměřitelné je i to, kolik lidí používá místo webů konkrétních služeb jejich aplikace.
Velikost internetové populace
NetMonitor, ale obecně jakýkoliv systém měření návštěvnosti, který bude chtít měřit „reálné uživatele“, bude mít vždy jeden zásadní problém: kde vzít počáteční číslo, které vyjadřuje to, jak je velká internetová populace – a to nejenom celkově, ale hlavně jak byla velká v daném měsíci.
NetMonitor za výchozí stav pokládá výsledky offline výzkumu (Kontinuální výzkum ATO) a vlastně mu nic moc jiného nezbývá, protože tato čísla prostě není moc kde brát. Samotnou velikost internetové populace pak Netmonitor počítá několika metodami, které se mění podle toho, zda jsou k dispozici nová čísla z ATO nebo nejsou. Občas, v okamžiku enormních růstů, dochází k průměrování nebo k interpolaci s využitím dat z předchozího období (roku), atd.
Jinými slovy, asi budete prostě muset přijmout fakt, že všechno tohle jsou vypočtená data, odhady. A dost značnou roli zde hraje to, jaký je vývoj, protože se předpokládá, že čísla mají určitou sezónnost.
Jak je to se sociodemografií
Sociodemografie, tedy informace o tom, jací jsou uživatelé určité internetové služby, je založena na existenci panelu (tedy user-centric měření). S jeho pomocí je možné určit i sociodemografii serverů, které nejsou součástí NetMonitoru. Zapojené servery mohou sociodemografii získávat tak, že se NetMonitor uživatelů prostě čas od času může ptát (cookie panel) – tím ostatně také dochází k případným doplněním panelu (či panelů).
Se sociodemografií je mimochodem stejná komplikace jako s určením internetové populace – i tady totiž jako základ slouží offline šetření v podobě SEKV (Strukturální Exkluzivní Kontinuální Výzkum), kde jsou k dispozici data o (tisících) internetových domácností.
V okamžiku, kdy se zobrazují rekrutační dotazníky (v metodice najdete pod bodem 7.2.1), je měření opět založeno na BrowserID. Formuláře by se vám neměly zobrazovat častěji než jednou za 7 dní, ale asi víte, že se tuhle lhůtu nedaří stoprocentně dodržovat. Je totiž běžné, že když se spustí rekrutace, vyběhne na vás tenhle dotazník i několikrát za den.
Další komplikace najdete u SW panelu, což jsou lidé, kteří si do počítače pořídí sledovací software. Tady totiž musíme víceméně akceptovat, že sledovanými budou hlavně domácnost, v menší míre zaměstnání. Řada míst zůstane nepokryta (školy, internetové kavárny, atd).
Nejméně přesné je určování sociodemografie (ale také ostatních ukazatelů) u služeb, kde není k dispozici dostatek panelistů ani návštěvníků. Prostě v případě, že je měřené/sledované médium příliš malé (u panelistů je minimální počet na konkrétní médium 45, ale k údajům s menší chybou se nedostanete dříve než od stovky nahoru).
Další rezervy má sociodemografie například v otázce započtení českých a zahraničních návštěvníků. To proto, že rozdíl mezi pouze českou internetovou populací a celkovou internetovou populací (na českých měřených serverech) je poměrně vysoký.
Škoda také je, že stále nevíme, jak se v číslech projevují služby (zejména) Googlu či Facebooku. Ty NetMonitoru neplatí a také neumisťují na své stránky měřící kód, takže se NetMonitor tváří, že neexistují.
Je s NetMonitorem něco špatně?
Roky existence NetMonitoru jsou doprovázeny plamennými diskusemi o tom, jestli měří špatně či dobře či jestli „měří nesmysly“. Nic z toho není možné říci jednoznačně a s jistotou. NetMonitor měří tak, jak mu to umožňují nejenom současné technologie (navíc se rychle proměňující), ale také dostupné finanční prostředky na to, aby měření běželo. Čím déle měří, tím lépe dokáže některé věci odhalit, dopočítat, korelovat a korigovat.
Čím déle je nějaká metodika platná a čím méně na ni působí vnější vlivy, tím lépe funguje. Proto se teď také můžete dočíst, že ve zveřejněných nových datech o návštěvnosti jsou chyby - něco podobného se děje při prakticky každé změně metodiky. Část z aktuálních chyb je asi možné přičíst lidskému faktoru. Jak to celé dopadne, nebudeme ale vědět dřív, než za několik měsíců.
Nezapomeňme ale, že každý přechod na novou metodiku hlavně znamená, že je nežádoucí, aby došlo k velkým změnám, které by vedly k tomu, že někdo bude mít horší čísla. NetMonitor je především závislé měření, tedy závislé na tom, že jeho členové budou ochotni za jeho existenci nadále platit. Proto nemůžete čekat, že by jakákoliv změna metodiky vedla k něčemu, kde by se platící členové cítili poškození.