Ilustrace: Nenad Vitas
Navíc my, autoři různých spotů a článků, máme ke statistikám vztah zvláštní. Dobrá zdrojová data jsou výborným stavebním kamenem pro dobrý článek. Graf či tabulka dá všemu punc objektivity a kvality. Články jsou pak i čtenářsky zajímavé a přehledné.
Problém ovšem nastává ve chvíli, kdy máme z dat vyvodit závěr. Musíme si položit otázku, co dané hodnoty znamenají, jaká je možná chybovost, spolehlivost apod. Není také na škodu porovnat dva také odlišné zdroje (ač i to může mít svá úskalí).
Poslední dobou se vedou například diskuse o tom, zda Firefox se dotahuje na IE. Tento jev vyplývá například z dat, která poskytl Navrcholu.cz či TOPlist. Ale je potřeba vždy zdůraznit, že se nejedná o pohled úplný, ale pouze o jistý výřez reality. Celkový pohled by nebyl ani možný.
Například server Navrcholu.cz provádí měření na více než 20 000 webech (TOPlist dokonce udává 630 000 serverů), což je možné považovat za poměrně dobrý reprezentativní vzorek. Navíc, první jmenovaný pracuje s poměrně sofistikovanými nástroji pro korekci chyb, a to jak těch nahodilých, tak i systematických. Na druhou stranu situace může být například na Seznamu či iDnes úplně jiná a může zvrátit poměr ve prospěch či neprospěch kohokoli.
Nechci ani v nejmenším tvrdit, že tvořit a počítat statistiky nemá smysl. Je to důležitý ukazatel v trendech návštěvnost, informací o konkrétních návštěvnících konkrétního projektu i celé sítě. Pokud budeme nazírat na statistiky globální, pak je asi důležitější tendence (pokud se nemění metodika) než samotná čísla. V tomto kontextu také můžeme říci, že zřejmě ke sbližování podílů obou prohlížečových rodin dochází.
Pokud se přesuneme jinam, pak nalezneme podíl uživatelů Firefoxu v číslech od 10 % do 39 % (viz například můj spot na blogu). Rozptyl je takový, že můžeme konstatovat, že existují uživatelé (kterých asi není úplně málo), kteří užívají FF, ale že existují ještě jiní, kteří užívají jiné prohlížeče, nebo prohlížeče kombinují. Nic víc, nic míň. Pokud provozuji nějaký web, je vždy potřeba vnímat prvé řadě vlastní statistiky. Stránka od stránky se může poměrně lišit.
Myslím, že snad téměř každý má rád statistiky a čísla. Je důležité, ale (a na Internetu to platí dvojnásob) vnímat určitý kontext a spolehlivost. Pokud tak nebudeme činit, pak bychom mohli být docela snadno zmanipulováni. Ne snad proto, že by lhala čísla, ale protože jejich hodnotu špatně chápeme. A to ani nemluvím o tom, jak je důležité vybrat si spolehlivý a kvalitní zdroj informací.
Pokud bychom se chtěli podívat na statistiku, kterou lze zpracovat různě, pak může být hezkým příkladem například článek na iDnes, kde autor sám trefně poznamenává, že čísla se kterými pracuje, může za bernou minci vzít jen těžko. Každý si může představit, jak by vypadal článek, kde by autor vzal čísla, vložil do tabulky a stručně je okomentoval. Reálnost či pravdivost obou verzí může pak každý zvážit sám.
Každý průzkum má určitou spolehlivost, a podle všeho ty dobře udělané zpravidla docela dobře vychází. Za tím vším nestojí nějaké kouzlo, ale již zmiňované statistické metody. Ale ani ty nemají stoprocentní spolehlivost…