Ušetřete

Medián Petra Koubského: Média, která nerozumí mediánům

Obecně vzato, neexistuje žádný objektivně správný způsob práce se statistikou. Všechno to jsou jen nástroje, které si vybíráme podle toho, jako práci chceme udělat.

reklama

Šéfredaktor David Slížek mi udělal před časem radost, když pro tento sloupek vymyslel název Medián. Je to o médiích, vychází to uprostřed týdne a ještě se tím dá ospravedlnit názorový oportunismus, nevyhraněnost, hledání souladu, takové ty čapkovské moralizující zlozvyky, co do nich my starší občas upadneme, ani o tom nevíme.

Kromě toho tu je samozřejmě jako potenciální téma ten skutečný medián, prostřední hodnota setříděné řady čísel. Nejpůvabnější definici jsem před časem slyšel v posluchárně nejmenovaného vysokého učiliště: „Takový jako průměr, jenže jinačí.“ Což je koneckonců pravda, existují četné druhy středních hodnot a jak průměr (zde byl patrně míněn ten nejznámější, tedy aritmetický), tak medián mezi ně patří.

Souvislost mediánu s médii je silná. V médiích se velmi často argumentuje nejrůznějšími statistikami, u nichž stojí za to ptát se, která ze středních hodnot popisuje daná data nejlépe. Koneckonců, širší veřejnost zná pojem medián docela dobře, a to ze mzdových statistik. Dnes už ani nejpitomější agitační plátek nemůže použít titulek „Skandál! Většina obyvatelstva nepobírá ani průměrný plat!“, protože všichni vědí, že na tom není nic pohoršujícího a že to ani jinak být nemůže. Hodnotu průměrné mzdy vychylují nahoru málo četné vysoké platy a tím kazí vypovídací hodnotu aritmetického průměru. Když Adam, Bětka, Cilka, Daniel a Ema pobírají postupně 15, 18, 24, 28 a 100 tisíc, pak mediánová mzda (24) popisuje jejich skupinu rozhodně výstižněji než průměrná (37).

V homogennější skupině, například kdyby Ema měla čtyřicet tisíc místo sta, by na tom však prakticky nezáleželo. Spočtěte si to sami a uvidíte, že se v takovém případě medián a průměr skoro neliší.

Což je důležité. Žádná objektivně správná střední hodnota totiž neexistuje! A obecně vzato, neexistuje žádný objektivně správný způsob práce se statistikou. Všechno to jsou jen nástroje, které si vybíráme podle toho, jako práci chceme udělat. Všechny se dají použít poctivěji i méně poctivě, chytře nebo hloupě. Statistika je exaktní disciplína, ale aplikace statistiky na reálný svět nikoli.

Když se nad tím zamyslíte, zjistíte například, že i mediánová mzda je matoucí údaj. Medián znamená, že polovina lidí bere méně, polovina více. Nejčastější mzda je však ještě nižší než medián. Kdybyste si opatřili průměrný vzorek obyvatel ČR a vhodným způsobem se jich otázali, kolik berou (například tím, že platy rozparcelujete do intervalů po pětistovce), nejčastější hodnota bude číslo nižší než medián. Říká se mu modus. Představte si rozdělení platů v populaci jako deformovanou Gaussovu křivku, strmou zleva a plošší zprava. Modus odpovídá jejímu vrcholu. Medián je dál vpravo a průměr ještě dál.

Mohlo by to být i opačně – průměr menší než medián? Mohlo, představte si jednu jedinou chudou rodinu, která se nějakým způsobem nastěhuje do bohaté čtvrti; dejme tomu, že bydlí v zahradním domku za jednou z vil a stará se o trávníky. Její nižší příjem srazí průměr v sousedství o trochu dolů, medián i modus zůstanou výše, Gaussova křivka bude deformovaná opačně.

CIF_tip3

       

Nassim Nicholas Taleb ve své nedávno vydané knize Zrádná nahodilost (nedávno vydaná je jen u nás, on ji napsal už v roce 2001) tvrdí, že dobře si umíme představit jen věci rozdělené symetricky — tedy tak, že průměr, medián i modus jsou totéž číslo, což platí u ideální Gaussovy křivky. Asymetrie se vzpírá našim instinktům a musíme-li ji vzít v úvahu, děláme často chyby.

Čapkovsky moralizujícím stylem zmíněným na začátku proto navrhuji shovívavost vůči těm médiím, která nerozumějí mediánům. Jejich čtenářům však zároveň nutno doporučit obezřetnost. A kalkulačku u ruky.

Petr Koubský

Autor je analytik a publicista na volné noze, dříve pracoval v Softwarových novinách a Inside, předtím u sálového počítače. Trochu také učí na VŠE a vydává placený magazín 067.cz.

Školení Google Analytics

  •  
    Jak vyhodnocovat úspěšnost reklamních kampaní.
  • Jak ovládat Google Analytics a najít co potřebuji.
  • Jak měřit hodnotu objednávek z webu.

Detailní informace o školení Google Analytics »

       
33 názorů Vstoupit do diskuse
poslední názor přidán 30. 5. 2013 22:12

Tento text je již více než dva měsíce starý. Chcete-li na něj reagovat v diskusi, pravděpodobně vám již nikdo neodpoví. Pro řešení aktuálních problémů doporučujeme využít naše diskusní fórum.

Zasílat nově přidané příspěvky e-mailem