pátek 16. října 2020

Průměr není všechno

Aritmeticky průměr může a nemusí být vhodným ukazatelem centrální tendence pro soubor dat.

Centrální tendence v tomto případě, intuitivně řečeno, znamená hodnotu, která je určitým způsobem typická pro nějaká číselná data – kterou bychom jaksi „čekali“. Pro tyto účely existuje celá řada různých hodnot – aritmetický průměr, geometrický průměr, medián, modus a další. Nejznámějším a snad i nejpoužívanějším je bezpochyby aritmetický průměr.

Základním problémem s aritmetickým průměrem je skutečnost, že je málo robustní a tudíž velmi citlivý na tzv. outliery.

Je relativně dobře známo, že průměr značně pokulhává při reprezentaci platového ohodnocení. Existuje otřepaná fráze „ale dvě třetiny lidí na průměrný plat nedosáhnou“, která nicméně reflektuje realitu velmi přesně – takže tvrzení, že průměr není ohledně platu reprezentativní hodnota, asi nikoho velmi nepřekvapí.

Plat je totiž proměnná, která je omezená z jedné strany. Většina lidí v ČR vydělává něco mezi minimální mzdou (13 350,- Kč co do 2019) a řekněme 50 000. Problém je v tom, že stále existuje relativně velké množství lidí, kteří mají plat mnohem vyšší než to, i nad sto tisíc. Tito lidé významně ovlivňují průměr. Na druhou stranu neexistuje nikdo, kdo by legálně dostával plat a vydělával méně než 13 350,- – a proto je průměr nereprezentativně posunut o tolik nahoru.

V případě, že jsou outlieři takto asymetricky rozdělení, je lepší se spolehnout na medián nebo na modus.

Hodnot reprezentujících centrální tendenci existuje nepřeberné množství a všechny mají svoje výhody a svoje nevýhody. Neexistuje jedna jediná správná hodnota, kterou lze za všech okolností pro všechny účely přesně reprezentovat určitý soubor dat.





Bez faulu

Žádné komentáře:

Okomentovat

Zkoušky z lásky

Připadá mi to absolutně nemožné, ale buď se mi rozbilo vyhledávání, nebo jsem skutečně ještě nikdy nevyzval ke zrušení Vánoc. Tudíž je dost ...