Parametrické vs. neparametrické
Statistika je jedna větev studií, která nám umožňuje porozumět populační dynamice pomocí vzorků odebraných z určité zájmové populace. Je nezbytné, aby tyto vzorky byly náhodné. Mnoho vzorců je vytvořeno začleněním matematiky, aby se vyvodily závěry o populačních parametrech. Přirozeně každá populace může mít „normální rozdělení“, kde rozptyl dat / vzorků má ve frekvenčním grafu tvar zvonu. Při normální distribuci se většina vzorků koncentruje kolem průměru a 68%, 95%, 99% dat se nachází v rámci 1, 2, respektive 3 standardních odchylek. Parametrické a neparametrické statistiky závisí na tom, zda je bráno v úvahu normální rozdělení.
Co je to parametrická statistika?
Parametrická statistika je statistika, ve které jsou data / vzorky považovány za získané z normálního rozdělení. Definice parametrické statistiky je „statistika, která předpokládá, že data pocházejí z typu rozdělení pravděpodobnosti a vyvozuje závěry o parametrech rozdělení“. Většina známých základních statistických metod patří do této skupiny. Ve skutečnosti nemusí být běžně distribuovány. Proto je tento typ statistiky založen na více předpokladech. Pokud jsou data / vzorky normálně distribuovány nebo téměř normálně distribuovány, vzorce mohou přinést přesné výsledky a závěry. Pokud je však předpoklad normální distribuce nesprávný, parametrické statistiky mohou být docela zavádějící.
Co je to neparametrická statistika?
Neparametrická statistika je také známá jako statistika bez distribuce. Výhodou tohoto typu statistiky je, že nemusí vytvářet předpoklad, jak bylo dříve provedeno pomocí parametrických parametrů. Neparametrické statistické výpočty věnují pozornost mediánům než prostředkům. Pokud se tedy jedna nebo dvě odchylují od střední hodnoty, jejich účinek je zanedbáván. Obecně se dává přednost parametrické statistice, protože má větší schopnost odmítnout falešnou hypotézu než neparametrická metoda. Jedním z nejznámějších neparametrických testů je test chí-kvadrát. Pro některé parametrické testy existují neparametrické analogy, jako je Wilcoxonův T test pro párový vzorek t-testu, Mann-Whitneyův U test pro nezávislé vzorky t-testu, Spearmanova korelace pro Pearsonovu korelaci atd. Pro jeden vzorkový t-test neexistuje srovnatelný neparametrický test.
Jaký je rozdíl mezi parametrickým a neparametrickým?
• Parametrické statistiky závisí na normálním rozdělení, ale neparametrické statistiky nezávisí na normálním rozdělení.
• Parametrické statistiky vytvářejí více předpokladů než neparametrické statistiky.
• Parametrické statistiky používají ve srovnání s neparametrickými statistikami jednodušší vzorce.
• Pokud se předpokládá, že populace je normálně distribuovaná nebo blízká normálně distribuované populaci, je nejlepší použít parametrickou statistiku. Pokud ne, je nejlepší použít neparametrickou metodu.
• Většina běžně známých základních statistických metod patří do parametrické statistiky. Neparametrická statistika se používá šetrně a používá se pro speciální případy.