Rozdíl Mezi Průměrem, Mediánem A Režimem

Rozdíl Mezi Průměrem, Mediánem A Režimem
Rozdíl Mezi Průměrem, Mediánem A Režimem

Video: Rozdíl Mezi Průměrem, Mediánem A Režimem

Video: Rozdíl Mezi Průměrem, Mediánem A Režimem
Video: 3 - Modus a medián (MAT - Statistika) 2024, Prosinec
Anonim

Střední vs. střední vs. režim

Průměr, medián a režim jsou primární měřítka centrální tendence používané v popisné statistice. Jsou zcela odlišné od sebe navzájem a případy, ve kterých se používají k shrnutí údajů, se také liší.

Znamenat

Aritmetický průměr je součet datových hodnot děleno počtem datových hodnot, tj

Pokud data pocházejí z prostoru vzorku, nazývá se to průměr vzorku (

), což je popisná statistika vzorku. I když se jedná o nejčastěji používané popisné měřítko pro vzorek, nejedná se o robustní statistiku. Je velmi citlivý na odlehlé hodnoty a oscilace.

Vezměme si například průměrný příjem občanů konkrétního města. Protože jsou všechny hodnoty dat sečteny a poté rozděleny, příjem extrémně bohatého člověka významně ovlivňuje průměr. Průměrné hodnoty proto nejsou dobrým znázorněním dat vždy.

Také v případě střídavého signálu se proud procházející prvkem periodicky mění z pozitivního směru do negativního směru a naopak. Vezmeme-li průměrný proud procházející prvkem v jednom období, dá hodnotu 0, což znamená, že prvkem neprošel žádný proud, což zjevně není pravda. Proto ani v tomto případě není aritmetický průměr dobrým měřítkem.

Aritmetický průměr je dobrým indikátorem, když jsou data rovnoměrně rozložena. Pro normální rozdělení je průměr roven módu a mediánu. Má také nejnižší zbytky, když vezmeme v úvahu kořenovou střední kvadratickou chybu; proto je nejlepším popisným měřítkem, když je nutné reprezentovat datovou sadu jediným číslem.

Medián

Hodnoty středního datového bodu po seřazení všech hodnot dat ve vzestupném pořadí jsou definovány jako medián datové sady. Medián je 2. kvartil, 5. decil a 50. percentil.

• Pokud je počet pozorování (datových bodů) lichý, pak střední hodnota je pozorování přesně uprostřed seřazeného seznamu.

• Pokud je počet pozorování (datových bodů) sudý, pak je medián průměrem dvou středních pozorování v seřazeném seznamu.

Medián rozděluje pozorování do dvou skupin; tj. skupina (50%) hodnot vyšších a skupina (50%) hodnot nižší než medián. Mediány se konkrétně používají v šikmých distribucích a představují data docela lépe než aritmetický průměr.

Režim

Režim je nejvíce se vyskytující číslo v sadě pozorování. Režim datové sady se vypočítá vyhledáním frekvence každého prvku v sadě.

• Pokud se žádná hodnota neobjeví více než jednou, pak datová sada nemá žádný režim.

• Jinak je jakákoli hodnota, která se vyskytuje s největší frekvencí, režimem datové sady.

V sadě může existovat více než 1 režim; proto režim není jedinečnou statistikou datové sady. V jednotné distribuci existuje jeden režim. Režim diskrétního rozdělení pravděpodobnosti je bod, kde funkce pravděpodobnostní hmotnosti dosáhne svého nejvyššího bodu. Z výše uvedených interpretací můžeme říci, že globální maxima jsou režimy.

Zvažte použití všech tří opatření na následující soubor dat.

ÚDAJE: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}

Průměr = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25 = 8.12

Medián = 9 (13. prvek)

Režim = 9 (frekvence 9 = 5)

Jaký je rozdíl mezi průměrem, průměrem a režimem?

• Aritmetický průměr je součet hodnot (pozorování) dělený počtem pozorování. Není to robustní statistika a je silně závislá na povaze normální distribuce v rámci uvažovaného rozdělení. Jedna odlehlá hodnota může způsobit významný posun ve střední hodnotě s relativně zavádějícími hodnotami. Koncept lze rozšířit na geometrický průměr, harmonický průměr, vážený průměr atd.

• Medián je střední hodnota souboru pozorování a je relativně méně ovlivněna odlehlými hodnotami. Ve velmi zkreslených případech může poskytnout dobrý odhad jako souhrnná statistika.

• Režim je nejběžnější pozorovací hodnota v datové sadě. Pokud je distribuce kladně zkosená, režim leží zleva ke střední hodnotě a pokud je záporně zkosená, leží režim přímo ke střední hodnotě.

• Pokud je kladně vychýleno, střední hodnota má hodnotu mediánu; pokud je záporně zkosený průměr je nalevo od mediánu.

• V normálním rozdělení jsou všechny tři, průměr, režim a medián stejné.

Doporučená: