Średnia vs Mediana - Różnice między metodami stosowanymi w statystykach

Różnica między średnią a medianą

Średnia i Mediana to dwa powszechnie używane terminy w matematyce, średnia jest jak średnia z podanych liczb i sumuje liczby i dzieli je przez liczbę liczb, która daje nam średnią, podczas gdy mediana zwraca średnią liczbę z całości zbiór danych i jeśli zbiór danych jest parzysty, wtedy mediana dodaje dwie środkowe liczby i dzieli ją przez 2, otrzymując medianę.

Są miarą tendencji centralnej i często są używane do pomiaru dużych zbiorów danych, w których należy sporządzać analizy, a wyniki są interpretowane. Średnia, mediana i mod to trzy miary średnich, które pokazują rozrzut danych od średniej lub średniej. Metody te są szeroko stosowane w statystykach, podczas gdy średnia wartość danych jest najczęściej stosowaną metodą spośród trzech.

Co to znaczy?

Średnia to prosta suma liczb obserwacji w tablicy podzielona przez liczbę obserwacji. Na przykład, jeśli mówimy o średnim wzroście lub średnim wzroście grupy składającej się z 5 osób. Średni wzrost zostałby obliczony poprzez zsumowanie wzrostu 5 osób podzielonych przez liczbę osób, czyli 5.

Formuła

Średnia formuła = (suma wszystkich obserwacji / liczba obserwacji)

Co to jest mediana?

Z drugiej strony mediana to środkowa liczba w zestawie tablicy danych, która oddziela wyższy zestaw danych od niższego. Aby obliczyć medianę danych, należy najpierw uporządkować dane w porządku rosnącym. Gdy zbiór danych ma liczność, należy wziąć średnią z dwóch środkowych liczb w zestawie danych. Jednak te dwie metody są często używane zamiennie.

Formuła

Formuła mediany = (n + 1) / 2

kiedy n jest liczbą nieparzystą

Mediana = ((n / 2) + ((n / 2) +1)) / 2

kiedy n jest liczbą parzystą

Infografiki średniej i mediany

Zobaczmy najważniejsze różnice między średnią a medianą.

Średnia vs mediana Kluczowe różnice

  • Średnia jest prosta w użyciu i zastosowaniu oraz może być stosowana do dowolnego zestawu danych, zarówno parzystych, jak i nieparzystych. Z drugiej strony mediana jest nieco skomplikowana w użyciu, a przed obliczeniem zestaw danych należy najpierw uporządkować w porządku rosnącym lub malejącym.
  • Średnia jest zwykle używana do normalnych rozkładów, podczas gdy mediana jest używana do zbioru danych o skośnych rozkładach.
  • Średnia jest prosta, ale nie jest solidna, ponieważ może zawierać wartości odstające w rozkładach i czasami może nie dawać użytkownikowi poprawnych wyników do interpretacji. Z drugiej strony, metoda mediany jest solidna i lepiej nadaje się do użycia, ponieważ jest używana do skośnych rozkładów w celu uzyskania centralnej tendencji zestawu dat i da użytkownikowi wiele dokładnych wyników w porównaniu ze średnią
  • Istnieje tylko jeden wzór na średnią, która jest sumą wszystkich obserwacji podzieloną przez liczbę obserwacji. Podczas gdy mediana ma dwie formuły, jedną z nieparzystych, w której tylko środkowe liczby ze zbioru danych stają się medianą. Ale kiedy mamy parzysty zestaw danych, wybiera się środek dwóch wartości i dzieli przez 2, co daje nam medianę parzystego zestawu danych.

Średnia vs mediana Tabela porównawcza

Oznaczać Mediana
Średnia jest obliczana poprzez zsumowanie wszystkich wartości w tablicy danych, którą następnie dzieli się przez liczbę obserwacji. Mediana to dokładna środkowa wartość zbioru danych. Można go obliczyć, układając zestaw danych w porządku rosnącym, a następnie znajdując lub wybierając środkową wartość ze zbioru danych.
Ma szersze zastosowanie w branży ze względu na łatwe obliczenie średniej i daje nam szybką liczbę. Nie jest często używany w branży, ale jest bardziej kompletny i dokładny niż średnia, która jest zwykłą sumą liczb.
Jest używany ogólnie dla zbioru danych o normalnym wypaczeniu, tj. Rozkładu normalnego. Szczególnie przydatne jest opisanie zbioru danych ze znacznym przekrzywieniem danych lub gdy dane mają długi ogon. Jest szeroko stosowany, gdy konspekty mają znaczną wagę w danych, które nie są dobrą metodą obliczania.
Nie jest to solidne narzędzie obliczeniowe pozwalające wyprowadzić główną tendencję. Jest to bardzo solidne narzędzie, ponieważ określa wagę w danych, która zwykle jest wysoka przy dłuższych ogonach.
Jest bardzo wrażliwy na wartości odstające. Wartości odstające mają na nią znacznie mniejszy wpływ.
Jest prosty w użyciu Ma złożony charakter.
Nie można go obliczyć dla danych kategorycznych, ponieważ wartości nie mogą być sumowane. Nie można go zidentyfikować dla skategoryzowanych danych nominalnych, ponieważ nie można ich logicznie uporządkować.

Wniosek

Oprócz średniej i mediany istnieje jeszcze jedna metoda, która jest często używana do pomiaru tendencji centralnej, czyli mod. Tryb to wartość, która najczęściej występuje w zbiorze danych; tryb ma przewagę nad średnią i medianą, ponieważ można go znaleźć zarówno dla zbiorów danych liczbowych, jak i skategoryzowanych.

Pomimo istnienia trybu i mediany wyższości lepszych wyników i analizy nad średnią, średnia jest nadal najbardziej odpowiednią miarą tendencji centralnej, zwłaszcza jeśli zbiór danych ma rozkład normalny, a dane są zwykle wypaczone.

Jako dobry analityk centralna tendencja powinna być mierzona wszystkimi trzema metodami danych, a wariancje w analizie powinny być rozważane i dokładnie analizowane, aby uzyskać lepsze i dokładniejsze wyniki w zestawie danych.

Interesujące artykuły...