Rozkład normalny w statystyce - definicja, przykład, interpretacja

Co to jest rozkład normalny w statystykach?

Rozkład normalny to krzywa rozkładu częstotliwości w kształcie dzwonu, która pomaga opisać wszystkie możliwe wartości, jakie zmienna losowa może przyjąć w danym zakresie, przy czym większość obszaru rozkładu znajduje się pośrodku, a niewiele w ogonach, na skrajach. Ten rozkład ma dwa kluczowe parametry: średnią (µ) i odchylenie standardowe (σ), które odgrywa kluczową rolę w obliczaniu zwrotu z aktywów oraz w strategii zarządzania ryzykiem.

Jak interpretować rozkład normalny

Powyższy rysunek pokazuje, że statystyczny rozkład normalny ma kształt dzwonu. Zakres możliwych wyników tego rozkładu to całkowite liczby rzeczywiste od-between do + ∞. Ogony krzywej dzwonowej rozciągają się po obu stronach wykresu (+/-) bez ograniczeń.

  • Około 68% wszystkich obserwacji mieści się w zakresie +/- jednego odchylenia standardowego (σ)
  • Około 95% wszystkich obserwacji mieści się w zakresie +/- dwóch odchyleń standardowych (σ)
  • Około 99% wszystkich obserwacji mieści się w zakresie +/- trzech odchyleń standardowych (σ)

Ma skośność równą zero (symetria rozkładu). Jeśli rozkład danych jest asymetryczny, to rozkład jest nierównomierny, jeśli zbiór danych ma skośność większą niż zero lub dodatnią skośność. Wtedy prawy ogon rozkładu jest bardziej wydłużony niż lewy, a dla ujemnej skośności (mniejszej niż zero) lewy ogon będzie dłuższy niż prawy.

Ma kurtoozę 3 (mierzy szczytowość rozkładu), co wskazuje, że dystrybucja nie jest ani zbyt szczytowa, ani zbyt cienka. Jeśli kurtoza jest większa niż trzy, to rozkład jest bardziej szczytowy z grubszymi ogonami, a jeśli kurtooza jest mniejsza niż trzy, to ma cienkie ogony, a punkt szczytowy jest niższy niż rozkład normalny.

Charakterystyka

  • Reprezentują rodzinę rozkładu, w której średnia i odchylenie określają kształt rozkładu.
  • Średnia, mediana i tryb tego rozkładu są równe.
  • Połowa wartości znajduje się po lewej stronie środka, a druga po prawej.
  • Całkowita wartość pod krzywą standardową zawsze będzie wynosić jeden.
  • Najprawdopodobniej rozkład znajduje się w środku, a mniej wartości znajduje się na końcu.

Transformacja (Z)

Funkcja gęstości prawdopodobieństwa (PDF) zmiennej losowej (X) o rozkładzie jest dana wzorem:

gdzie -∞ <x <∞; -∞ <µ 0

Gdzie,

  • F (x) = normalna funkcja prawdopodobieństwa
  • x = zmienna losowa
  • µ = średnia dystrybucji
  • σ = odchylenie standardowe rozkładu
  • π = 3,14159
  • e = 2,71828

Formuła transformacji

Gdzie,

  • X = zmienna losowa

Przykłady rozkładu normalnego w statystyce

Omówmy następujące przykłady.

Przykład 1

Załóżmy, że firma ma 10000 pracowników i wiele struktur wynagrodzeń zgodnie ze stanowiskiem, na którym pracuje pracownik. Wynagrodzenia rozkładają się ogólnie ze średnią populacyjną µ = 60 000 USD i odchyleniem standardowym populacji σ = 15 000 USD. Jakie będzie prawdopodobieństwo, że losowo wybrany pracownik będzie zarabiał mniej niż 45 000 USD rocznie.

Rozwiązanie

Jak pokazano na powyższym rysunku, aby odpowiedzieć na to pytanie, musimy znaleźć obszar pod krzywą normalną od 45 do ogona po lewej stronie. Musimy także użyć wartości tabeli Z, aby uzyskać właściwą odpowiedź.

Po pierwsze, musimy zamienić podaną średnią i odchylenie standardowe na standardowy rozkład normalny o średniej (µ) = 0 i odchyleniu standardowym (σ) = 1, używając wzoru przekształcenia.

Po konwersji musimy przejrzeć tabelę Z, aby znaleźć odpowiednią wartość, która da nam poprawną odpowiedź.

Dany,

  • Średnia (µ) = 60 000 USD
  • Odchylenie standardowe (σ) = 15000 USD
  • Zmienna losowa (x) = 45000 USD

Transformacja (z) = (45000 - 60000/15000)

Transformacja (z) = -1

Teraz wartość odpowiadająca -1 w tabeli Z to 0,1587, co oznacza obszar pod krzywą od 45 do drogi w lewo. Wskazywało, że kiedy losowo wybieramy pracownika, prawdopodobieństwo zarobienia mniej niż 45 000 $ rocznie wynosi 15,87%.

Przykład nr 2

Teraz zachowując ten sam scenariusz co powyżej, sprawdź prawdopodobieństwo, że losowo wybrany pracownik zarabia ponad 80 000 USD rocznie przy użyciu rozkładu normalnego.

Rozwiązanie

W tym pytaniu musimy znaleźć zacieniony obszar od 80 do prawego ogona, używając tego samego wzoru.

Dany,

  • Średnia (µ) = 60 000 USD
  • Odchylenie standardowe (σ) = 15000 USD
  • Zmienna losowa (X) = 80 000 USD

Transformacja (z) = (80000 - 60000/15000)

Transformacja (z) = 1,33

Zgodnie z tabelą Z, równowartość 1,33 to 0,9082 lub 90,82%, co pokazuje, że prawdopodobieństwo losowego wyboru pracowników zarabiających mniej niż 80 000 USD rocznie wynosi 90,82%.

Ale zgodnie z pytaniem musimy określić prawdopodobieństwo, że przypadkowi pracownicy będą zarabiać więcej niż 80 000 dolarów rocznie, więc musimy odjąć wartość od 100.

  • Zmienna losowa (X) = 100% - 90,82%
  • Zmienna losowa (X) = 9,18%

Zatem prawdopodobieństwo, że pracownicy zarabiają więcej niż 80 000 USD rocznie, wynosi 9,18%.

Używa

  • Wykres techniczny giełdy jest często krzywą dzwonową, umożliwiającą analitykom i inwestorom wyciąganie wniosków statystycznych na temat oczekiwanego zwrotu i ryzyka związanego z akcjami.
  • Jest używany w świecie rzeczywistym, na przykład do określania najbardziej prawdopodobnego czasu potrzebnego firmom pizzerii na dostarczenie pizzy i wielu innych rzeczywistych zastosowań.
  • Używany do porównywania wysokości danego zbioru populacji, w którym większość ludzi będzie miała średni rozmiar, a bardzo niewiele osób będzie miało wzrost powyżej lub poniżej średniej.
  • Służą do określania średnich wyników w nauce studentów, co pomaga w porównywaniu rang studentów.

Wniosek

Dystrybucja normalna znajduje zastosowanie w nauce i analizie danych. Zaawansowane technologie, takie jak sztuczna inteligencja i uczenie maszynowe, wykorzystywane wraz z tą dystrybucją, mogą zapewnić lepszą jakość danych, co pomoże osobom i firmom w skutecznym podejmowaniu decyzji.

Interesujące artykuły...