Reguła empiryczna - definicja, formuła, jak używać w statystyce?

Jaka jest reguła empiryczna w statystyce?

Empiryczna reguła statystyki stwierdza, że ​​prawie wszystkie (95%) obserwacji w rozkładzie normalnym mieszczą się w granicach 3 odchyleń standardowych od średniej. To bardzo ważna zasada, która pomaga w prognozowaniu.

Formuła

Formuła pokazuje przewidywany odsetek obserwacji, które będą mieścić się w każdym odchyleniu standardowym od średniej.

Reguła mówi, że:

  • 68% obserwacji będzie się mieścić w zakresie +/- 1 odchylenia standardowego od średniej
  • 95% obserwacji będzie się mieścić w zakresie +/- 2 odchylenia standardowego od średniej
  • 7% obserwacji będzie się mieścić w zakresie +/- 3 odchyleń standardowych od średniej

Jak używać?

Jest to używane w trendach prognozowania zbioru danych. Gdy zbiór danych jest obszerny i badanie całej populacji staje się trudne, można zastosować regułę empiryczną do próbki, aby oszacować, jak zareagują dane w populacji, jeśli zostaniesz poproszony o określenie średniej pensji wszystkich księgowych w USA. Wtedy jest to trudne zadanie, ponieważ populacja jest ogromna. Zatem w takim przypadku możesz wybrać, powiedzmy, 90 obserwacji losowo z całej populacji.

Więc teraz będziesz mieć 90 pensji. Musisz znaleźć średnią i odchylenie standardowe obserwacji. Jeśli obserwacja jest zgodna z rozkładem normalnym, można to zastosować i można oszacować wynagrodzenie wszystkich księgowych w USA.

Powiedzmy, że średnia pensja próbki wynosi 90 000 dolarów. Odchylenie standardowe wynosi 5000 USD. Tak więc spośród całej populacji 68% księgowych pobiera pensje w przedziale +/- 1 odchylenie standardowe od średniej. Średnia wynosi 90000 USD, a odchylenie standardowe 5000 USD. Zatem 68% wszystkich księgowych w USA otrzymuje wypłaty w przedziale 90 000 USD +/- (1 * 5000 USD). Czyli od 85 000 do 95 000 dolarów

Jeśli rozłożymy trochę więcej, to 95% wszystkich księgowych w USA jest opłacanych w przedziale od średniej +/- 2 odchylenia standardowe. 90000 USD +/- (2 * 5000). Więc zakres wynosi od 80 000 do 100 000 USD.

W szerszym zakresie 99,7% wszystkich księgowych pobiera pensje w przedziale od średniej +/- 3 odchylenia standardowe. To jest 90000 +/- (3 * 5000). Zakres wynosi od 75 000 USD do 105 000 USD

Widać wyraźnie, że bez badania całej populacji można by dokonać szacunków dotyczących populacji. Jeśli ktoś planuje pracę jako księgowy w USA, to z łatwością może spodziewać się, że jego pensja wyniesie od 75 000 do 105 000 dolarów

Takie oszacowanie ułatwia pracę i prognozuje przyszłość.

Przykłady reguł empirycznych

Pan X próbuje obliczyć średnią liczbę lat, jaką osoba przeżywa po przejściu na emeryturę, biorąc pod uwagę wiek emerytalny wynoszący 60. Jeżeli średnia liczba lat przeżycia dla 50 przypadkowych obserwacji wynosi 20 lat, a odchylenie standardowe wynosi 3, należy ustalić prawdopodobieństwo, że osoba będzie pobierać emeryturę przez ponad 23 lata

Rozwiązanie

Reguła empiryczna stwierdza, że ​​68% obserwacji będzie się mieścić w granicach 1 odchylenia standardowego od średniej. Tutaj średnia z obserwacji wynosi 20.

68% obserwacji będzie się mieścić w granicach 20 +/- 1 (odchylenie standardowe), czyli 20 +/- 3. Zatem zakres wynosi od 17 do 23.

Istnieje 68% szans, że minimalna liczba lat, które osoba przeżyje po przejściu na emeryturę, wynosi od 17 do 23. Obecnie odsetek, który znajduje się poza tym zakresem, wynosi (100 - 68) = 32%. 32 jest rozłożone równo po obu stronach, co oznacza 16% szans, że minimalne lata będą poniżej 17 i 16%, że minimalne lata będą większe niż 23.

Zatem prawdopodobieństwo, że dana osoba będzie pobierać więcej niż 23 lata emerytury, wynosi 16%.

Reguła empiryczna a twierdzenie Czebyszewa

Reguła empiryczna jest stosowana do zbiorów danych o rozkładzie normalnym, czyli w kształcie dzwonu. W rozkładzie normalnym po obu stronach rozkładu prawdopodobieństwo wynosi 50%.

Jeśli zbiór danych nie ma rozkładu normalnego, to istnieje inne przybliżenie lub reguła, która ma zastosowanie do wszystkich typów zbiorów danych, a mianowicie twierdzenie Czebyszewa. Mówi o trzech rzeczach:

  • Przynajmniej 3/4 th wszystkich obserwacji będą się mieścić 2Standard odchyleń od średniej. To mocne przybliżenie. To znaczy, jeśli istnieją 100 obserwacje, następnie 3/4 th z obserwacji, które są o 75 obserwacje będą leżeć w zakresie +/- 2 odchylenia standardowe od średniej.
  • Przynajmniej 8/9 th wszystkich obserwacji będą się mieścić 3Standard odchyleń od średniej.
  • Co najmniej 1 - 1 / k 2 wszystkich obserwacji mieści się w K odchylenie standardowe od średniej. Tutaj K jest określane jako dowolna liczba całkowita.

Kiedy użyć?

Dane są jak złoto we współczesnym świecie. Ogromne dane pochodzą z różnych źródeł i są wykorzystywane do różnych przybliżeń lub prognoz. Jeśli zestaw danych ma rozkład normalny, pokazuje krzywą w kształcie dzwonu; wtedy można zastosować regułę empiryczną. Jest stosowany do obserwacji w celu przybliżenia populacji.

Kiedy już zobaczymy, że obserwacje wykazują strukturę rozkładu normalnego, wówczas stosuje się regułę empiryczną, aby znaleźć kilka prawdopodobieństw obserwacji. Reguła jest niezwykle przydatna w przypadku wielu prognoz statystycznych.

Wniosek

Reguła empiryczna to koncepcja statystyczna, która pomaga zobrazować prawdopodobieństwo obserwacji i jest bardzo przydatna podczas znajdowania przybliżenia dużej populacji. Należy zawsze zauważyć, że są to przybliżenia. Zawsze istnieją szanse na wartości odstające, które nie mieszczą się w rozkładzie. Zatem wyniki nie są dokładne i należy podjąć środki ostrożności, postępując zgodnie z prognozą.

Interesujące artykuły...