Co to jest dystrybucja próbek?
Rozkład próbkowania można zdefiniować jako rozkład prawdopodobieństwa przy użyciu statystyk, najpierw wybierając określoną populację, a następnie wykorzystując losowe próbki, które są pobierane z populacji, tj. Zasadniczo ma na celu rozłożenie częstości związanych z rozprzestrzenianiem się różnych wyników lub wyniki, które mogą mieć miejsce dla określonej wybranej populacji.
Wyjaśnienie
- Wielu badaczy, akademików, strategów rynkowych itp. Zamiast wybierać całą populację, wyprzedza rozkład próbkowania. Dzięki temu zestaw danych jest łatwy i łatwy w zarządzaniu. Dla ułatwienia załóżmy, że marketer chce przeprowadzić analizę liczby młodych ludzi jeżdżących na rowerze między dwoma regionami w wieku 13-18 lat.
- W tym celu nie weźmie pod uwagę całej populacji obecnej w obu regionach w wieku 13-18 lat, co jest praktycznie niemożliwe, a nawet jeśli zostanie wykonane, jest to zbyt czasochłonne, a zbiorem danych nie da się zarządzać. . Zamiast tego marketer weźmie próbki 200 z każdego regionu i dokona dystrybucji.
- Średnia liczba przypadków użycia roweru jest tutaj określana jako średnia z próby. Każda wybrana próbka ma wygenerowaną własną średnią, a rozkład uzyskanej średniej średniej jest definiowany jako rozkład próbki. Uzyskane odchylenie określa się jako błąd standardowy.

Przykład dystrybucji próbkowania
- Zakładając, że badacz prowadzi badanie wagi mieszkańców danego miasta i ma pięć obserwacji lub próbek, tj. 70kg, 75kg, 85kg, 80kg i 65kg. Ogólnie uważa się, że miasto ma rozkład normalny i utrzymuje standardowe odchylenie 5 kg w aspekcie miar wagi. Zatem średnią można obliczyć jako (70 + 75 + 85 + 80 + 65) / 5 = 75 kg.
- Zakładamy również, że wielkość populacji jest ogromna; tak więc aby przejść do drugiego kroku, podzielimy liczbę obserwacji lub próbek przez 1, tj. 1/5 = 0,20. Teraz musimy wziąć pierwiastek kwadratowy z 0,20, który wynosi 0,45. Następnie pierwiastek kwadratowy mnoży się przez odchylenie standardowe, tj. 0,45 * 5 = 2,25 kg. W ten sposób otrzymano błąd standardowy 2,25 kg, a otrzymana średnia wyniosła 75 kg. Te dwa czynniki można wykorzystać do opisu rozkładu.
Rodzaje dystrybucji próbek
# 1 - Rozkład próbkowania średniej
- Można to zdefiniować jako probabilistyczny rozkład wszystkich średnich próbek wybranych losowo o stałej wielkości z określonej populacji. Gdy próbki odstąpiły od normalnej populacji, rozprzestrzenianie się uzyskanej średniej będzie również normalne względem średniej i odchylenia standardowego.
- Jeśli populacja nie jest normalna, rozkład średnich będzie zbliżał się do rozkładu normalnego, pod warunkiem, że wielkość próby jest dość duża.
# 2 - Rozkład próbkowania proporcji
Jest to przede wszystkim związane ze statystykami dotyczącymi atrybutów. Tutaj pojawia się rola rozkładu dwumianowego. Generalnie reaguje na prawa rozkładu dwumianowego, ale wraz ze wzrostem wielkości próby zwykle ponownie staje się rozkładem normalnym.
# 3 - Dystrybucja T Studenta
Ten typ rozkładu stosuje się, gdy odchylenie standardowe populacji jest nieznane badaczowi lub gdy liczebność próby jest bardzo mała. Ten typ rozkładu jest bardzo symetryczny i spełnia warunek standardowej zmiennej normalnej. Wraz ze wzrostem wielkości próby nawet rozkład T ma tendencję do zbliżania się do rozkładu normalnego.
# 4 - Dystrybucja F.
- Kiedy większa wariancja jest obowiązkowo obecna w liczniku, rozkład F znajduje zastosowanie, ponieważ stopień swobody zmienia również krytyczne wartości F, co ma zastosowanie zarówno do dużych, jak i małych wariancji. Można to obliczyć na podstawie dostępnych tabel.
- Porównania dokonuje się na podstawie zmierzonej wartości F należącej do zbioru prób oraz wartości, która jest wyliczana z tabeli, jeżeli wcześniejsza jest równa lub większa od wartości z tabeli, hipoteza zerowa badania zostaje odrzucona.
# 5 - Rozkład wzoru Chi-kwadrat
Ten typ rozkładu jest używany, gdy zestaw danych obejmuje wartości, które obejmują sumowanie kwadratów. Dodawany jest zbiór kwadratów wielkości należących do wariancji próbek, a tym samym tworzony jest rozkład rozkładu, który nazywamy rozkładem chi-kwadrat.
Znaczenie
- Jest to ważne, ponieważ upraszcza ścieżkę do wnioskowania statystycznego. Ponadto pozwala skupić się na rozważaniach analitycznych na rozkładzie statycznym, a nie na mieszanym probabilistycznym rozrzutie każdej wybranej próbki.
- Za pomocą tego rozkładu można wyeliminować zmienność występującą w statystyce.
- Dostarcza nam odpowiedzi na temat prawdopodobnych wyników, które są najbardziej prawdopodobne.
- Odgrywają kluczową rolę w wnioskowych badaniach statystycznych, co oznacza, że odgrywają główną rolę w formułowaniu wniosków dotyczących całej populacji.
Wniosek
- Ma to kluczowe znaczenie w statystykach, ponieważ działają one jako główna wskazówka do wnioskowania statystycznego. Zasadniczo kierują one badacza, naukowców lub statystyków na temat rozprzestrzeniania się częstotliwości, sygnalizując szereg różnych prawdopodobnych wyników, które można dalej przypisać całej populacji.
- Czynnikiem głównym jest tutaj średnia z próby i błąd standardowy, który, jeśli jest szacowany, pomaga nam również obliczyć rozkład próbkowania. Istnieją różne rodzaje technik dystrybucji i każda z nich jest stosowana w oparciu o scenariusz i zestaw danych.