Definicja rozkładu hipergeometrycznego
W statystyce i teorii prawdopodobieństwa rozkład hipergeometryczny jest w zasadzie odrębnym rozkładem prawdopodobieństwa, który określa prawdopodobieństwo k sukcesów (tj. Niektórych losowań dla wylosowanego obiektu, który ma określoną cechę) w n liczbie losowań, bez żadnej zamiany, z danego wielkość populacji N, która obejmuje dokładnie K obiektów posiadających tę cechę, w przypadku których losowanie może się powieść lub może zakończyć się niepowodzeniem.
Wzór na prawdopodobieństwo rozkładu hipergeometrycznego wyprowadza się na podstawie liczby pozycji w populacji, liczby pozycji w próbie, liczby sukcesów w populacji, liczby sukcesów w próbie i kilku kombinacji. Matematycznie prawdopodobieństwo jest przedstawiane jako:
P = K C k * (N - K) C (n - k) / N C n
gdzie,
- N = liczba pozycji w populacji
- n = liczba pozycji w próbie
- K = liczba sukcesów w populacji
- k = liczba sukcesów w próbie
Średnia i odchylenie standardowe rozkładu hipergeometrycznego jest wyrażone jako:
Średnia = n * K / N Odchylenie standardowe = (n * K * (N - K) * (N - n) / (N 2 * (N - 1))) 1/2Wyjaśnienie
Krok 1: Najpierw określ całkowitą liczbę przedmiotów w populacji, która jest oznaczona przez N. Na przykład liczba kart do gry w talii wynosi 52.
Krok 2: Następnie określ liczbę elementów w próbce, oznaczoną n - na przykład liczba kart wyciągniętych z talii.
Krok 3: Następnie określ instancje, które będą uważane za sukcesy w populacji i są oznaczone literą K. Na przykład liczba kier w całej talii, która wynosi 13.
Krok 4: Następnie określ instancje, które zostaną uznane za sukcesy w wylosowanej próbie i oznacz je k. Np. Liczba kier w kartach dobranych z talii.
Krok 5: Na koniec formuła prawdopodobieństwa rozkładu hipergeometrycznego jest wyprowadzana na podstawie liczby pozycji w populacji (krok 1), liczby pozycji w próbie (krok 2), liczby sukcesów w populacji (krok 3) i liczbę sukcesów w przykładzie (krok 4), jak pokazano poniżej.
P = K C k * (N - K) C (n - k) / N C nPrzykłady dystrybucji hipergeometrycznej (z szablonem Excel)
Przykład 1
Weźmy na przykład zwykłą formę talii kart do gry, w której 6 kart jest losowanych bez wymiany. Określ prawdopodobieństwo wylosowania dokładnie 4 kart w kolorze czerwonym, czyli karo lub kier.
- Biorąc pod uwagę, N = 52 (ponieważ w zwykłej talii do gry są 52 karty)
- n = 6 (liczba losowanych kart z talii)
- K = 26 (ponieważ jest po 13 czerwonych kart w kolorze karo i kier)
- k = 4 (liczba czerwonych kartek, które należy uznać za udane w wylosowanej próbie)
Rozwiązanie:
W związku z tym prawdopodobieństwo wylosowania dokładnie 4 kart w kolorze czerwonym w wylosowanych 6 kartach można obliczyć za pomocą powyższego wzoru jako:

Prawdopodobieństwo = K C k * (N - K) C (n - k) / N C n
= 26 C 4 * (52 - 26) C (6 - 4) / 52 C 6
= 26 C, 4 * 26 C, 2 / 52 C, 6
= 14950 * 325/20358520
Prawdopodobieństwo wyniesie -

Prawdopodobieństwo = 0,2387 ~ 23,87%
Dlatego istnieje prawdopodobieństwo 23,87% wylosowania dokładnie 4 czerwonych kartek podczas dobierania 6 losowych kart ze zwykłej talii.
Przykład nr 2
Weźmy inny przykład portfela, który zawiera 5 banknotów 100 $ i 7 banknotów 1 $. Jeśli 4 rachunki zostaną wybrane losowo, określ prawdopodobieństwo wybrania dokładnie 3 banknotów 100 $.
- Biorąc pod uwagę, N = 12 (liczba banknotów 100 $ + liczba banknotów 1 $)
- n = 4 (liczba losowo wybranych rachunków)
- K = 5 (ponieważ jest 5 banknotów 100 $)
- k = 3 (liczba banknotów 100 $, które należy uznać za sukces w wybranej próbie)
Rozwiązanie:
Dlatego prawdopodobieństwo wybrania dokładnie 3 banknotów 100 $ w losowo wybranych 4 banknotach można obliczyć za pomocą powyższego wzoru jako:

Prawdopodobieństwo = K C k * (N - K) C (n - k) / N C n
= 5 C 3 * (12 - 5) C (4 - 3) / 12 C 4
= 5 C 3 * 7 C, 1 / 12 C 4
= 10 * 7/495
Prawdopodobieństwo wyniesie -

Prawdopodobieństwo = 0,1414 ~ 14,14%
Dlatego istnieje prawdopodobieństwo 14,14% wyboru dokładnie 3 banknotów 100 $ podczas losowania 4 losowych banknotów.
Trafność i zastosowania
Pojęcie rozkładu hipergeometrycznego jest ważne, ponieważ zapewnia dokładny sposób określania prawdopodobieństw, gdy liczba prób nie jest bardzo duża i że próbki są pobierane ze skończonej populacji bez zastępowania. W rzeczywistości rozkład hipergeometryczny jest analogiczny do rozkładu dwumianowego, który jest używany, gdy liczba prób jest znacznie większa. Jednak do pobierania próbek bez wymiany stosuje się głównie rozkład hipergeometryczny.