Rozkład hipergeometryczny (definicja, wzór) - Jak obliczyć?

Definicja rozkładu hipergeometrycznego

W statystyce i teorii prawdopodobieństwa rozkład hipergeometryczny jest w zasadzie odrębnym rozkładem prawdopodobieństwa, który określa prawdopodobieństwo k sukcesów (tj. Niektórych losowań dla wylosowanego obiektu, który ma określoną cechę) w n liczbie losowań, bez żadnej zamiany, z danego wielkość populacji N, która obejmuje dokładnie K obiektów posiadających tę cechę, w przypadku których losowanie może się powieść lub może zakończyć się niepowodzeniem.

Wzór na prawdopodobieństwo rozkładu hipergeometrycznego wyprowadza się na podstawie liczby pozycji w populacji, liczby pozycji w próbie, liczby sukcesów w populacji, liczby sukcesów w próbie i kilku kombinacji. Matematycznie prawdopodobieństwo jest przedstawiane jako:

P = K C k * (N - K) C (n - k) / N C n

gdzie,

  • N = liczba pozycji w populacji
  • n = liczba pozycji w próbie
  • K = liczba sukcesów w populacji
  • k = liczba sukcesów w próbie

Średnia i odchylenie standardowe rozkładu hipergeometrycznego jest wyrażone jako:

Średnia = n * K / N Odchylenie standardowe = (n * K * (N - K) * (N - n) / (N 2 * (N - 1))) 1/2

Wyjaśnienie

Krok 1: Najpierw określ całkowitą liczbę przedmiotów w populacji, która jest oznaczona przez N. Na przykład liczba kart do gry w talii wynosi 52.

Krok 2: Następnie określ liczbę elementów w próbce, oznaczoną n - na przykład liczba kart wyciągniętych z talii.

Krok 3: Następnie określ instancje, które będą uważane za sukcesy w populacji i są oznaczone literą K. Na przykład liczba kier w całej talii, która wynosi 13.

Krok 4: Następnie określ instancje, które zostaną uznane za sukcesy w wylosowanej próbie i oznacz je k. Np. Liczba kier w kartach dobranych z talii.

Krok 5: Na koniec formuła prawdopodobieństwa rozkładu hipergeometrycznego jest wyprowadzana na podstawie liczby pozycji w populacji (krok 1), liczby pozycji w próbie (krok 2), liczby sukcesów w populacji (krok 3) i liczbę sukcesów w przykładzie (krok 4), jak pokazano poniżej.

P = K C k * (N - K) C (n - k) / N C n

Przykłady dystrybucji hipergeometrycznej (z szablonem Excel)

Przykład 1

Weźmy na przykład zwykłą formę talii kart do gry, w której 6 kart jest losowanych bez wymiany. Określ prawdopodobieństwo wylosowania dokładnie 4 kart w kolorze czerwonym, czyli karo lub kier.

  • Biorąc pod uwagę, N = 52 (ponieważ w zwykłej talii do gry są 52 karty)
  • n = 6 (liczba losowanych kart z talii)
  • K = 26 (ponieważ jest po 13 czerwonych kart w kolorze karo i kier)
  • k = 4 (liczba czerwonych kartek, które należy uznać za udane w wylosowanej próbie)

Rozwiązanie:

W związku z tym prawdopodobieństwo wylosowania dokładnie 4 kart w kolorze czerwonym w wylosowanych 6 kartach można obliczyć za pomocą powyższego wzoru jako:

Prawdopodobieństwo = K C k * (N - K) C (n - k) / N C n

= 26 C 4 * (52 - 26) C (6 - 4) / 52 C 6

= 26 C, 4 * 26 C, 2 / 52 C, 6

= 14950 * 325/20358520

Prawdopodobieństwo wyniesie -

Prawdopodobieństwo = 0,2387 ~ 23,87%

Dlatego istnieje prawdopodobieństwo 23,87% wylosowania dokładnie 4 czerwonych kartek podczas dobierania 6 losowych kart ze zwykłej talii.

Przykład nr 2

Weźmy inny przykład portfela, który zawiera 5 banknotów 100 $ i 7 banknotów 1 $. Jeśli 4 rachunki zostaną wybrane losowo, określ prawdopodobieństwo wybrania dokładnie 3 banknotów 100 $.

  • Biorąc pod uwagę, N = 12 (liczba banknotów 100 $ + liczba banknotów 1 $)
  • n = 4 (liczba losowo wybranych rachunków)
  • K = 5 (ponieważ jest 5 banknotów 100 $)
  • k = 3 (liczba banknotów 100 $, które należy uznać za sukces w wybranej próbie)

Rozwiązanie:

Dlatego prawdopodobieństwo wybrania dokładnie 3 banknotów 100 $ w losowo wybranych 4 banknotach można obliczyć za pomocą powyższego wzoru jako:

Prawdopodobieństwo = K C k * (N - K) C (n - k) / N C n

= 5 C 3 * (12 - 5) C (4 - 3) / 12 C 4

= 5 C 3 * 7 C, 1 / 12 C 4

= 10 * 7/495

Prawdopodobieństwo wyniesie -

Prawdopodobieństwo = 0,1414 ~ 14,14%

Dlatego istnieje prawdopodobieństwo 14,14% wyboru dokładnie 3 banknotów 100 $ podczas losowania 4 losowych banknotów.

Trafność i zastosowania

Pojęcie rozkładu hipergeometrycznego jest ważne, ponieważ zapewnia dokładny sposób określania prawdopodobieństw, gdy liczba prób nie jest bardzo duża i że próbki są pobierane ze skończonej populacji bez zastępowania. W rzeczywistości rozkład hipergeometryczny jest analogiczny do rozkładu dwumianowego, który jest używany, gdy liczba prób jest znacznie większa. Jednak do pobierania próbek bez wymiany stosuje się głównie rozkład hipergeometryczny.

Interesujące artykuły...