Formuła wartości odstających zapewnia narzędzie graficzne do obliczania danych, które znajdują się poza danym zestawem rozkładu, który może znajdować się po stronie wewnętrznej lub zewnętrznej w zależności od zmiennych.
Co to jest formuła wartości odstających?
Wartość odstająca to punkt danych dla danej próbki lub danej obserwacji lub w rozkładzie, który nie mieści się w ogólnym wzorze. Powszechnie stosowana reguła, która mówi, że punkt danych zostanie uznany za wartość odstającą, jeśli ma więcej niż 1,5 IQR poniżej pierwszego kwartylu lub powyżej trzeciego kwartylu.
Mówiąc inaczej, niskie wartości odstające powinny znajdować się poniżej Q1-1,5 IQR, a wysokie wartości odstające powinny znajdować się w Q3 + 1,5 IQR
Należy obliczyć medianę, kwartyle, w tym IQR, Q1 i Q3.
Formuła wartości odstających jest przedstawiona w następujący sposób:
Wzór na Q1 = ¼ (n + 1) -ty człon Wzór na Q3 = ¾ (n + 1) -ty człon Wzór na Q2 = Q3 - Q1

Obliczanie wartości odstających krok po kroku
Aby obliczyć wartość odstającą, należy wykonać poniższe kroki.
- Krok 1: Najpierw oblicz kwartyle, tj. Q1, Q2 i międzykwartyl
- Krok 2: Teraz oblicz wartość Q2 * 1,5
- Krok 3: Teraz odejmij wartość Q1 od wartości obliczonej w kroku 2
- Krok 4: Tutaj dodaj Q3 z wartością obliczoną w kroku 2
- Krok 5: Utwórz zakres wartości obliczonych w Kroku 3 i Kroku 4
- Krok 6: Ułóż dane w porządku rosnącym
- Krok 7: Sprawdź, czy są jakieś wartości, które znajdują się poniżej lub powyżej zakresu utworzonego w kroku 5.
Przykład
Rozważ zbiór danych zawierający następujące liczby: 10, 2, 4, 7, 8, 5, 11, 3, 12. Musisz obliczyć wszystkie wartości odstające.
Rozwiązanie:
Najpierw musimy uporządkować dane w porządku rosnącym, aby znaleźć medianę, która będzie dla nas Q2.
2, 3, 4, 5, 7, 8, 10, 11, 12

Ponieważ liczba obserwacji jest nieparzysta, czyli 9, mediana leżałaby na piątej pozycji, czyli 7, i tak samo będzie Q2 w tym przykładzie.
Dlatego obliczenie Q1 jest następujące -
Q1 = ¼ (9 + 1)
= ¼ (10)
Q1 będzie -

Q1 = 2,5 kadencji
Oznacza to, że Q1 średnia z 2 ND i 3 -ciej pozycji obserwacji, która jest 3 i 4, o, i średniej powierzchni jest (3 + 4) / 2 = 3,5
Dlatego obliczenie Q3 wygląda następująco -

P3 = ¾ (9 + 1)
= ¾ (10)
III kwartał będzie -

Q3 = 7,5 termin
Oznacza to, że Q3 oznacza średnią z 7 TH i 8 th pozycja obserwacji, co 10 11 o i średnią tych części (10 + 11) / 2 = 10,5
Teraz niskie wartości odstające powinny leżeć poniżej Q1-1,5IQR, a wysokie wartości odstające powinny leżeć poniżej Q3 + 1,5IQR
Zatem wartości to 3,5 - (1,5 * 7) = -7, a wyższy zakres to 10,5 + (1,5 * 7) = 110,25.
Ponieważ nie ma obserwacji, które leżą powyżej lub poniżej 110,25 i -7, nie mamy żadnych wartości odstających w tej próbce.
Przykład formuły wartości odstającej w programie Excel (z szablonem programu Excel)
Kreatywne zajęcia coachingowe rozważają nagradzanie uczniów, którzy znajdują się w najlepszych 25%. Chcą jednak uniknąć wszelkich wartości odstających. Dane dotyczą 25 uczniów. Użyj równania wartości odstającej, aby określić, czy istnieje wartość odstająca?
Rozwiązanie:
Poniżej podano dane do obliczenia wartości odstającej.

Liczba obserwacji wynosi 25, a naszym pierwszym krokiem byłoby przekonwertowanie powyższych surowych danych w porządku rosnącym.
Mediana wyniesie -

Mediana = ½ (n + 1)
= ½ = ½ (26)
= 13 p termin
Q2 lub mediana to 68,00
To jest 50% populacji.
Q1 będzie -

Q1 = ¼ (n + 1). Termin
= ¼ (25 + 1)
= ¼ (26)
= 6,5- ty człon, co jest równoważne 7- memu członowi
Pierwszy kwartał to 56,00, czyli najniższe 25%
III kwartał będzie -

Wreszcie, Q3 = ¾ (n + 1)
= ¾ (26)
= 19,50 termin
Tutaj średnia musi być podjęte, który jest 19 th i 20 th warunkach, które wynoszą odpowiednio 77 i 77, a średnia samo (77 + 77) / 2 = 77,00
Trzeci kwartał to 77, czyli najlepsze 25%
Niski zasięg
Teraz niskie wartości odstające powinny leżeć poniżej Q1-1,5IQR, a wysokie wartości odstające powinny leżeć poniżej Q3 + 1,5IQR

Wysoka ranga -

Zatem wartości to 56 - (1,5 * 68) = -46, a wyższy zakres to 77 + (1,5 * 68) = 179.
Nie ma wartości odstających.
Trafność i zastosowania
Formuła wartości odstających jest bardzo ważna, ponieważ mogą istnieć dane, które zostałyby wypaczone przez taką wartość. Weźmy na przykład obserwacje 2, 4, 6, 101, a teraz, jeśli ktoś przyjmie średnią z tych wartości, to będzie to 28,25, ale 75% obserwacji leży poniżej 7, a więc byłaby to błędna decyzja dotycząca obserwacji ta próbka.
Można tu zauważyć, że 101 wyraźnie wydaje się zarysować, a jeśli to zostanie usunięte, to średnia wyniosłaby 4, co mówi o wartościach lub obserwacjach, które mieszczą się w przedziale 4. Dlatego bardzo ważne jest, aby to przeprowadzić. obliczenia, aby uniknąć niewłaściwego wykorzystania wiodących informacji z danych. Są one szeroko stosowane przez statystyków na całym świecie podczas prowadzenia jakichkolwiek badań.