Wzór korelacji - Jak obliczyć? (Krok po kroku)

Wzór do obliczenia korelacji

Korelacja jest miarą statystyczną między dwiema zmiennymi i jest definiowana jako zmiana ilości w jednej zmiennej odpowiadająca zmianie w innej i jest obliczana przez zsumowanie iloczynu sumy pierwszej zmiennej pomniejszonej o średnią pierwszej zmiennej do sumy drugiej zmiennej minus średnia z drugiej zmiennej podzielona przez całość pod pierwiastek z kwadratu pierwszej zmiennej minus średnia pierwszej zmiennej do sumy kwadratów drugiej zmiennej minus średnia drugiej zmiennej.

Wartość korelacji jest ograniczona od -1 do +1 i można ją interpretować w następujący sposób:

  • -1: Jeśli wynosi -1, wówczas zmienne są znane jako doskonale skorelowane ujemnie. Oznacza to, że jeśli jedna zmienna porusza się w jednym kierunku, a inna porusza się w przeciwnym.
  • 0: Oznacza to, że zmienna nie ma żadnej korelacji.
  • +1: Jeśli wynosi +1, wówczas zmienne są znane jako doskonale dodatnio skorelowane. Obie zmienne poruszają się w pozytywnych kierunkach.

Jeśli mamy 2 zmienne xiy, to współczynnik korelacji między 2 zmiennymi można znaleźć jako:

Współczynnik korelacji = ∑ (x (i) - średnia (x)) * (y (i) -średnia (y)) / √ (∑ (x (i) -średnia (x)) 2 * ∑ (y (i) -średnia (y)) 2 )

Gdzie,

  • x (i) = wartość x w próbce
  • Średnia (x) = średnia wszystkich wartości x
  • y (i) = wartość y w próbce
  • Średnia (y) = średnia wszystkich wartości y

Przykłady

Obliczenie korelacji w programie Excel jest łatwe. Składnia użytej funkcji jest następująca:

Współczynnik korelacji = CORREL (tablica1, tablica2)

Przykład 1

Weźmy ten sam przykład, który wzięliśmy powyżej, aby obliczyć korelację za pomocą programu Excel.

Rozwiązanie:

Poniżej znajdują się wartości x i y:

Obliczenia są następujące.

Podstawowa formuła programu Excel = CORREL (tablica (x), tablica (y))

Współczynnik = +0,95

Ponieważ współczynnik ten jest bliski +1, stąd x i y są silnie dodatnio skorelowane.

Przykład nr 2

Korelacja jest przydatna głównie do analizy cen akcji spółek i tworzenia na tej podstawie portfela akcji.

Sprawdźmy korelację akcji Apple z indeksem Nasdaq na podstawie ostatnich rocznych notowań. Apple to międzynarodowa firma z siedzibą w USA, która specjalizuje się w produktach IT, takich jak iPod, iPad, Mac itp.

Rozwiązanie:

Poniżej znajduje się miesięczny zwrot z akcji Apple i Nasdaq za ostatni rok:

Wprowadźmy teraz wartości -

Współczynnik korelacji = ∑ (x (i) - średnia (x)). (Y (i) -średnia (y)) / √ ∑ (x (i) -średnia (x)) 2 ∑ (y (i) - średnia (y)) 2

Korelacja między Apple i Nasdaq = 0,039 / (√0,0039)

Współczynnik = 0,62

Ponieważ korelacja między Apple i Nasdaq jest dodatnia, stąd Apple jest dodatnio skorelowane z Nasdaq.

Przykład nr 3

Przyjrzyjmy się teraz korelacji między indeksami Walmart i Nasdaq na podstawie ostatnich rocznych notowań giełdowych. Walmart to firma z siedzibą w USA, która posiada sieć supermarketów detalicznych.

Rozwiązanie:

Poniżej znajduje się miesięczne wyniki między Walmart i Nasdaq za ostatni rok:

Wprowadźmy teraz wartości do wzoru -

Współczynnik korelacji = ∑ (x (i) - średnia (x)). (Y (i) -średnia (y)) / √ ∑ (x (i) -średnia (x)) 2 ∑ (y (i) - średnia (y)) 2

Dlatego obliczenia są następujące:

Korelacja między Walmart i Nasdaq = 0,0032 / (√0,0346 * 0,0219)

Współczynnik = 0,12

Widzimy, że Walmart i Nasdaq są również pozytywnie skorelowane, ale nie tak bardzo w porównaniu do korelacji Apple z Nasdaq.

Trafność i zastosowanie

Współczynnik korelacji jest przydatny przy ustalaniu liniowej zależności między dwiema zmiennymi. Mierzy, jak zmienna będzie się poruszać w porównaniu z ruchem innej zmiennej. Praktycznym zastosowaniem tego współczynnika jest ustalenie związku między zmianami cen akcji a ogólnym ruchem na rynku. Podstawą tej analizy, analityka giełdowego, będzie uwzględnienie proporcji akcji do stworzenia optymalnego portfela przy minimalnym ryzyku. W nauce o danych przydatne jest również znalezienie związku między dwiema zmiennymi.

Współczynnik korelacji jest również używany bardzo wysoko do badania poprawności konstrukcyjnej danych w analizie czynnikowej. Jest wysoce stosowany w analizie regresji do przewidywania wartości zmiennych zależnych na podstawie relacji między zmiennymi zależnymi i niezależnymi. To równanie jest bardzo przydatne w analizie ilościowej, aby poznać naturę związku między różnymi zmiennymi. Podstawą tej zależności, jeśli zmienna nie jest powiązana z innymi zmiennymi, to można ją usunąć z listy.

Interesujące artykuły...