R do kwadratu (R ^ 2) - definicja, wzór, obliczenie R do kwadratu

Co to jest R do kwadratu (R2) w regresji?

R-kwadrat (R 2 ) jest ważną miarą statystyczną, która jest modelem regresji, który reprezentuje proporcję różnicy lub wariancji w kategoriach statystycznych dla zmiennej zależnej, którą można wyjaśnić za pomocą zmiennej lub zmiennych niezależnych. Krótko mówiąc, określa, jak dobrze dane będą pasować do modelu regresji.

Wzór R do kwadratu

Aby obliczyć R do kwadratu, musisz określić współczynnik korelacji, a następnie musisz podnieść wynik do kwadratu.

Wzór R do kwadratu = r 2

Gdzie r współczynnik korelacji można obliczyć w następujący sposób:

r = n (∑xy) - ∑x ∑y / √ (n * (∑x 2 - (∑x) 2 )) * (n * (∑y 2 - (∑y) 2 ))

Gdzie,

  • r = współczynnik korelacji
  • n = liczba w danym zbiorze danych
  • x = pierwsza zmienna w kontekście
  • y = druga zmienna

Wyjaśnienie

Jeżeli istnieje jakakolwiek zależność lub korelacja, która może być liniowa lub nieliniowa między tymi dwiema zmiennymi, wówczas należy wskazać, czy nastąpiła zmiana wartości zmiennej niezależnej, wówczas wartość innej zmiennej zależnej prawdopodobnie zmieni się, powiedzmy liniowo lub nieliniowo.

Licznikowa część wzoru przeprowadza test, czy poruszają się razem i usuwa ich indywidualne ruchy i względną siłę obu poruszających się razem, a część wzoru będąca mianownikiem skaluje licznik, biorąc pierwiastek kwadratowy z iloczynu różnic zmienne z ich kwadratów zmiennych. A kiedy podniesiesz ten wynik do kwadratu, otrzymamy R do kwadratu, które jest niczym innym jak współczynnikiem determinacji.

Przykłady

Przykład 1

Rozważ następujące dwie zmienne x i y, musisz obliczyć R kwadrat w regresji.

Rozwiązanie:

Korzystając z powyższego wzoru, musimy najpierw obliczyć współczynnik korelacji.

W powyższej tabeli mamy wszystkie wartości z n = 4.

Wprowadźmy teraz wartości do wzoru, aby uzyskać wynik.

r = (4 * 26 046,25) - (265,18 * 326,89) / √ ((4 * 21 274,94) - (326,89) 2 ) * ((4 * 31 901,89) - (326,89) 2 )

r = 17501,06 / 17,512,88

Współczynnik korelacji wyniesie:

r = 0,99932480

Tak więc obliczenia będą następujące:

r 2 = (0,99932480) 2

Formuła R do kwadratu w regresji

r 2 = 0,998650052

Przykład nr 2

Indie, kraj rozwijający się, chcą przeprowadzić niezależną analizę, czy zmiany cen ropy naftowej wpłynęły na jej wartość w rupiach. Poniżej przedstawiono historię wyceny ropy naftowej Brent i wyceny w rupiach, zarówno w stosunku do dolarów, które przeważały średnio w tych latach w przeliczeniu na poniżej.

RBI, centralny bank Indii, zwrócił się do Państwa z prośbą o przedstawienie prezentacji na ten temat podczas następnego spotkania. Określić, czy zmiany cen ropy wpływają na zmiany kursu rupii za dolara?

Rozwiązanie:

Korzystając z powyższego wzoru na korelację, możemy najpierw obliczyć współczynnik korelacji. Traktowanie średniej ceny ropy naftowej jako jednej zmiennej, powiedzmy x, i traktowanie rupii za dolara jako innej zmiennej jako y.

W powyższej tabeli mamy wszystkie wartości z n = 6.

Wprowadźmy teraz wartości do wzoru, aby uzyskać wynik.

r = (6 * 23592,83) - (356,70 * 398,59) / √ ((6 * 22829,36) - (356,70) 2 ) * ((6 * 26529,38) - (398,59) 2 )

r = -620,06 / 1715,95

Współczynnik korelacji wyniesie:

r = -0,3614

Tak więc obliczenia będą następujące:

r 2 = (-0,3614) 2

Formuła R do kwadratu w regresji

r 2 = 0,1306

Analiza: Wydaje się, że istnieje niewielka zależność między zmianami cen ropy naftowej a zmianami ceny rupii indyjskiej. Wraz ze wzrostem ceny ropy naftowej wpływają również zmiany kursu rupii indyjskiej. Ale skoro R do kwadratu wynosi tylko 13%, to zmiany ceny ropy naftowej w bardzo mniejszym stopniu wyjaśniają zmiany w rupii indyjskiej, a rupia indyjska podlega również zmianom innych zmiennych, co należy uwzględnić.

Przykład nr 3

Laboratorium XYZ prowadzi badania nad wzrostem i wagą i chce wiedzieć, czy istnieje jakikolwiek związek między tymi zmiennymi. Po zebraniu próby 5000 osób z każdej kategorii i ustaleniu średniej wagi i średniego wzrostu w tej grupie.

Poniżej znajdują się szczegóły, które zebrali.

Musisz obliczyć R do kwadratu i stwierdzić, czy ten model wyjaśnia, że ​​odchylenia wysokości wpływają na odchylenia masy.

Rozwiązanie:

Korzystając z powyższego wzoru na korelację, możemy najpierw obliczyć współczynnik korelacji. Traktowanie wzrostu jako jednej zmiennej, powiedzmy x, i traktowanie wagi jako innej zmiennej jako y.

W powyższej tabeli mamy wszystkie wartości z n = 6.

Wprowadźmy teraz wartości do wzoru, aby uzyskać wynik.

r = (7 * 74058,67) - (1031 * 496,44) / √ ((7 * 153595 - (1031) 2 ) * ((7 * 35793,59) - (496,44) 2 )

r = 6 581,05 / 7 075,77

Współczynnik korelacji wyniesie:

Współczynnik korelacji (r) = 0,9301

Tak więc obliczenia będą następujące:

r 2 = 0,8651

Analiza: Korelacja jest pozytywna i wydaje się, że istnieje pewien związek między wzrostem a wagą. Wydaje się, że wraz ze wzrostem zwiększa się również waga osoby. Podczas gdy R2 sugeruje, że 86% zmian wzrostu przypisuje się zmianom wagi, a 14% jest niewyjaśnionych.

Trafność i zastosowania

Trafność R do kwadratu w regresji to jej zdolność do znalezienia prawdopodobieństwa wystąpienia przyszłych zdarzeń w ramach określonych przewidywanych wyników lub wyników. Jeśli do modelu zostanie dodanych więcej próbek, współczynnik pokaże prawdopodobieństwo lub prawdopodobieństwo pojawienia się nowego punktu lub nowego zbioru danych na linii. Nawet jeśli obie zmienne mają silny związek, ustalenie nie dowodzi przyczynowości.

Niektóre obszary, w których najczęściej używa się R do kwadratu, służą do śledzenia wyników funduszy inwestycyjnych, śledzenia ryzyka w funduszach hedgingowych, w celu określenia, jak dobrze akcje poruszają się na rynku, gdzie R2 sugerowałby, ile ruchów na giełdzie można wyjaśnić przez ruchy na rynku.

Interesujące artykuły...