Regresja liniowa (definicja, przykłady) - Jak interpretować?

Co to jest regresja liniowa?

Regresja liniowa jest zasadniczo techniką modelowania statystycznego, która służy do pokazania związku między jedną zmienną zależną a jedną lub większą liczbą zmiennych niezależnych. Jest to jeden z najpopularniejszych rodzajów analizy predykcyjnej. Ten typ rozkładu tworzy się w postaci prostej, dlatego nazywa się to regresją liniową. W tym artykule weźmiemy przykłady analizy regresji liniowej w programie Excel.

Aby najpierw przeprowadzić analizę regresji liniowej, musimy dodać dodatki programu Excel, wykonując następujące kroki.

Kliknij Plik - Opcje (otworzy się okienko z opcjami Excela).

Kliknij Dodatki - Wybierz Dodatki programu Excel z menu Zarządzaj w programie Excel, a następnie kliknij Przejdź.

Spowoduje to otwarcie wyskakującego okienka dodatków. Wybierz Analysis ToolPak, a następnie kliknij OK.

Dodatek do analizy danych pojawi się w zakładce Wstawianie.

Rozumiemy przez poniższe Przykłady analizy regresji liniowej w programie Excel.

Przykłady analizy regresji liniowej

Przykład 1

Załóżmy, że w zeszłym roku mieliśmy miesięczną sprzedaż i wydaliśmy na marketing, a teraz musimy przewidzieć przyszłą sprzedaż na podstawie zeszłorocznych wydatków na sprzedaż i marketing.

Miesiąc Reklama Obroty
Jan 40937 502729
Luty 42376 507553
Zniszczyć 43355 516885
Kwi 44126 528347
Może 45060 537298
Jun 49546 544066
Lip 56105 553664
Sie 59322 563201
Wrz 59877 568657
Paź 60481 569384
Lis 62356 573764
Dec 63246 582746

Kliknij opcję Analiza danych w zakładce Dane, co otworzy wyskakujące okienko analizy danych.

Teraz wybierz Regresję z listy i kliknij OK.

Otworzy się wyskakujące okienko regresji.

Wybierz Zakres sprzedaży 1 $ C $: 13 $ C $ w polu osi Y, ponieważ jest to zmienna zależna, a 1 $ B $: 14 $ B $ na osi X, ponieważ wydana reklama jest zmienną niezależną.

Zaznacz pole wyboru w polu Etykiety, jeśli wybrałeś nagłówki w danych, w przeciwnym razie spowoduje to błąd.

Wybierz Zakres wyjściowy, jeśli chcesz uzyskać wartość z określonego zakresu w arkuszu roboczym, w przeciwnym razie wybierz Nowy arkusz roboczy: a to doda nowy arkusz i da ci wynik.

Następnie zaznacz pole Pozostałe i kliknij OK.

Spowoduje to dodanie arkuszy roboczych i da następujący wynik.

Zrozummy wynik.

Podsumowanie wyników

Wielokrotne R: reprezentuje współczynnik korelacji. Wartość 1 wskazuje na związek dodatni, a wartość 0 - brak związku.

Kwadrat R: Kwadrat R reprezentuje współczynnik determinacji. Oznacza to, że procent punktów przypada na linię regresji. 0,49 oznacza, że ​​49% wartości pasuje do modelu

Dostosowany kwadrat R : Jest to dostosowany kwadrat R, który wymaga, gdy masz więcej niż jedną zmienną X.

Błąd standardowy: reprezentuje oszacowanie odchylenia standardowego błędu. To jest precyzja, z jaką mierzony jest współczynnik regresji.

Obserwacje: jest to liczba obserwacji, które pobrałeś w próbie.

ANOVA - Df: stopnie swobody

SS: suma kwadratów.

MS: mamy dwa MS

  • Regresja MS to regresja SS / regresja Df.
  • Resztkowa MS to średni kwadrat błędu (pozostały SS / rezydualny Df).

Test F: F dla hipotezy zerowej.

Istotność F: Wartości P związane ze znaczeniem

Współczynnik: współczynnik daje oszacowanie najmniejszych kwadratów.

Statystyka T: Statystyka T dla hipotezy zerowej w porównaniu z hipotezą alternatywną.

Wartość p: jest to wartość p dla testu hipotezy.

Dolne 95% i Górne 95%: są to dolna i górna granica przedziału ufności

Wynik reszt .: Mamy 12 obserwacji opartych na danych. 2 II kolumna odpowiada przewidywanej sprzedaży i 3 rd reszt kolumn. Reszty to zasadniczo różnica między przewidywaną sprzedażą a rzeczywistą.

Przykład nr 2

Wybierz kolumnę przewidywanej sprzedaży i marketingu

Przejdź do grupy wykresów pod zakładką wstawiania. Wybierz ikonę wykresu punktowego

Spowoduje to wstawienie wykresu punktowego w programie Excel. Zobacz obrazek poniżej

Kliknij prawym przyciskiem myszy dowolny punkt, a następnie wybierz Dodaj linię trendu w programie Excel. Spowoduje to dodanie linii trendu do wykresu.

  • Możesz sformatować linię trendu, klikając prawym przyciskiem myszy w dowolnym miejscu linii trendu, a następnie wybierając formatowanie linii trendu.
  • Możesz wprowadzić więcej ulepszeń do wykresu. tj. formatowanie linii trendu, kolorowanie i zmiana tytułu itp
  • Możesz również pokazać formułę na wykresie, sprawdzając formułę Wyświetl na wykresie i wyświetlić wartość R do kwadratu na wykresie.

Więcej przykładów analizy regresji liniowej:

  1. Prognoza sprzedaży parasola na podstawie deszczu wydarzyła się w okolicy.
  2. Prognoza sprzedaży klimatyzacji na podstawie temperatury w lecie.
  3. W sezonie egzaminacyjnym sprzedaż zasadniczo stacjonarnych i poradników egzaminacyjnych wzrosła.
  4. Przewidywanie sprzedaży, gdy reklama została wykonana, na podstawie serialu High TRP, w którym jest umieszczana reklama, popularności Brand Ambassador i kroków w miejscu trzymania, w którym publikowana jest reklama.
  5. Sprzedaż domu na podstawie lokalizacji, powierzchni i ceny.

Przykład nr 3

Załóżmy, że mamy dziewięciu uczniów z ich poziomem IQ i liczbą, którą uzyskali w teście.

Student Wynik testu ILORAZ INTELIGENCJI
Baran 100 145
Shyam 97 140
Kul 93 130
Kappu 91 125
Raju 89 115
Vishal 86 110
Vivek 82 100
Vinay 78 95
Kumar 75 90

Krok 1: Najpierw znajdź zmienne zależne i niezależne. Tutaj Wynik testu jest zmienną zależną, a IQ jest zmienną niezależną, ponieważ wynik testu zmienia się wraz ze zmianą IQ.

Krok 2: Przejdź do zakładki Dane - Kliknij Analiza danych - Wybierz regresję - kliknij OK.

Spowoduje to otwarcie okna regresji.

Krok 3. Wprowadź zakres wyniku testu w polu zakresu wejściowego Y i IQ w polu zakresu wejściowego X. (Sprawdź Etykiety, jeśli masz nagłówki w zakresie danych. Wybierz opcje wyjściowe, a następnie zaznacz żądane Reszty. Kliknij OK.

Otrzymasz podsumowanie pokazane na poniższym obrazku.

Krok 4: Analiza regresji na podstawie wyników podsumowania

Podsumowanie wyników

Wielokrotne R: Tutaj współczynnik korelacji wynosi 0,99, co jest bardzo bliskie 1, co oznacza, że ​​zależność liniowa jest bardzo dodatnia.

Kwadrat R: Wartość R Kwadrat wynosi 0,983, co oznacza, że ​​98,3% wartości pasuje do modelu.

Wartość p: W tym przypadku wartość p wynosi 1,86881E-07, czyli znacznie mniej niż 0,1, co oznacza, że ​​IQ ma istotne wartości predykcyjne.

Zobacz tabelę poniżej.

Możesz zobaczyć, że prawie wszystkie punkty spadają w linii lub pobliskiej linii trendu.

Przykład 4

Musimy przewidzieć sprzedaż klimatyzacji na podstawie sprzedaży i temperatury w innym miesiącu.

Miesiąc Temp Obroty
Jan 25 38893
Luty 28 42254
Zniszczyć 31 42845
Kwi 33 47917
Może 37 51243
Jun 40 69588
Lip 38 56570
Sie 37 50000

Wykonaj poniższe kroki, aby uzyskać wynik regresji.

Krok 1: Najpierw znajdź zmienne zależne i niezależne. Tutaj Sales jest zmienną zależną, a Temperatura jest zmienną niezależną, ponieważ Sales zmienia się wraz ze zmianą Temp.

Krok 2: Przejdź do zakładki Dane - Kliknij Analiza danych - Wybierz regresję - kliknij OK.

Spowoduje to otwarcie okna regresji.

Krok 3. Wprowadź sprzedaż w polu zakresu wejściowego Y, a temperaturę w polu zakresu wejściowego X. (Sprawdź Etykiety, jeśli masz nagłówki w zakresie danych. Wybierz opcje wyjściowe, a następnie zaznacz żądane Reszty. Kliknij OK.

Daje to podsumowanie, jak poniżej.

Krok 4: Przeanalizuj wynik.

Multiple R: Tutaj współczynnik korelacji wynosi 0,877, co jest bliskie 1, co oznacza, że ​​zależność liniowa jest dodatnia.

Kwadrat R: Wartość R Kwadrat wynosi 0,770, co oznacza, że ​​77% wartości pasuje do modelu

Wartość p: W tym przypadku wartość p wynosi 1,86881E-07, czyli znacznie mniej niż 0,1, co oznacza, że ​​IQ ma istotne wartości predykcyjne.

Przykład nr 5

Zróbmy teraz analizę regresji dla wielu zmiennych niezależnych:

Trzeba przewidzieć sprzedaż telefonu komórkowego, który ruszy w przyszłym roku. Masz cenę i populację krajów, które mają wpływ na sprzedaż telefonów komórkowych.

Wersja mobilna Obroty Ilość Populacja
NAS 63860 858 823
UK 61841 877 660
KZ 60876 873 631
CH 58188 726 842
HN 52728 864 573
AU 52388 680 809
NZ 51075 728 661
RU 49019 689 778

Wykonaj poniższe kroki, aby uzyskać wynik regresji.

Krok 1. Najpierw znajdź zmienne zależne i niezależne. Tutaj Sprzedaż jest zmienną zależną oraz ilością i populacją. Obie są zmiennymi niezależnymi, ponieważ sprzedaż zmienia się w zależności od ilości i populacji kraju.

Krok 2. Przejdź do zakładki Dane - Kliknij Analiza danych - Wybierz regresję - kliknij OK.

Spowoduje to otwarcie okna regresji.

Krok 3. Wprowadź sprzedaż w polu zakresu wejściowego Y i wybierz ilość i populację w polu zakresu wejściowego X. (Sprawdź Etykiety, jeśli masz nagłówki w zakresie danych. Wybierz opcje wyjściowe, a następnie zaznacz żądane Reszty. Kliknij OK.

Teraz uruchom regresję, używając analizy danych w zakładce Dane. Daje to poniższy wynik.

Podsumowanie wyników

Wiele R: Tutaj współczynnik korelacji wynosi 0,93, co jest bardzo bliskie 1, co oznacza, że ​​zależność liniowa jest bardzo dodatnia.

Kwadrat R: Wartość Kwadrat R wynosi 0,866, co oznacza, że ​​86,7% wartości pasuje do modelu.

Istotność F: Istotność F jest mniejsza niż 0,1, co oznacza, że ​​równanie regresji ma istotną wartość predykcyjną.

Wartość p : Jeśli spojrzysz na wartość P dla ilości i populacji, zobaczysz, że wartości są mniejsze niż 0,1, co oznacza, że ​​ilość i populacja mają znaczącą wartość predykcyjną. Mniejsza liczba wartości P oznacza, że ​​zmienna ma bardziej istotne wartości predykcyjne.

Jednak zarówno ilość, jak i populacja mają znaczącą wartość predykcyjną, ale jeśli spojrzysz na wartość P dla ilości i populacji, zobaczysz, że ilość ma mniejszą wartość P w programie Excel niż Populacja. Oznacza to, że ilość ma większą wartość predykcyjną niż populacja.

Rzeczy do zapamiętania

  • Zawsze sprawdzaj zmienne zależne i niezależne za każdym razem, gdy wybierasz jakiekolwiek dane.
  • Analiza regresji liniowej uwzględnia związek między średnią zmiennych.
  • To tylko modeluje relacje między zmiennymi, które są liniowe
  • Czasami nie jest to najlepsze rozwiązanie dla rzeczywistego problemu. Na przykład: (wiek i płaca). W większości przypadków płaca rośnie wraz ze wzrostem wieku. Jednak po przejściu na emeryturę wiek wzrasta, ale płace maleją.

Interesujące artykuły...