Co to jest regresja liniowa?
Regresja liniowa jest zasadniczo techniką modelowania statystycznego, która służy do pokazania związku między jedną zmienną zależną a jedną lub większą liczbą zmiennych niezależnych. Jest to jeden z najpopularniejszych rodzajów analizy predykcyjnej. Ten typ rozkładu tworzy się w postaci prostej, dlatego nazywa się to regresją liniową. W tym artykule weźmiemy przykłady analizy regresji liniowej w programie Excel.
Aby najpierw przeprowadzić analizę regresji liniowej, musimy dodać dodatki programu Excel, wykonując następujące kroki.
Kliknij Plik - Opcje (otworzy się okienko z opcjami Excela).

Kliknij Dodatki - Wybierz Dodatki programu Excel z menu Zarządzaj w programie Excel, a następnie kliknij Przejdź.

Spowoduje to otwarcie wyskakującego okienka dodatków. Wybierz Analysis ToolPak, a następnie kliknij OK.

Dodatek do analizy danych pojawi się w zakładce Wstawianie.

Rozumiemy przez poniższe Przykłady analizy regresji liniowej w programie Excel.
Przykłady analizy regresji liniowej
Przykład 1
Załóżmy, że w zeszłym roku mieliśmy miesięczną sprzedaż i wydaliśmy na marketing, a teraz musimy przewidzieć przyszłą sprzedaż na podstawie zeszłorocznych wydatków na sprzedaż i marketing.
Miesiąc | Reklama | Obroty |
Jan | 40937 | 502729 |
Luty | 42376 | 507553 |
Zniszczyć | 43355 | 516885 |
Kwi | 44126 | 528347 |
Może | 45060 | 537298 |
Jun | 49546 | 544066 |
Lip | 56105 | 553664 |
Sie | 59322 | 563201 |
Wrz | 59877 | 568657 |
Paź | 60481 | 569384 |
Lis | 62356 | 573764 |
Dec | 63246 | 582746 |
Kliknij opcję Analiza danych w zakładce Dane, co otworzy wyskakujące okienko analizy danych.

Teraz wybierz Regresję z listy i kliknij OK.

Otworzy się wyskakujące okienko regresji.

Wybierz Zakres sprzedaży 1 $ C $: 13 $ C $ w polu osi Y, ponieważ jest to zmienna zależna, a 1 $ B $: 14 $ B $ na osi X, ponieważ wydana reklama jest zmienną niezależną.

Zaznacz pole wyboru w polu Etykiety, jeśli wybrałeś nagłówki w danych, w przeciwnym razie spowoduje to błąd.

Wybierz Zakres wyjściowy, jeśli chcesz uzyskać wartość z określonego zakresu w arkuszu roboczym, w przeciwnym razie wybierz Nowy arkusz roboczy: a to doda nowy arkusz i da ci wynik.

Następnie zaznacz pole Pozostałe i kliknij OK.

Spowoduje to dodanie arkuszy roboczych i da następujący wynik.

Zrozummy wynik.
Podsumowanie wyników
Wielokrotne R: reprezentuje współczynnik korelacji. Wartość 1 wskazuje na związek dodatni, a wartość 0 - brak związku.
Kwadrat R: Kwadrat R reprezentuje współczynnik determinacji. Oznacza to, że procent punktów przypada na linię regresji. 0,49 oznacza, że 49% wartości pasuje do modelu
Dostosowany kwadrat R : Jest to dostosowany kwadrat R, który wymaga, gdy masz więcej niż jedną zmienną X.
Błąd standardowy: reprezentuje oszacowanie odchylenia standardowego błędu. To jest precyzja, z jaką mierzony jest współczynnik regresji.
Obserwacje: jest to liczba obserwacji, które pobrałeś w próbie.
ANOVA - Df: stopnie swobody
SS: suma kwadratów.
MS: mamy dwa MS
- Regresja MS to regresja SS / regresja Df.
- Resztkowa MS to średni kwadrat błędu (pozostały SS / rezydualny Df).
Test F: F dla hipotezy zerowej.
Istotność F: Wartości P związane ze znaczeniem
Współczynnik: współczynnik daje oszacowanie najmniejszych kwadratów.
Statystyka T: Statystyka T dla hipotezy zerowej w porównaniu z hipotezą alternatywną.
Wartość p: jest to wartość p dla testu hipotezy.
Dolne 95% i Górne 95%: są to dolna i górna granica przedziału ufności
Wynik reszt .: Mamy 12 obserwacji opartych na danych. 2 II kolumna odpowiada przewidywanej sprzedaży i 3 rd reszt kolumn. Reszty to zasadniczo różnica między przewidywaną sprzedażą a rzeczywistą.
Przykład nr 2
Wybierz kolumnę przewidywanej sprzedaży i marketingu

Przejdź do grupy wykresów pod zakładką wstawiania. Wybierz ikonę wykresu punktowego

Spowoduje to wstawienie wykresu punktowego w programie Excel. Zobacz obrazek poniżej

Kliknij prawym przyciskiem myszy dowolny punkt, a następnie wybierz Dodaj linię trendu w programie Excel. Spowoduje to dodanie linii trendu do wykresu.


- Możesz sformatować linię trendu, klikając prawym przyciskiem myszy w dowolnym miejscu linii trendu, a następnie wybierając formatowanie linii trendu.
- Możesz wprowadzić więcej ulepszeń do wykresu. tj. formatowanie linii trendu, kolorowanie i zmiana tytułu itp
- Możesz również pokazać formułę na wykresie, sprawdzając formułę Wyświetl na wykresie i wyświetlić wartość R do kwadratu na wykresie.
Więcej przykładów analizy regresji liniowej:
- Prognoza sprzedaży parasola na podstawie deszczu wydarzyła się w okolicy.
- Prognoza sprzedaży klimatyzacji na podstawie temperatury w lecie.
- W sezonie egzaminacyjnym sprzedaż zasadniczo stacjonarnych i poradników egzaminacyjnych wzrosła.
- Przewidywanie sprzedaży, gdy reklama została wykonana, na podstawie serialu High TRP, w którym jest umieszczana reklama, popularności Brand Ambassador i kroków w miejscu trzymania, w którym publikowana jest reklama.
- Sprzedaż domu na podstawie lokalizacji, powierzchni i ceny.
Przykład nr 3
Załóżmy, że mamy dziewięciu uczniów z ich poziomem IQ i liczbą, którą uzyskali w teście.
Student | Wynik testu | ILORAZ INTELIGENCJI |
Baran | 100 | 145 |
Shyam | 97 | 140 |
Kul | 93 | 130 |
Kappu | 91 | 125 |
Raju | 89 | 115 |
Vishal | 86 | 110 |
Vivek | 82 | 100 |
Vinay | 78 | 95 |
Kumar | 75 | 90 |
Krok 1: Najpierw znajdź zmienne zależne i niezależne. Tutaj Wynik testu jest zmienną zależną, a IQ jest zmienną niezależną, ponieważ wynik testu zmienia się wraz ze zmianą IQ.
Krok 2: Przejdź do zakładki Dane - Kliknij Analiza danych - Wybierz regresję - kliknij OK.

Spowoduje to otwarcie okna regresji.

Krok 3. Wprowadź zakres wyniku testu w polu zakresu wejściowego Y i IQ w polu zakresu wejściowego X. (Sprawdź Etykiety, jeśli masz nagłówki w zakresie danych. Wybierz opcje wyjściowe, a następnie zaznacz żądane Reszty. Kliknij OK.

Otrzymasz podsumowanie pokazane na poniższym obrazku.

Krok 4: Analiza regresji na podstawie wyników podsumowania
Podsumowanie wyników
Wielokrotne R: Tutaj współczynnik korelacji wynosi 0,99, co jest bardzo bliskie 1, co oznacza, że zależność liniowa jest bardzo dodatnia.
Kwadrat R: Wartość R Kwadrat wynosi 0,983, co oznacza, że 98,3% wartości pasuje do modelu.
Wartość p: W tym przypadku wartość p wynosi 1,86881E-07, czyli znacznie mniej niż 0,1, co oznacza, że IQ ma istotne wartości predykcyjne.
Zobacz tabelę poniżej.

Możesz zobaczyć, że prawie wszystkie punkty spadają w linii lub pobliskiej linii trendu.
Przykład 4
Musimy przewidzieć sprzedaż klimatyzacji na podstawie sprzedaży i temperatury w innym miesiącu.
Miesiąc | Temp | Obroty |
Jan | 25 | 38893 |
Luty | 28 | 42254 |
Zniszczyć | 31 | 42845 |
Kwi | 33 | 47917 |
Może | 37 | 51243 |
Jun | 40 | 69588 |
Lip | 38 | 56570 |
Sie | 37 | 50000 |
Wykonaj poniższe kroki, aby uzyskać wynik regresji.
Krok 1: Najpierw znajdź zmienne zależne i niezależne. Tutaj Sales jest zmienną zależną, a Temperatura jest zmienną niezależną, ponieważ Sales zmienia się wraz ze zmianą Temp.
Krok 2: Przejdź do zakładki Dane - Kliknij Analiza danych - Wybierz regresję - kliknij OK.

Spowoduje to otwarcie okna regresji.

Krok 3. Wprowadź sprzedaż w polu zakresu wejściowego Y, a temperaturę w polu zakresu wejściowego X. (Sprawdź Etykiety, jeśli masz nagłówki w zakresie danych. Wybierz opcje wyjściowe, a następnie zaznacz żądane Reszty. Kliknij OK.

Daje to podsumowanie, jak poniżej.

Krok 4: Przeanalizuj wynik.
Multiple R: Tutaj współczynnik korelacji wynosi 0,877, co jest bliskie 1, co oznacza, że zależność liniowa jest dodatnia.
Kwadrat R: Wartość R Kwadrat wynosi 0,770, co oznacza, że 77% wartości pasuje do modelu
Wartość p: W tym przypadku wartość p wynosi 1,86881E-07, czyli znacznie mniej niż 0,1, co oznacza, że IQ ma istotne wartości predykcyjne.
Przykład nr 5
Zróbmy teraz analizę regresji dla wielu zmiennych niezależnych:
Trzeba przewidzieć sprzedaż telefonu komórkowego, który ruszy w przyszłym roku. Masz cenę i populację krajów, które mają wpływ na sprzedaż telefonów komórkowych.
Wersja mobilna | Obroty | Ilość | Populacja |
NAS | 63860 | 858 | 823 |
UK | 61841 | 877 | 660 |
KZ | 60876 | 873 | 631 |
CH | 58188 | 726 | 842 |
HN | 52728 | 864 | 573 |
AU | 52388 | 680 | 809 |
NZ | 51075 | 728 | 661 |
RU | 49019 | 689 | 778 |
Wykonaj poniższe kroki, aby uzyskać wynik regresji.
Krok 1. Najpierw znajdź zmienne zależne i niezależne. Tutaj Sprzedaż jest zmienną zależną oraz ilością i populacją. Obie są zmiennymi niezależnymi, ponieważ sprzedaż zmienia się w zależności od ilości i populacji kraju.
Krok 2. Przejdź do zakładki Dane - Kliknij Analiza danych - Wybierz regresję - kliknij OK.

Spowoduje to otwarcie okna regresji.

Krok 3. Wprowadź sprzedaż w polu zakresu wejściowego Y i wybierz ilość i populację w polu zakresu wejściowego X. (Sprawdź Etykiety, jeśli masz nagłówki w zakresie danych. Wybierz opcje wyjściowe, a następnie zaznacz żądane Reszty. Kliknij OK.

Teraz uruchom regresję, używając analizy danych w zakładce Dane. Daje to poniższy wynik.
Podsumowanie wyników
Wiele R: Tutaj współczynnik korelacji wynosi 0,93, co jest bardzo bliskie 1, co oznacza, że zależność liniowa jest bardzo dodatnia.
Kwadrat R: Wartość Kwadrat R wynosi 0,866, co oznacza, że 86,7% wartości pasuje do modelu.
Istotność F: Istotność F jest mniejsza niż 0,1, co oznacza, że równanie regresji ma istotną wartość predykcyjną.
Wartość p : Jeśli spojrzysz na wartość P dla ilości i populacji, zobaczysz, że wartości są mniejsze niż 0,1, co oznacza, że ilość i populacja mają znaczącą wartość predykcyjną. Mniejsza liczba wartości P oznacza, że zmienna ma bardziej istotne wartości predykcyjne.
Jednak zarówno ilość, jak i populacja mają znaczącą wartość predykcyjną, ale jeśli spojrzysz na wartość P dla ilości i populacji, zobaczysz, że ilość ma mniejszą wartość P w programie Excel niż Populacja. Oznacza to, że ilość ma większą wartość predykcyjną niż populacja.
Rzeczy do zapamiętania
- Zawsze sprawdzaj zmienne zależne i niezależne za każdym razem, gdy wybierasz jakiekolwiek dane.
- Analiza regresji liniowej uwzględnia związek między średnią zmiennych.
- To tylko modeluje relacje między zmiennymi, które są liniowe
- Czasami nie jest to najlepsze rozwiązanie dla rzeczywistego problemu. Na przykład: (wiek i płaca). W większości przypadków płaca rośnie wraz ze wzrostem wieku. Jednak po przejściu na emeryturę wiek wzrasta, ale płace maleją.