Jak uruchomić regresję w programie Excel

click fraud protection

Regresja w Excelu to sposób na zautomatyzowanie procesu statystycznego porównywanie kilku zestawów informacji aby zobaczyć, jak zmiany zmiennych niezależnych wpływają na zmiany zmiennych zależnych. Jeśli kiedykolwiek chciałeś znaleźć korelację między dwiema rzeczami, użycie analizy regresji w programie Excel jest jednym z najlepszych sposobów na zrobienie tego.

Instrukcje zawarte w tym artykule dotyczą programów Excel 2019, Excel 2016, Excel 2013, Excel 2010.

Jakie jest znaczenie regresji?

Regresja to statystyczne podejście do modelowania, którego analitycy używają do określania relacji między wieloma zmiennymi.

Analiza regresji rozpoczyna się od pojedynczej zmiennej, którą próbujesz przeanalizować, i testowanych zmiennych niezależnych, aby sprawdzić, czy mają one wpływ na tę pojedynczą zmienną. Analiza przygląda się zmianom zmiennych niezależnych i próbuje skorelować te zmiany z wynikającymi z tego zmianami pojedynczej (zależnej) zmiennej.

Może to brzmieć jak zaawansowane statystyki, ale Przewyższać sprawia, że złożona analiza dostępne dla każdego.

Wykonywanie regresji liniowej w programie Excel

Najprostszą formą analizy regresji jest regresja liniowa. Prosta regresja liniowa analizuje związek między tylko dwiema zmiennymi.

Na przykład poniższy arkusz kalkulacyjny pokazuje dane zawierające liczbę kalorii, które osoba spożywała każdego dnia oraz ich wagę w tym dniu.

Zrzut ekranu arkusza kalkulacyjnego wagi i kalorii

Ponieważ ten arkusz kalkulacyjny zawiera dwie kolumny danych, a jedna zmienna może potencjalnie wpływać na drugą, możesz przeprowadzić analizę regresji na tych danych za pomocą programu Excel.

Włączanie dodatku Analysis ToolPak

Przed użyciem funkcji analizy regresji programu Excel należy włączyć dodatek Analysis ToolPak na ekranie Opcje programu Excel.

  1. W programie Excel wybierz Plik menu i wybierz Opcje.

    Zrzut ekranu opcji w programie Excel
  2. Wybierz Dodatki w lewym menu nawigacyjnym. Następnie upewnij się, że Dodatki do programu Excel jest wybrany w Zarządzać pole.

    Opcje programu Excel
  3. Na koniec wybierz Udać się przycisk.

    Opcje dodatku Excel i przycisk Przejdź
  4. W wyskakującym oknie Dodatki. Włączyć Pakiet narzędzi analitycznych klikając pole przed nim, aby dodać znacznik wyboru i wybrać ok.

    Wyskakujące okno dodatków programu Excel

Teraz, gdy Analysis ToolPak jest włączony, możesz rozpocząć analizę regresji w programie Excel.

Jak wykonać prostą regresję liniową w programie Excel

Korzystając z arkusza kalkulacyjnego wagi i kalorii jako przykładu, możesz przeprowadzić analizę regresji liniowej w programie Excel w następujący sposób.

  1. Wybierz Dane menu. Następnie w Analiza grupa, wybierz Analiza danych.

    Wybór analizy danych w Excelu
  2. w Analiza danych okno, wybierz Regresja z listy i kliknij ok.

    Wybór analizy danych regresji w programie Excel
  3. ten Wejście Zakres Y to zakres komórek, który zawiera zmienną zależną. W tym przykładzie jest to waga. ten Wejście X Zakres jest zakres komórek który zawiera zmienną niezależną. W tym przykładzie jest to kolumna kalorii.

    Pola do wprowadzania zakresów regresji w Excelu
  4. Wybierz Etykiety dla komórek nagłówka, a następnie wybierz Nowy arkusz roboczy wysłać wyniki do nowy arkusz roboczy. Wybierz ok aby Excel przeprowadził analizę i przesłał wyniki do nowego arkusza.

    Pola Excela do nakładania etykiet i wysyłania regresji do nowego arkusza roboczego
  5. Sprawdź nowy arkusz. Wynik analizy zawiera szereg wartości, które należy zrozumieć, aby zinterpretować wyniki.

    Zrzut ekranu wyników analizy regresji w programie Excel

    Każda z tych liczb ma następujące znaczenie:

    • Wiele R: Współczynnik korelacji. 1 wskazuje na silną korelację między tymi dwiema zmiennymi, podczas gdy -1 oznacza, że ​​istnieje silna negatywna zależność. 0 oznacza brak korelacji.
    • plac R: Współczynnik determinacji, który pokazuje, ile punktów między dwiema zmiennymi znajduje się na linii regresji. Statystycznie jest to suma kwadratów odchyleń od średniej.
    • Regulowany kwadrat R: wartość statystyczna o nazwie R kwadrat, która jest dostosowana do liczby wybranych zmiennych niezależnych.
    • Standardowy błąd: Jak dokładne są wyniki analizy regresji. Jeśli ten błąd jest mały, wyniki regresji są dokładniejsze.
    • Obserwacje: liczba obserwacji w modelu regresji.

    Pozostałe wartości w danych wyjściowych regresji zawierają szczegółowe informacje o mniejszych składnikach w analizie regresji.

    • df: Wartość statystyczna znana jako stopnie swobody związane z źródła wariancji.
    • SS: Suma kwadratów. Stosunek resztkowej sumy kwadratów do całkowitego SS powinien być mniejszy, jeśli większość danych pasuje do linii regresji.
    • SM: Średni kwadrat danych regresji.
    • F: Statystyka F (test F) dla hipotezy zerowej. Zapewnia to znaczenie modelu regresji.
    • Istotność F: Wartość statystyczna znana jako wartość P F.

    Jeśli nie rozumiesz statystyk i obliczania modeli regresji, wartości na dole podsumowania nie będą miały większego znaczenia. Jednak najważniejsze są dwa kwadraty R i R.

Jak widać, w tym przykładzie kalorie mają silną korelację z całkowitą wagą.

Analiza regresji liniowej wielokrotnej w programie Excel

Aby wykonać tę samą regresję liniową, ale z wieloma zmiennymi niezależnymi, wybierz cały zakres (wiele kolumn i wierszy) dla Wejście X Zakres.

Zrzut ekranu przedstawiający wybór zakresu dla Input X Range

Wybierając wiele zmiennych niezależnych, jest mniej prawdopodobne, że znajdziesz tak silną korelację, ponieważ jest tak wiele zmiennych.

Jednak analiza regresji w programie Excel może pomóc w znalezieniu korelacji z co najmniej jedną z tych zmiennych, o których istnieniu możesz nie wiedzieć, po prostu przeglądając dane ręcznie.