Regressionsanalyse i Excel: Detaljerede instruktioner

Anonim

Regressive analyse i Microsoft Excel

Regressionsanalyse er en af ​​de mest eftertragtede metoder til statistisk forskning. Med det er det muligt at fastslå graden af ​​indflydelse af uafhængige værdier på den afhængige variabel. Microsoft Excel-funktionaliteten har værktøjer beregnet til en lignende type analyse. Lad os analysere, at de repræsenterer sig selv og hvordan man bruger dem.

Tilslutning af en pakke med analyse

Men for at kunne bruge en funktion, der giver dig mulighed for at udføre en regressionsanalyse, skal du først og fremmest aktivere analysepakken. Først da de værktøjer, der er nødvendige for denne procedure, vises på eksilbåndet.

  1. Flyt ind i fanen "Fil".
  2. Gå til fanen Filer i Microsoft Excel

  3. Gå til afsnittet "Parametre".
  4. Gå til parametre i Microsoft Excel

  5. Vinduet Excel parameters åbnes. Gå til underafdeling "Addstructure".
  6. Overgang til add-in i Microsoft Excel

  7. I bunden af ​​åbningsvinduet omarrangerer vi kontakten i "Control" -positionen til "Excel-tilføjelsespositionen", hvis den er i en anden position. Klik på "GO-knappen".
  8. Flytning i tilføjelsen i Microsoft Excel

  9. Åbnet vindue tilgængeligt for Excel's overbygning. Vi sætter et tick om "analysepakke" -genstanden. Klik på knappen "OK".

Aktivering af analysepakken i Microsoft Excel

Nu, når vi flytter til fanen "Data", vil vi se en ny knap i værktøjslinjen "Data Analysis".

Microsoft Excel Settings Block

Typer af regressionsanalyse

Der er flere typer regressioner:
  • parabolisk;
  • strøm;
  • logaritmic;
  • eksponentiel;
  • vejledende;
  • hyperbolic;
  • Lineær regression.

Vi vil tale mere om implementeringen af ​​den sidste type regressionsanalyse i Excele mere.

Lineær regression i Excel-programmet

Nedenfor er der som et eksempel præsenteret en tabel, hvor den gennemsnitlige daglige lufttemperatur på gaden, og antallet af købere for den relevante arbejdsdag er angivet. Lad os finde ud af ved hjælp af regressionsanalyse, præcis, hvordan vejrforholdene i form af lufttemperatur kan påvirke den kommercielle institutions deltagelse.

Den generelle ligning af regression af de lineære arter er som følger: Y = A0 + A1X1 + ... + AKK. I denne formel betyder Y-variabel, indflydelsen af ​​de faktorer, som vi forsøger at udforske. I vores tilfælde er dette antallet af købere. Værdien af ​​X er forskellige faktorer, der påvirker variablen. Parametre A er koefficienter regression. Det vil sige, det er de, der bestemmer betydningen af ​​en bestemt faktor. Indekset K betegner det samlede antal af disse faktorer.

  1. Klik på knappen "Data Analysis". Det er sendt i fanen Hjem i værktøjslinjen "Analyse".
  2. Overgang til dataanalyse i Microsoft Excel

  3. Et lille vindue åbnes. I det vælger vi varen "regression". Klik på knappen "OK".
  4. Kør regression i Microsoft Excel

  5. Omregningsindstillingsvinduet åbnes. Det er obligatorisk for at udfylde felterne "Input Interval Y" og "Input Interval X". Alle andre indstillinger kan efterlades som standard.

    I feltet "Input Interval Y" angiv adressen på rækkevidden af ​​celler, hvor variabler er placeret, indflydelsen af ​​de faktorer, som vi forsøger at etablere. I vores tilfælde vil disse være cellerne i kolonnen "Antal købere". Adressen kan indtastes manuelt fra tastaturet, og du kan blot vælge den ønskede kolonne. Den sidste mulighed er meget lettere og mere praktisk.

    I feltet "Input Interval X" indtaster vi adressen på cellerne af cellerne, hvor denne faktor er placeret, hvis indflydelse på den variable, vi ønsker at installere. Som nævnt ovenfor skal vi etablere effekten af ​​temperatur på antallet af butikskøbere, og indtaste derfor adressen på cellerne i kolonnen "Temperatur". Dette kan laves de samme måder som i feltet "Antal købere".

    Indtast intervallet i regressionsindstillinger i Microsoft Excel

    Ved hjælp af andre indstillinger kan du indstille etiketterne, niveauet for pålidelighed, konstant til nul, vise et diagram af en normal sandsynlighed og udføre andre handlinger. Men i de fleste tilfælde behøver disse indstillinger ikke at blive ændret. Det eneste, der skal være opmærksom på, er til outputparametrene. Som standard udføres udgangen af ​​analyseresultaterne på et andet ark, men omarrere kontakten, du kan indstille udgangen i det angivne interval på samme ark, hvor bordet med kildedataene er placeret, eller i en separat bog, det vil sige i en ny fil.

    Output parametre i regressionsindstillinger i Microsoft Excel

    Når alle indstillinger er indstillet, skal du klikke på knappen "OK".

Running regressive analyse i Microsoft Excel

Analyse af resultaterne af analysen

Resultaterne af regressionsanalysen vises i form af et bord på det sted, der er angivet i indstillingerne.

Resultatet af regressionsanalyse i Microsoft Excel-programmet

En af hovedindikatorerne er R-Square. Det angiver kvaliteten af ​​modellen. I vores tilfælde er denne koefficient 0,705 eller ca. 70,5%. Dette er et acceptabelt niveau af kvalitet. Afhængighed mindre end 0,5 er dårligt.

En anden vigtig indikator er placeret i cellen ved krydset af "Y-Intersection" -linjen og kolonnen "koefficienter". Det angiver, hvilken værdi der vil være i Y, og i vores tilfælde er dette antallet af købere, med alle andre faktorer svarende til nul. Denne tabel er 58,04 i denne tabel.

Værdien ved skæringspunktet mellem tælleren "Variable X1" og "koefficienter" viser niveauet af afhængighed af Y fra X. I vores tilfælde er det niveauet af afhængighed af antallet af kunder i butikken på temperaturen. Koefficienten på 1,31 betragtes som en ret høj indikator for indflydelse.

Som du kan se, ved hjælp af Microsoft Excel-programmet er det ret nemt at lave en tabel med regressionsanalyse. Men at arbejde med de data, der er opnået ved udgangen, og forstå deres essens, vil kun en forberedt person kunne.

Læs mere