Többszörös lineáris regresszió - áttekintés, képlet, hogyan működik

A többszörös lineáris regresszió olyan statisztikai technikára utal, amelyet két vagy több változó értéke alapján megjósolnak egy változó eredményéről. Néha egyszerűen többszörös regressziónak nevezik, és a lineáris regresszió kiterjesztése. A megjósolni kívánt változót függő változónak nevezzük, míg azok a változók, amelyeket a függő változó értékének megjóslásához használunk. független vagy magyarázó változókként ismertek.

Többszörös lineáris regresszió1. ábra: Többszörös lineáris regressziós modell előrejelzése az egyes megfigyelésekhez (Forrás)

Összegzés

  • A többszörös lineáris regresszió olyan statisztikai technikára utal, amely két vagy több független változót használ a függő változó kimenetelének megjóslásához.
  • A technika lehetővé teszi az elemzők számára, hogy meghatározzák a modell variációját és az egyes független változók relatív hozzájárulását a teljes varianciában.
  • A többszörös regresszió kétféle formát ölthet: lineáris regressziót és nemlineáris regressziót.

Többszörös lineáris regressziós képlet

Többszörös lineáris regresszió - képlet

Hol:

  • yi a függő vagy megjósolt változó
  • β0 az y-metszet, azaz y értéke, ha xi és x2 egyaránt 0.
  • β1 és β2 azok a regressziós együtthatók, amelyek az y változását reprezentálják az xi1 és az xi2 egy egységnyi változásához viszonyítva .
  • βp az egyes független változók meredekségi együtthatója
  • ϵ a modell véletlenszerű hibája (maradvány).

A többszörös lineáris regresszió megértése

Az egyszerű lineáris regresszió lehetővé teszi a statisztikusok számára, hogy megjósolják az egyik változó értékét egy másik változóról rendelkezésre álló információk felhasználásával. A lineáris regresszió megkísérli megteremteni a kapcsolatot a két változó között egyenes vonal mentén.

A többszörös regresszió egy olyan típusú regresszió, ahol a függő változó lineáris kapcsolatot mutat két vagy több független változóval. Lehet nemlineáris is , ahol a függő és független változók Független változó A független változó olyan bemenet, feltételezés vagy meghajtó, amelyet megváltoztatnak annak érdekében, hogy értékeljék annak hatását egy függő változóra (az eredményre). ne kövesse az egyenes vonalat.

Mind a lineáris, mind a nemlineáris regresszió két vagy több változó segítségével grafikusan követ egy adott választ. A nemlineáris regressziót azonban általában nehéz végrehajtani, mivel ez próba-hiba módszerből származó feltételezések alapján jön létre.

Többszörös lineáris regresszió feltételezései

A többszörös lineáris regresszió a következő feltételezéseken alapul:

1. Lineáris összefüggés a függő és független változók között

A többszörös lineáris regresszió első feltételezése az, hogy lineáris összefüggés van a függő változó és az egyes független változók között. A lineáris összefüggések ellenőrzésének legjobb módja az, ha szétszórt ábrákat hoz létre, majd vizuálisan megvizsgálja a szóródási pontokat a linearitás szempontjából. Ha a szóródási sávban megjelenített kapcsolat nem lineáris, akkor az elemzőnek nemlineáris regressziót kell futtatnia, vagy statisztikai szoftverek, például SPSS segítségével kell átalakítania az adatokat.

2. A független változók nincsenek szoros összefüggésben egymással

Az adatok nem mutathatnak többkollinearitást, amely akkor következik be, amikor a független változók (magyarázó változók) szoros összefüggésben vannak egymással. Amikor a független változók multikollinearitást mutatnak, problémák adódnak annak a specifikus változónak a kitalálásával, amely hozzájárul a függő változó varianciájához. A feltételezés tesztelésének legjobb módszere a Variance Inflation Factor módszer.

3. A maradványok szórása állandó

A többszörös lineáris regresszió feltételezi, hogy a maradványokban szereplő hibák mennyisége a lineáris modell minden pontján hasonló. Ez a forgatókönyv homoskedaszticitás néven ismert. Az adatok elemzésekor az elemzőnek fel kell ábrázolnia a standardizált maradványokat az előre jelzett értékekhez képest, hogy megállapítsa, a pontok igazságosan oszlanak-e el a független változók összes értéke között. A feltételezés teszteléséhez az adatokat ábrázolhatjuk egy szóródiagramon, vagy statisztikai szoftver segítségével előállíthatunk egy, a teljes modellt magába foglaló szóródiagramot.

4. A megfigyelés függetlensége

A modell feltételezi, hogy a megfigyeléseknek függetlennek kell lenniük egymástól. Egyszerűen fogalmazva, a modell feltételezi, hogy a maradványok értéke független. Ennek a feltételezésnek a teszteléséhez a Durbin Watson statisztikát használjuk.

A teszt 0 és 4 közötti értékeket mutat, ahol 0 és 2 közötti érték pozitív autokorrelációt mutat, és 2 és 4 közötti érték negatív autokorrelációt mutat. A középpont, azaz a 2-es érték azt mutatja, hogy nincs autokorreláció.

5. Többváltozós normalitás

A többváltozós normalitás akkor fordul elő, ha a maradványok normálisan eloszlanak. Ennek a feltételezésnek a teszteléséhez nézze meg, hogy a maradványok értékei hogyan oszlanak meg. Két fő módszerrel is tesztelhető, azaz egy hisztogramra ráhelyezett normál görbével vagy a Normal Probability Plot módszerrel.

További források

A Finance a Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ tanúsítást kínálja törlesztések és még sok más. tanúsító program azok számára, akik karrierjüket egy újabb szintre akarják vinni. A tanulás és a tudásbázis fejlesztése érdekében kérjük, tanulmányozza az alábbi releváns pénzügyi forrásokat:

  • Előrejelzési módszerek Előrejelzési módszerek Legjobb előrejelzési módszerek. Ebben a cikkben négyféle bevételi előrejelzési módszert ismertetünk, amelyeket a pénzügyi elemzők a jövedelem előrejelzésére használnak.
  • Poisson-disztribúció Poisson-disztribúció A Poisson-disztribúció a valószínűségelméleti statisztikákban használt eszköz arra, hogy előre jelezze a variáció mértékét egy ismert átlagos előfordulási arány alapján, belül
  • Véletlen változó Véletlen változó A véletlenszerű változó (sztochasztikus változó) egy olyan változó a statisztikában, amelynek lehetséges értékei egy bizonyos véletlenszerű jelenség kimenetelétől függenek
  • Regresszióanalízis Regresszióanalízis A regresszióanalízis olyan statisztikai módszerek összessége, amelyeket a függő változó és egy vagy több független változó közötti kapcsolatok becslésére használnak. Használható a változók közötti kapcsolat erősségének felmérésére és a köztük lévő jövőbeli modell modellezésére.

Legutóbbi hozzászólások