A többszörös lineáris regresszió olyan statisztikai technikára utal, amelyet két vagy több változó értéke alapján megjósolnak egy változó eredményéről. Néha egyszerűen többszörös regressziónak nevezik, és a lineáris regresszió kiterjesztése. A megjósolni kívánt változót függő változónak nevezzük, míg azok a változók, amelyeket a függő változó értékének megjóslásához használunk. független vagy magyarázó változókként ismertek.
1. ábra: Többszörös lineáris regressziós modell előrejelzése az egyes megfigyelésekhez (Forrás)
Összegzés
- A többszörös lineáris regresszió olyan statisztikai technikára utal, amely két vagy több független változót használ a függő változó kimenetelének megjóslásához.
- A technika lehetővé teszi az elemzők számára, hogy meghatározzák a modell variációját és az egyes független változók relatív hozzájárulását a teljes varianciában.
- A többszörös regresszió kétféle formát ölthet: lineáris regressziót és nemlineáris regressziót.
Többszörös lineáris regressziós képlet
Hol:
- yi a függő vagy megjósolt változó
- β0 az y-metszet, azaz y értéke, ha xi és x2 egyaránt 0.
- β1 és β2 azok a regressziós együtthatók, amelyek az y változását reprezentálják az xi1 és az xi2 egy egységnyi változásához viszonyítva .
- βp az egyes független változók meredekségi együtthatója
- ϵ a modell véletlenszerű hibája (maradvány).
A többszörös lineáris regresszió megértése
Az egyszerű lineáris regresszió lehetővé teszi a statisztikusok számára, hogy megjósolják az egyik változó értékét egy másik változóról rendelkezésre álló információk felhasználásával. A lineáris regresszió megkísérli megteremteni a kapcsolatot a két változó között egyenes vonal mentén.
A többszörös regresszió egy olyan típusú regresszió, ahol a függő változó lineáris kapcsolatot mutat két vagy több független változóval. Lehet nemlineáris is , ahol a függő és független változók Független változó A független változó olyan bemenet, feltételezés vagy meghajtó, amelyet megváltoztatnak annak érdekében, hogy értékeljék annak hatását egy függő változóra (az eredményre). ne kövesse az egyenes vonalat.
Mind a lineáris, mind a nemlineáris regresszió két vagy több változó segítségével grafikusan követ egy adott választ. A nemlineáris regressziót azonban általában nehéz végrehajtani, mivel ez próba-hiba módszerből származó feltételezések alapján jön létre.
Többszörös lineáris regresszió feltételezései
A többszörös lineáris regresszió a következő feltételezéseken alapul:
1. Lineáris összefüggés a függő és független változók között
A többszörös lineáris regresszió első feltételezése az, hogy lineáris összefüggés van a függő változó és az egyes független változók között. A lineáris összefüggések ellenőrzésének legjobb módja az, ha szétszórt ábrákat hoz létre, majd vizuálisan megvizsgálja a szóródási pontokat a linearitás szempontjából. Ha a szóródási sávban megjelenített kapcsolat nem lineáris, akkor az elemzőnek nemlineáris regressziót kell futtatnia, vagy statisztikai szoftverek, például SPSS segítségével kell átalakítania az adatokat.
2. A független változók nincsenek szoros összefüggésben egymással
Az adatok nem mutathatnak többkollinearitást, amely akkor következik be, amikor a független változók (magyarázó változók) szoros összefüggésben vannak egymással. Amikor a független változók multikollinearitást mutatnak, problémák adódnak annak a specifikus változónak a kitalálásával, amely hozzájárul a függő változó varianciájához. A feltételezés tesztelésének legjobb módszere a Variance Inflation Factor módszer.
3. A maradványok szórása állandó
A többszörös lineáris regresszió feltételezi, hogy a maradványokban szereplő hibák mennyisége a lineáris modell minden pontján hasonló. Ez a forgatókönyv homoskedaszticitás néven ismert. Az adatok elemzésekor az elemzőnek fel kell ábrázolnia a standardizált maradványokat az előre jelzett értékekhez képest, hogy megállapítsa, a pontok igazságosan oszlanak-e el a független változók összes értéke között. A feltételezés teszteléséhez az adatokat ábrázolhatjuk egy szóródiagramon, vagy statisztikai szoftver segítségével előállíthatunk egy, a teljes modellt magába foglaló szóródiagramot.
4. A megfigyelés függetlensége
A modell feltételezi, hogy a megfigyeléseknek függetlennek kell lenniük egymástól. Egyszerűen fogalmazva, a modell feltételezi, hogy a maradványok értéke független. Ennek a feltételezésnek a teszteléséhez a Durbin Watson statisztikát használjuk.
A teszt 0 és 4 közötti értékeket mutat, ahol 0 és 2 közötti érték pozitív autokorrelációt mutat, és 2 és 4 közötti érték negatív autokorrelációt mutat. A középpont, azaz a 2-es érték azt mutatja, hogy nincs autokorreláció.
5. Többváltozós normalitás
A többváltozós normalitás akkor fordul elő, ha a maradványok normálisan eloszlanak. Ennek a feltételezésnek a teszteléséhez nézze meg, hogy a maradványok értékei hogyan oszlanak meg. Két fő módszerrel is tesztelhető, azaz egy hisztogramra ráhelyezett normál görbével vagy a Normal Probability Plot módszerrel.
További források
A Finance a Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ tanúsítást kínálja törlesztések és még sok más. tanúsító program azok számára, akik karrierjüket egy újabb szintre akarják vinni. A tanulás és a tudásbázis fejlesztése érdekében kérjük, tanulmányozza az alábbi releváns pénzügyi forrásokat:
- Előrejelzési módszerek Előrejelzési módszerek Legjobb előrejelzési módszerek. Ebben a cikkben négyféle bevételi előrejelzési módszert ismertetünk, amelyeket a pénzügyi elemzők a jövedelem előrejelzésére használnak.
- Poisson-disztribúció Poisson-disztribúció A Poisson-disztribúció a valószínűségelméleti statisztikákban használt eszköz arra, hogy előre jelezze a variáció mértékét egy ismert átlagos előfordulási arány alapján, belül
- Véletlen változó Véletlen változó A véletlenszerű változó (sztochasztikus változó) egy olyan változó a statisztikában, amelynek lehetséges értékei egy bizonyos véletlenszerű jelenség kimenetelétől függenek
- Regresszióanalízis Regresszióanalízis A regresszióanalízis olyan statisztikai módszerek összessége, amelyeket a függő változó és egy vagy több független változó közötti kapcsolatok becslésére használnak. Használható a változók közötti kapcsolat erősségének felmérésére és a köztük lévő jövőbeli modell modellezésére.