Variance Inflation Factor (VIF) - áttekintés, képlet, felhasználás

A Variance Inflation Factor (VIF) a multikollinearitás súlyosságát méri a regresszióanalízisben. Regresszióanalízis A regresszióanalízis olyan statisztikai módszerek összessége, amelyeket a függő változó és egy vagy több független változó közötti kapcsolatok becslésére használnak. Használható a változók közötti kapcsolat erősségének felmérésére és a köztük lévő jövőbeli modell modellezésére. . Ez egy statisztikai fogalom, amely a regressziós együttható varianciájának növekedését jelzi a kollinearitás következtében.

Variancia inflációs tényező

Összegzés

  • A variancia inflációs tényezőt (VIF) használják a multicollinearity súlyosságának kimutatására a hétköznapi legkisebb négyzet (OLS) regresszióanalízisben.
  • A multikollinearitás növeli a varianciát és a II-es típusú hibát. Ez egy változó együtthatóját konzisztenssé, de megbízhatatlanná teszi.
  • A VIF a multicollinearity okozta felfújt varianciák számát méri.

Variancia inflációs tényező és multikollinearitás

A szokásos legkisebb négyzet (OLS) regresszióanalízisben multikollinearitás akkor áll fenn, ha két vagy több független változó Független változó A független változó olyan bemenet, feltételezés vagy meghajtó, amelyet megváltoztatnak annak érdekében, hogy értékeljék annak hatását egy függő változóra (az eredményre). . mutasson lineáris kapcsolatot közöttük. Például a vállalati méretek és a bevételek részvényárakhoz való viszonyának regressziós modellben történő elemzéséhez a piaci kapitalizáció és a bevételek a független változók.

A társaság piaci kapitalizációja Piaci kapitalizáció A piaci kapitalizáció (Market Cap) a vállalat forgalomban lévő részvényeinek legfrissebb piaci értéke. A Market Cap megegyezik a mindenkori részvényárfolyam szorzatával a forgalomban lévő részvények számával. A befektető közösség gyakran a piaci kapitalizáció értékét használja a vállalatok rangsorolásához, és összbevétele szorosan összefügg. Mivel egy vállalat növekvő bevételeket keres, méretével is növekszik. Multikollinearitás problémához vezet az OLS regresszióanalízis során. Ha a regressziós modell független változói tökéletesen kiszámítható lineáris összefüggést mutatnak, akkor ezt tökéletes multikollinearitásnak nevezzük.

Multikollinearitás esetén a regressziós együtthatók még mindig konzisztensek, de már nem megbízhatók, mivel a standard hibák túl vannak. Ez azt jelenti, hogy a modell prediktív ereje nem csökken, de az együtthatók nem lehetnek statisztikailag szignifikánsak egy II. Típusú hibával. II. Típusú hiba Statisztikai hipotézis tesztelés során a II. Típusú hiba olyan helyzet, amikor egy hipotézis teszt nem utasítja el azt a nullhipotézist, amely szerint hamis. Más .

Ezért, ha a változók együtthatói nem egyénileg szignifikánsak - a t-próbában nem utasíthatók el -, de együtt magyarázhatjuk a függő változó varianciáját az F-próba elutasításával és egy magas meghatározási együtthatóval (R2), multikollinearitás létezhet. Ez az egyik módszer a multicollinearity kimutatására.

A VIF egy másik gyakran használt eszköz annak megállapítására, hogy létezik-e multikollinearitás egy regressziós modellben. Azt méri, hogy a becsült regressziós együttható varianciája (vagy standard hibája) mennyire van felfújva a kollinearitás miatt.

A variancia inflációs tényező használata

A VIF az alábbi képlettel számítható:

Variancia inflációs tényező - képlet

Ahol R i 2 a kiigazítatlan determinációs együtthatót jelenti az i-edik független változó regressziójára a maradékra. A VIF reciproka tolerancia néven ismert . A multikollinearitás kimutatására a személyes preferenciáktól függően vagy a VIF, vagy a tolerancia használható.

Ha R i 2 egyenlő 0-val, a fennmaradó független változók varianciáját az i-edik független változóból nem lehet megjósolni. Ezért, ha a VIF vagy a tolerancia egyenlő 1-vel, az i-edik független változó nincs korrelálva a maradékkal, ami azt jelenti, hogy ebben a regressziós modellben nem létezik multikollinearitás. Ebben az esetben az i-es regressziós együttható varianciája nincs felfújva.

Általában a 4 feletti VIF vagy a 0,25 alatti tolerancia azt jelzi, hogy multikollinearitás létezhet, és további vizsgálatokra van szükség. Ha a VIF nagyobb, mint 10, vagy a tolerancia alacsonyabb, mint 0,1, jelentős multicollinearity van, amelyet korrigálni kell.

Vannak azonban olyan helyzetek, amikor a magas VFI-értékeket biztonságosan figyelmen kívül lehet hagyni anélkül, hogy szenvednének a multikollinearitástól. A következő három ilyen helyzet:

1. Magas VIF-ek csak a kontrollváltozókban léteznek, de az érdekes változókban nem. Ebben az esetben az érdeklődésre számot tartó változók nem kollinárisak egymással vagy a kontrollváltozókkal. A regressziós együtthatókat ez nem befolyásolja.

2. Ha magas VIF-értékeket okoz a termékek vagy más változók hatásainak felvétele, a multikollinearitás nem okoz negatív hatást. Például egy regressziós modell mind x-t, mind x2-t tartalmaz független változóként.

3. Ha egy kettőnél több kategóriát képviselő dummy változónak magas a VIF-je, akkor nem feltétlenül létezik multicollinearity. A változóknak mindig magas lesz a VIF-értéke, ha az esetek kis része van a kategóriában, függetlenül attól, hogy a kategorikus változók korrelálnak-e más változókkal.

A multikollinearitás korrekciója

Mivel a multikollinearitás felfújja az együtthatók varianciáját és II. Típusú hibákat okoz, elengedhetetlen annak észlelése és kijavítása. Az alábbiakban felsorolt ​​két egyszerű és gyakran használt módszer a multikollinearitás korrigálására:

1. Az első az egyik (vagy több) szorosan összefüggő változó eltávolítása. Mivel a változók által szolgáltatott információ felesleges, a meghatározási együtthatót az eltávolítás nem fogja nagymértékben rontani.

2. A második módszer a főkomponens-elemzés (PCA) vagy a részleges legkisebb négyzetregresszió (PLS) alkalmazása az OLS-regresszió helyett. A PLS regresszióval csökkenthetők a változók kisebb halmazra, nincs összefüggés közöttük. A PCA-ban új, korrelálatlan változók jönnek létre. Minimalizálja az információvesztést és javítja a modell kiszámíthatóságát.

További források

A Finance a globális Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ tanúsítás hivatalos szállítója , a szövetség modellezése, a hitelek visszafizetése és még sok más. tanúsítási program, amelynek célja, hogy bárki világszínvonalú pénzügyi elemzővé váljon. A karrier továbbhaladásához az alábbi további források hasznosak lehetnek:

  • Alapvető statisztikai fogalmak a pénzügyben Alapvető statisztikai fogalmak a pénzügyekben A statisztika alapos megértése alapvető fontosságú a pénzügyek jobb megértésében. Sőt, a statisztikai koncepciók segíthetnek a befektetőknek a monitorozásban
  • Előrejelzési módszerek Előrejelzési módszerek Legjobb előrejelzési módszerek. Ebben a cikkben négyféle bevételi előrejelzési módszert ismertetünk, amelyeket a pénzügyi elemzők a jövedelem előrejelzésére használnak.
  • Többszörös lineáris regresszió Többszörös lineáris regresszió A többszörös lineáris regresszió olyan statisztikai technikára utal, amelyet a függő változó kimenetelének a független változók értéke alapján történő előrejelzésére használnak.
  • Véletlen változó Véletlen változó A véletlenszerű változó (sztochasztikus változó) egy olyan változó a statisztikában, amelynek lehetséges értékei egy bizonyos véletlenszerű jelenség kimenetelétől függenek

Legutóbbi hozzászólások