Zsákolás (Bootstrap Aggregation) - áttekintés, hogyan működik, előnyei

Az együttes gépi tanulása elsősorban a táskázás és a továbbfejlesztés kategóriába sorolható. A zsákolási technika mind a regresszió, mind a statisztikai osztályozás szempontjából hasznos. A táskát döntési fáknál alkalmazzák, ahol ez jelentősen növeli a modellek stabilitását a variancia csökkentésében és a pontosság javításában, ami kiküszöböli a túlillesztés kihívását.

Zsákolás

1. ábra: Zsákolás (Bootstrap Aggregation) áramlása. Forrás

Az együttes gépi tanulás többféle gyenge modellt igényel, összesítve az előrejelzéseket a legjobb előrejelzés kiválasztásához. A gyenge modellek a funkciótér külön szakaszaira szakosodtak, ami lehetővé teszi, hogy minden modellből származó tőkeáttétel-előrejelzések adják meg a legnagyobb célt.

Gyors Su mmary

  • A táskázás és az emelés az együttes gépi tanulás két fő módszere.
  • A zsákolás olyan együttes módszer, amely felhasználható a regresszióban és az osztályozásban.
  • Bootstrap aggregation néven is ismert, amely a zsákolás két osztályozását alkotja.

Mi az a Bootstrapping?

A zsákolás két részből áll: összevonásból és csomagtartó pántolásból. A rendszerindítás egy mintavételi módszer, amikor a mintát egy készletből választják ki, a helyettesítési módszerrel. Ezután a kiválasztott mintákon fut a tanulási algoritmus.

A rendszerindítási technika mintavételt használ helyettesítésekkel, hogy a kiválasztási eljárás teljesen véletlenszerű legyen. Ha egy mintát kicserélés nélkül választanak ki, a változók későbbi kiválasztása mindig az előző kiválasztástól függ, ezért a kritériumok nem véletlenszerűvé válnak.

Mi az összesítés?

A modelljóslatok az összes lehetséges eredmény figyelembevétele érdekében összesítésen mennek keresztül, hogy összekapcsolják őket a végső előrejelzéssel. Az összesítés elvégezhető a kimenetek teljes száma vagy az eljárás minden modelljének indításából származó előrejelzések valószínűsége alapján.

Mi az az Ensemble módszer?

A zsákolás és a fellendülés egyaránt a legkiemelkedőbb együttes technikákat jelenti. Az együttes módszer egy olyan gépi tanulási platform, amely több modellt segít a képzésben ugyanazon tanulási algoritmus használatával. Az együttes módszer a multi-osztályozók nagyobb csoportjának résztvevője.

A többosztályosok több tanulóból álló csoportok, ezerbe futva, közös céllal, amely egyesítheti és megoldhatja a közös problémát. A multi-osztályozók másik kategóriája a hibrid módszerek. A hibrid módszerek egy sor tanulót alkalmaznak, de a több osztályozóval ellentétben különálló tanulási módszereket alkalmazhatnak.

A tanulásnak számos kihívással kell szembenéznie, például olyan hibákkal, amelyek főként az elfogultság, a zaj és a szórás következményei. A gépi tanulás pontosságát és stabilitását olyan együttes módszerek garantálják, mint a táskázás és az emelés. A több osztályozó kombinációja csökkenti a varianciát, különösen ott, ahol az osztályozók instabilak, és ezek fontosabbak megbízhatóbb eredmények bemutatásában, mint egyetlen osztályozó.

A zsákolás vagy a fokozás alkalmazása először az alaptanuló algoritmus kiválasztását igényli. Például, ha valaki besorolási fát választ, akkor a feltöltés és a zsákolás a felhasználó preferenciájával megegyező méretű fákból áll.

A csomagolás előnyei és hátrányai

Véletlenszerű erdő Véletlenszerű erdő A véletlenszerű erdő az előrejelzések modellezésében és a viselkedéselemzésben használt technika, amely döntési fákra épül. A véletlenszerű erdő sok döntési fát tartalmaz az egyik legnépszerűbb zsákolási algoritmus. A táskázás előnye, hogy sok gyenge tanuló számára lehetővé teszi az erőteljes tanuló túllépését. Segít a variancia csökkentésében is, ezért kiküszöböli a túlterhelést. Az overfitting az overfitting a statisztikákban használt kifejezés, amely olyan modellezési hibára utal, amely akkor fordul elő, amikor egy függvény túlságosan megfelel az eljárás bizonyos modellkészleteinek.

A csomagolás egyik hátránya, hogy a modell értelmezhetőségének elvesztését vonja maga után. Az eredményül kapott modell sok elfogultságot tapasztalhat, ha a megfelelő eljárást figyelmen kívül hagyják. Annak ellenére, hogy a zsákolás nagyon pontos, számítási szempontból költséges lehet, és ez bizonyos esetekben visszatarthatja a használatát.

Bagging vs. Boosting

A zsákolás és a feltöltés közötti legjobb technika a rendelkezésre álló adatoktól, a szimulációtól és az adott pillanatban fennálló körülményektől függ. A becslés szórása jelentősen csökken a kombinációs eljárás során végzett zsákolási és növelési technikákkal, ezáltal növelve a pontosságot. Ezért a kapott eredmények nagyobb stabilitást mutatnak, mint az egyes eredmények.

Amikor egy esemény az alacsony teljesítmény kihívásával jár, a zsákolási technika nem eredményez jobb elfogultságot. A boosting technika azonban egységes modellt állít elő alacsonyabb hibákkal, mivel egyetlen modellben az előnyök optimalizálására és a hiányosságok csökkentésére összpontosít.

Ha az egyetlen modell kihívása túlterhelt, a zsákolási módszer jobban teljesít, mint a fokozó technika. A Boosting azzal a kihívással néz szembe, hogy kezelni kell a túlterhelést, mivel ez önmagában is túlterheléssel jár.

Kapcsolódó olvasmányok

A Finance felajánlja a pénzügyi modellezés és értékbecslés elemzőjének (FMVA) ™ FMVA® tanúsítását. Csatlakozzon 350 600+ hallgatóhoz, akik olyan vállalatoknál dolgoznak, mint az Amazon, a JP Morgan és a Ferrari tanúsító program azok számára, akik karrierjüket a következő szintre akarják vinni. A tanulás és a tudásbázis fejlesztése érdekében kérjük, tanulmányozza az alábbi releváns pénzügyi forrásokat:

  • Klaszter mintavétel Klaszter mintavétel A statisztikákban a klaszter mintavétel egy olyan mintavételi módszer, amelyben a vizsgálat teljes populációja külsőleg homogén, de belső
  • A túlzott önbizalom elfogultsága A túlzott önbizalom elfogultsága A túlzott önbizalom elfogultsága képességeink, értelmünk vagy tehetségünk hamis és félrevezető értékelése. Röviden, egotikus meggyőződés, hogy jobbak vagyunk, mint valójában. Ez veszélyes elfogultság lehet, és nagyon termékeny a viselkedési pénzügyi és tőkepiacokon.
  • Regresszióanalízis Regresszióanalízis A regresszióanalízis olyan statisztikai módszerek összessége, amelyeket a függő változó és egy vagy több független változó közötti kapcsolatok becslésére használnak. Használható a változók közötti kapcsolat erősségének felmérésére és a köztük lévő jövőbeli modell modellezésére.
  • Idősoros adatok elemzése Idősoros adatok elemzése Az idősoros adatok elemzése egy adott időtartam alatt változó adatkészletek elemzése. Az idősoros adatkészletek ugyanazon változó megfigyelését rögzítik különböző időpontokban. A pénzügyi elemzők olyan idősoros adatokat használnak fel, mint a részvényárfolyamok mozgása, vagy a társaság eladásai az idő múlásával

Legutóbbi hozzászólások