Regresszió vs korreláció
A statisztikában két véletlen változó közötti kapcsolat meghatározása fontos. Ez lehetőséget ad arra, hogy előrejelzéseket tegyen egy változóra vonatkozóan másokhoz képest. A regresszióanalízist és a korrelációt alkalmazzák az időjárás-előrejelzésekben, a pénzügyi piaci magatartásban, a fizikai kapcsolatok kísérletekkel történő létrehozásában és sokkal valósabb forgatókönyvekben.
Mi a regresszió?
A regresszió egy statisztikai módszer, amelyet két változó kapcsolatának megrajzolására használnak. Az adatok gyűjtésekor gyakran lehetnek olyan változók, amelyek másoktól függenek. A változók közötti pontos kapcsolat csak regressziós módszerekkel állapítható meg. Ennek a kapcsolatnak a meghatározása segít megérteni és megjósolni az egyik változó viselkedését a másik számára.
A regresszióanalízis leggyakoribb alkalmazása a függő változó értékének megbecsülése egy adott értékre vagy a független változók értéktartományára. Például regresszióval megállapíthatjuk a nyersanyagár és a fogyasztás kapcsolatát egy véletlenszerű mintából összegyűjtött adatok alapján. A regresszióanalízis egy adatkészlet regressziós függvényét hozza létre, amely matematikai modell a legjobban illeszkedik a rendelkezésre álló adatokhoz. Ezt könnyen lehet ábrázolni egy szóródási ábrával. Grafikusan a regresszió egyenértékű azzal, hogy megtaláljuk a legjobban illeszkedő görbét az adathalmaz számára. A görbe függvénye a regressziós függvény. A matematikai modell segítségével meg lehet jósolni egy áru igényét egy adott árra.
Ezért a regressziós elemzést széles körben használják az előrejelzésben és az előrejelzésben. Kapcsolatok létrehozására is használják a kísérleti adatokban, a fizika, a kémia, valamint számos természettudományi és mérnöki tudományág területén. Ha a kapcsolat vagy a regressziós függvény lineáris függvény, akkor a folyamatot lineáris regressziónak nevezzük. A szóródási ábrán egyenesként ábrázolható. Ha a függvény nem a paraméterek lineáris kombinációja, akkor a regresszió nem lineáris.
Mi az összefüggés?
A korreláció a két változó közötti kapcsolat erősségének mértéke. A korrelációs együttható az egyik változó változásának mértékét számszerűsíti a másik változó változása alapján. A statisztikában a korreláció a függőség fogalmához kapcsolódik, amely két változó statisztikai kapcsolata.
A Pearsons-féle korrelációs együttható, vagy éppen az r korrelációs együttható -1 és 1 közötti érték (-1≤r≤ + 1). Ez a leggyakrabban alkalmazott korrelációs együttható, és csak a változók közötti lineáris kapcsolatra érvényes. Ha r = 0, nincs összefüggés, és ha r ≥0, akkor a kapcsolat közvetlenül arányos; azaz az egyik változó értéke növekszik a másik növekedésével. Ha r≤0, a kapcsolat fordítottan arányos; azaz az egyik változó a másik növekedésével csökken.
A linearitási feltétel miatt az r korrelációs együttható is felhasználható a változók közötti lineáris kapcsolat jelenlétének megállapítására.
Mi a különbség a regresszió és a korreláció között?
A regresszió két véletlen változó közötti kapcsolat formáját adja meg, az összefüggés pedig a kapcsolat erősségének mértékét.
A regresszióanalízis egy regressziós függvényt eredményez, amely segít az eredmények extrapolálásában és előrejelzésében, míg a korreláció csak arról adhat információt, hogy milyen irányban változhat.
A pontosabb lineáris regressziós modelleket az elemzés adja meg, ha a korrelációs együttható magasabb. (| r | ≥0,8)