Lineáris vs logisztikai regresszió
A statisztikai elemzés során fontos meghatározni a vizsgálat szempontjából érintett változók közötti összefüggéseket. Néha ez lehet az elemzés egyetlen célja. A kapcsolat fennállásának megállapításához és a kapcsolat azonosításához az egyik erős eszköz a regresszióanalízis.
A regresszióanalízis legegyszerűbb formája a lineáris regresszió, ahol a változók közötti kapcsolat lineáris összefüggést mutat. Statisztikai értelemben kihozza a magyarázó változó és a válaszváltozó közötti kapcsolatot. Például regresszió segítségével véletlenszerű mintából összegyűjtött adatok alapján megállapíthatjuk a nyersanyagár és a fogyasztás közötti kapcsolatot. A regresszióanalízis az adatkészlet regressziós függvényét hozza létre, amely matematikai modell a legjobban illeszkedik a rendelkezésre álló adatokhoz. Ezt könnyen lehet ábrázolni egy szóródási ábrával. A grafikus regresszió egyenértékű azzal, hogy megtaláljuk a legjobban illeszkedő görbét az adott adathalmaz számára. A görbe függvénye a regressziós függvény. A matematikai modell felhasználásával egy ár felhasználása megjósolható egy adott árhoz.
Ezért a regressziós elemzést széles körben használják az előrejelzésben és az előrejelzésben. Ugyancsak használják a kapcsolatok megállapítására a kísérleti adatokban, a fizika, a kémia és számos természettudományi és mérnöki tudományág területén. Ha a kapcsolat vagy a regressziós függvény lineáris függvény, akkor a folyamatot lineáris regressziónak nevezzük. A szóródási ábrán egyenesként ábrázolható. Ha a függvény nem a paraméterek lineáris kombinációja, akkor a regresszió nem lineáris.
A logisztikai regresszió összehasonlítható a többváltozós regresszióval, és modellt hoz létre a több prediktor válaszváltozóra gyakorolt hatásának magyarázatára. A logisztikai regresszióban azonban a végeredmény változónak kategorikusnak kell lennie (általában kettéosztva; azaz egy elérhető eredmény párja, például halál vagy túlélés, bár a speciális technikák lehetővé teszik a kategorizáltabb információk modellezését). A folyamatos kimeneti változó átalakítható kategorikus változóvá, amelyet a logisztikai regresszióhoz kell használni; a folyamatos változók ilyen módon történő összeomlása azonban többnyire nem javasolt, mert csökkenti a pontosságot.
A lineáris regresszióval ellentétben, az átlag felé, a logisztikai regresszió prediktorváltozóit nem kell arra kényszeríteni, hogy lineárisan összekapcsolódjanak, gyakran elosztva legyenek, vagy egyenlő szórással rendelkezzenek minden klaszteren belül. Ennek eredményeként a prediktor és az eredményváltozók közötti kapcsolat valószínűleg nem lineáris függvény.
Mi a különbség a logisztikai és a lineáris regresszió között?
• A lineáris regresszióban feltételezzük a magyarázó változó és a válaszváltozó közötti lineáris összefüggést, és elemzéssel megtaláljuk a modellnek megfelelő paramétereket a pontos összefüggés megadásához.
• A lineáris regressziót kvantitatív változókra hajtjuk végre, és a kapott függvény kvantitatív.
• A logisztikai regresszióban a felhasznált adatok lehetnek kategorikusak vagy kvantitatívak, de az eredmény mindig kategorikus.