Szórás és átlag
A leíró és következtetéses statisztikákban több mutatót használnak annak az adatsornak a leírására, amely megfelel annak központi tendenciájának, szóródásának és ferdeségének. Statisztikai következtetésekben ezeket általában becslőknek nevezik, mivel becsülik a populációs paraméter értékeit.
A központi tendencia az értékek eloszlásának központját jelöli és keresi meg. Az átlag, a mód és a medián a leggyakrabban használt index az adatkészlet központi tendenciájának leírásakor. A diszperzió az adatok terjesztésének mennyisége az elosztás központjából. A szórás a leggyakrabban használt tartomány és szórás. Pearson ferdeségi együtthatóit használják az adatok eloszlásának ferdeségének leírására. Itt a ferdeség arra utal, hogy az adatkészlet szimmetrikus-e a középponttal szemben, és ha nem, akkor mennyire ferde.
Mit jelent?
Az átlag a központi tendencia leggyakrabban használt indexe. Adatkészlet esetén az átlagot úgy számítják ki, hogy az összes adatérték összegét összeadja, majd elosztja az adatok számával. Például 10 ember súlyát (kilogrammban) 70, 62, 65, 72, 80, 70, 63, 72, 77 és 79 tömegre mérjük. Ezután a tíz ember átlagos súlya (kilogrammban) megadható. az alábbiak szerint számítva. A súlyok összege 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Átlag = (összeg) / (adatszám) = 710/10 = 71 (kilogrammban).
Ahogy ebben a konkrét példában, úgy az adatkészlet átlagos értéke nem feltétlenül a halmaz adatpontja, hanem egyedi lesz egy adott adathalmaz esetében. A Mean értéke megegyezik az eredeti adatokkal. Ezért ugyanazon a tengelyen jelölhető meg, mint az adatok, és összehasonlításokban felhasználható. Továbbá nincs előjelkorlátozás az adatkészlet átlagára vonatkozóan. Lehet negatív, nulla vagy pozitív, mivel az adatkészlet összege lehet negatív, nulla vagy pozitív.
Mi a szórás?
A szórás a leggyakrabban használt diszperziós index. A szórás kiszámításához először kiszámítják az adatértékek eltérését az átlagtól. Az eltérések gyök négyzet átlagát szokásos szórásnak nevezzük.
Az előző példában a megfelelő eltérés az átlagtól (70 - 71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 és (79-71) = 8. az eltérés négyzete (-1) 2+ (-9) 2 + (-6) 2 + 1 2 +9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366 A szórás √ (366/10) = 6,05 (kilogrammban). Ebből arra lehet következtetni, hogy az adatok többsége a 71 ± 6,05 intervallumban van, feltéve, hogy az adatsor nem nagyon torzul, és ebben a konkrét példában valóban így van.
Mivel a szórásnak ugyanazok az egységei vannak, mint az eredeti adatoknak, ez megadja azt, hogy mennyire tér el az adat a központtól; nagyobb a szórás, nagyobb a diszperzió. Ezenkívül a szórás nem negatív érték lesz, függetlenül az adatkészlet adatainak természetétől.
Mi a különbség a szórás és az átlag között? • A szórás a szóródás mértéke a központtól, míg az átlag az adatkészlet középpontjának helyét méri. • A szórás mindig nem negatív érték, de az átlag bármilyen valós értéket felfoghat. |