Deviation vs Standard Deviation
Deviation vs Standard Deviation
A leíró és következtetéses statisztikákban több mutatót használnak annak az adatsornak a leírására, amely megfelel annak központi tendenciájának, szóródásának és ferdeségének. Statisztikai következtetésekben ezeket általában becslőknek nevezik, mivel becsülik a populációs paraméter értékeit.
A diszperzió az adatok terjedésének mértéke az adatkészlet közepe körül. A szórás az egyik leggyakrabban alkalmazott diszperziós módszer. Az egyes adatpontok átlagtól való eltéréseit figyelembe vesszük a szórás kiszámításakor. Ezért azt állíthatjuk, hogy a szórás és az átlag együttesen majdnem elegendő képet ad egy adatkészletről.
Vegye figyelembe a következő adatsort. Tíz ember súlyát (kilogrammban) 70, 62, 65, 72, 80, 70, 63, 72, 77 és 79-re mérik. Ezután a tíz ember átlagos súlya (kilogrammban) 71 (kilogrammban)).
Mi az eltérés?
A statisztikában az eltérés azt az összeget jelenti, amellyel egyetlen adatpont eltér egy fix értéktől, például az átlagtól. Általában legyen k fix érték, és x 1, x 2,…, x n jelölje az adatsort. Ezután x j k-tól való eltérése (x j - k).
Például a fenti adatsorban a megfelelő eltérések az átlagtól (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 és (79 - 71) = 8.
Mi a szórás?
Amikor a teljes népesség adatait figyelembe lehet venni (például népszámlálás esetén), lehetőség van a népesség szórásának kiszámítására. A populáció szórásának kiszámításához először kiszámítják az adatértékek eltérését a sokaság átlagától. Az eltérések középső középértékét (kvadratikus középértékét) a populáció szórásának nevezzük. Szimbólumokban: σ = √ {∑ (x i -µ) 2 / n}, ahol µ a populáció átlaga és n a populáció mérete.
Ha egy (n méretű) mintából származó adatokat használunk a populáció paramétereinek becslésére, akkor a minta szórását kiszámítjuk. Először kiszámítják az adatértékek eltéréseit a minta átlagától. Mivel a mintaátlagot a populációátlag helyett használjuk (ez ismeretlen), a másodfokú átlag felvétele nem megfelelő. A mintaátlag kompenzálása érdekében az eltérések négyzetének összegét elosztjuk n helyett (n-1). A minta szórása ennek négyzetgyöke. Matematikai szimbólumokban S = √ {∑ (x i -ẍ) 2 / (n-1)}, ahol S a minta szórása, ẍ a mintaátlag és xi az adatpont.
Az előző adatsorban az eltérés négyzetének összege (-1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. Így a populáció szórása √ (366/10) = 6,05 (kilogrammban). (Feltéve, hogy a vizsgált népességet az a 10 ember alkotja, akitől az adatokat vették).
Mi a különbség az eltérés és a szórás között? • A szórás statisztikai index és becslő, de az eltérés nem. • A standard deviáció egy adatcsomónak a központból való eloszlásának mértéke, míg az eltérés arra az összegre vonatkozik, amellyel egyetlen adatpont eltér a rögzített értéktől. |