Standarta novirze un dispersija ir statistiski izkliedes rādītāji
Standarta novirzes un dispersijas formulu bieži izsaka, izmantojot:
Komplekta dispersija n tikpat ticamas vērtības var uzrakstīt šādi:
Standarta novirze ir dispersijas kvadrātsakne:
Formulas ar grieķu burtiem izskatās kā biedējošas, taču tas nav tik sarežģīti, kā šķiet. Lai to izdarītu vienkāršos soļos:
Tas dod variantu. Lai atrastu standarta novirzi, ņem dispersijas kvadrātsakni.
Šis lieliskais Hannas akadēmijas video izskaidro dispersijas un standartnovirzes jēdzienus:
Teiksim, datu kopā ir sešu pieneņu augstums: 3 collas, 4 collas, 5 collas, 4 collas, 11 collas un 6 collas.
Vispirms atrodiet datu punktu vidējo lielumu: (3 + 4 + 5 + 4 + 11 + 7) / 6 = 5,5
Tātad vidējais augstums ir 5,5 collas. Tagad mums ir vajadzīgas novirzes, tāpēc mēs atrodam katra auga atšķirību no vidējā: -2,5, -1,5, -,5, -1,5, 5,5, 1,5
Tagad sadala katru novirzi kvadrātā un atrod to summu: 6,25 + 2,25 + .25 + 2,25 + 30,25 + 2,25 = 43,5
Tagad kvadrātu summu daliet ar datu punktu skaitu, šajā gadījumā augiem: 43,5 / 6 = 7,25
Tātad šīs datu kopas dispersija ir 7,25, kas ir diezgan patvaļīgs skaitlis. Lai to pārveidotu par reālās pasaules mērījumu, ņem kvadrātsakni 7,25, lai atrastu standarta novirzi collās.
Standarta novirze ir aptuveni 2,69 collas. Tas nozīmē, ka paraugā jebkura pienene, kas atrodas vidējā 2,69 collu (5,5 collas) robežās, ir “normāla”.
Novirzes ir sakārtotas kvadrātā, lai negatīvās vērtības (novirzes zem vidējā līmeņa) nezaudētu pozitīvās vērtības. Tas darbojas tāpēc, ka negatīvs skaitlis kvadrātā kļūst par pozitīvu vērtību. Ja jums būtu vienkārša datu kopa ar novirzēm no vidējās vērtības +5, +2, -1 un -6, novirzes summa iznāktu kā nulle, ja vērtības nav sakārtotas kvadrātā (ti, 5 + 2 - 1 - 6 = 0).
Variantu izsaka kā matemātisku dispersiju. Tā kā tas ir patvaļīgs skaitlis attiecībā pret datu kopas sākotnējiem izmēriem, to ir grūti vizualizēt un lietot reālajā nozīmē. Dispersijas atrašana parasti ir pēdējais solis pirms standartnovirzes atrašanas. Variantu vērtības dažreiz tiek izmantotas finansēs un statistikas formulās.
Standarta novirze, kas izteikta datu kopas sākotnējās vienībās, ir daudz intuitīvāka un tuvāk sākotnējās datu kopas vērtībām. To visbiežāk izmanto, lai analizētu demogrāfiskos datus vai iedzīvotāju paraugus, lai iegūtu priekšstatu par to, kas ir normāli iedzīvotājiem.
Normālā sadalījumā aptuveni 68% iedzīvotāju (vai vērtības) ietilpst 1 standarta novirzē (1σ) no vidējā un aptuveni 94% ietilpst 2σ. Vērtības, kas atšķiras no vidējās vērtības 1,7σ vai vairāk, parasti tiek uzskatītas par novirzēm.
Praksē tādas kvalitātes sistēmas kā Six Sigma mēģina samazināt kļūdu līmeni tā, lai kļūdas kļūtu par ārēju. Termins "sešu sigmu process" nāk no jēdziena, ka, ja ir sešas standarta novirzes starp procesa vidējo un tuvāko specifikācijas robežu, tad praktiski neviena prece neatbilst specifikācijām.[1]
Reālās pasaules lietojumprogrammās izmantotās datu kopas parasti atspoguļo populācijas paraugus, nevis veselas populācijas. Nedaudz modificētu formulu izmanto, ja no daļēja parauga jāizdara secinājumi par populāciju.
“Parauga standartnovirze” tiek izmantota, ja viss, kas jums ir, ir paraugs, bet jūs vēlaties sniegt paziņojumu par populācijas standarta novirzi, no kuras paraugs tiek ņemts
Vienīgais veids, kā parauga standarta novirzes formula atšķiras no standarta novirzes formulas, ir saucējā “-1”.
Izmantojot pieneņu piemēru, šī formula būtu nepieciešama, ja mēs paraugotu tikai 6 pienenes, bet gribējām izmantot šo paraugu, lai norādītu standarta novirzi visam laukam ar simtiem pieneņu.
Tagad kvadrātu summa tiks dalīta ar 5, nevis 6 (n - 1), kas dod dispersiju 8,7 (nevis 7,25) un parauga standarta novirze ir 2,95 collas, nevis 2,69 collas sākotnējai standarta novirzei. Šīs izmaiņas tiek izmantotas, lai paraugā atrastu kļūdas robežu (šajā gadījumā 9%).