Dispersija vs kovariācija
Variants un kovariācija ir divi statistikā izmantotie rādītāji. Dispersija ir datu izkliedes mērs, un kovariācija norāda divu izlases mainīgo izmaiņu pakāpi kopā. Variants drīzāk ir intuitīvs jēdziens, bet kovarianci matemātiski definē nevis sākumā tik intuitīvi.
Vairāk par variantu
Dispersija ir datu izkliedes rādītājs no sadalījuma vidējās vērtības. Tas norāda, cik tālu datu punkti atrodas no vidējā sadalījuma. Tas ir viens no galvenajiem varbūtības sadalījuma aprakstiem un viens no sadalījuma momentiem. Arī dispersija ir populācijas parametrs, un populācijas izlases dispersija darbojas kā populācijas dispersijas novērtētājs. No viena viedokļa tas tiek definēts kā standarta novirzes kvadrāts.
Vienkāršā valodā to var raksturot kā attāluma starp katru datu punktu un sadalījuma vidējo kvadrātu vidējo. Lai aprēķinātu dispersiju, tiek izmantota šāda formula.
Var (X) = E [(X-µ)2 ] iedzīvotājiem un
Var (X) = E [(X-‾x)2 ] paraugam
To var vēl vienkāršot, lai iegūtu Var (X) = E [X2 ] - (E [X])2.
Dispersijai ir dažas paraksta īpašības, un to bieži izmanto statistikā, lai padarītu lietošanu vienkāršāku. Variants nav negatīvs, jo tas ir attālumu kvadrāts. Tomēr dispersijas diapazons nav ierobežots un atkarīgs no konkrētā sadalījuma. Pastāvīga izlases lieluma dispersija ir nulle, un dispersija nemainās attiecībā pret atrašanās vietas parametru.
Vairāk par Covariance
Statistiskajā teorijā kovariācija ir mēraukla, cik lielā mērā divi izlases mainīgie mainās kopā. Citiem vārdiem sakot, kovariācija ir korelācijas stipruma rādītājs starp diviem izlases lielumiem. To var arī uzskatīt par divu nejaušu mainīgo dispersijas jēdziena vispārinājumu.
Divu nejaušu mainīgo X un Y kovariācija, kas ir kopīgi sadalīti ar ierobežotu otro impulsu, ir zināma kā σXY= E [(X-E [X]) (Y-E [Y])]. Tādējādi dispersiju var uzskatīt par īpašu kovariācijas gadījumu, kad divi mainīgie ir vienādi. Cov (X, X) = Var (X)
Normalizējot kovariāciju, var iegūt lineārās korelācijas koeficientu vai Pīrsona korelācijas koeficientu, ko definē kā ρ = E [(X-E [X]) (Y-E [Y])] / (σX σY ) = (Cov (X, Y)) / (σX σY)
Grafiski kovarianci starp datu punktu pāri var uzskatīt par taisnstūra laukumu ar datu punktiem pretējās virsotnēs. To var interpretēt kā attālumu starp diviem datu punktiem. Ņemot vērā taisnstūrus visai populācijai, taisnstūra pārklāšanos, kas atbilst visiem datu punktiem, var uzskatīt par atdalīšanas stiprumu; abu mainīgo dispersija. Kovariācija ir divās dimensijās divu mainīgo lielumu dēļ, bet, vienkāršojot to vienam mainīgajam, tiek iegūts varianta variants, jo atdalīšana vienā dimensijā.
Kāda ir atšķirība starp dispersiju un kovariāciju?
• dispersija ir izplatības / izkliedes rādītājs populācijā, savukārt kovariancija tiek uzskatīta par divu nejaušu mainīgo variācijas vai korelācijas stipruma mēru..
• dispersiju var uzskatīt par īpašu kovariācijas gadījumu.
• dispersija un kovariācija ir atkarīga no datu vērtību lieluma, un tos nevar salīdzināt; tāpēc tie tiek normalizēti. Kovarianci normalizē korelācijas koeficientā (divu nejaušo mainīgo standartnovirzes dalot ar reizinājumu) un dispersiju normalizē standartnovirzē (ņemot kvadrātsakni).