Gan korelācija, gan regresija ir statistikas rīki, kas nodarbojas ar diviem vai vairākiem mainīgiem lielumiem. Lai arī abi attiecas uz vienu un to pašu priekšmetu, starp abiem pastāv atšķirības. Tālāk ir izskaidrotas atšķirības starp abiem.
Termins korelācija ar atsauci uz diviem vai vairākiem mainīgiem lielumiem nozīmē, ka mainīgie ir kaut kādā veidā saistīti. Korelācijas analīze nosaka, vai pastāv saistība starp diviem mainīgiem lielumiem, un attiecības stiprumu. Ja divi mainīgie x (neatkarīgi) un y (atkarīgie) ir savstarpēji saistīti, ka neatkarīgā mainīgā lieluma variācijas papildina ar atkarīgā mainīgā lieluma svārstībām, tad abi mainīgie tiek uzskatīti par korelētiem.
Korelācija var būt lineāra vai nelineāra. Lineārā korelācija ir tāda, kurā mainīgie ir tik saistīti, ka viena mainīgā vērtības izmaiņas konsekventi mainītu cita mainīgā lielumu. Lineārā korelācijā izkliedētie punkti, kas saistīti ar atkarīgo un neatkarīgo mainīgo attiecīgajām vērtībām, sagrupētos ap nehorizontālu taisnu līniju, kaut arī horizontāla taisna līnija arī norādītu uz lineāru saikni starp mainīgajiem, ja taisna līnija varētu savienot punktus, kas apzīmē mainīgie.
Regresijas analīze, no otras puses, izmanto esošos datus, lai noteiktu matemātisko sakarību starp mainīgajiem, kurus var izmantot, lai noteiktu atkarīgā mainīgā vērtību attiecībā pret jebkura neatkarīgā mainīgā vērtību.
Korelācija attiecas uz asociācijas spēka vai attiecību intensitātes mērīšanu, ja regresija attiecas uz atkarīgā mainīgā lieluma vērtības prognozēšanu attiecībā pret neatkarīgā mainīgā zināmo vērtību. To var izskaidrot ar šādām formulām.
Korelācijas koeficients vai koeficienta korelācija (r) starp x & y ir noskaidrota ar šādu formulu;
r = kovariācija (x, y) /σx.σy, cov (x, y) = Σxy / n - (Σx / n) (Σy / n), σx un σy ir attiecīgi x un y standarta novirzes, un - 1 < r 0, then correlation coefficient between x and y = correlation coefficient between u and v.
Korelācijas koeficients r ir tīrs skaitlis, kas nav atkarīgs no mērvienības. Tātad, ja x ir augstums (collas) un y ir noteikta reģiona cilvēku svars (mārciņas), tad r nav ne collās, ne mārciņās, bet vienkārši skaitlis.
Regresijas vienādojumu iegūst, izmantojot šādu formulu:
Y regresijas vienādojums uz x (lai uzzinātu y novērtējumu) ir y - y '= byx (x-x‾), byx sauc par y regresijas koeficientu uz x. X regresijas vienādojums uz y (lai uzzinātu x novērtējumu) ir x - x '= bxy (y-y‾), bxy sauc par x regresijas koeficientu uz y.
Korelācijas analīzē netiek pieņemts, ka kāds mainīgais ir atkarīgs no citiem mainīgajiem, kā arī nemēģina noskaidrot attiecības starp šiem diviem mainīgajiem. Tas vienkārši novērtē asociācijas pakāpi starp mainīgajiem. Citiem vārdiem sakot, korelācijas analīze pārbauda mainīgo lielumu savstarpējo atkarību. Regresijas analīze, no otras puses, apraksta atkarīgā mainīgā vai reakcijas mainīgā atkarību no neatkarīgā vai skaidrojošā mainīgā (-iem). Regresijas analīzē tiek pieņemts, ka starp skaidrojošajiem un atbildes mainīgajiem pastāv vienvirziena cēloņsakarība, un tajā netiek ņemts vērā, vai šī cēloņsakarība ir pozitīva vai negatīva. Korelācijai gan atkarīgo, gan neatkarīgo mainīgo lielumi ir nejauši, bet neatkarīgo mainīgo regresijas vērtībām nav jābūt izlases veidam.
1. Korelācijas analīze ir divu mainīgo savstarpējās atkarības pārbaude. Regresijas analīze dod matemātisku formulu atkarīgā mainīgā lieluma noteikšanai attiecībā pret neatkarīgā mainīgā lieluma vērtību.
2. Korelācijas koeficients nav atkarīgs no izcelsmes un mēroga izvēles, bet regresijas koeficients nav tāds.
Korelācijai abu mainīgo lielumiem jābūt izlases veidam, bet tas nav regresijas koeficientam.
1. Das, N. G., (1998), Statistics Methods, Calcutta
2. Korelācija un regresija, pieejama vietnē www.le.ac.uk/bl/gat/virtualfc/stats/regression
3. Regresija un korelācija, pieejama vietnē www.abyss.uoregon.edu