Regresija vs korelācija
Statistikā ir svarīgi noteikt sakarību starp diviem nejaušiem mainīgajiem. Tas dod iespēju izteikt prognozes par vienu mainīgo attiecībā pret citiem. Regresijas analīze un korelācija tiek izmantota laika prognozēs, finanšu tirgus uzvedībā, fizisko attiecību nodibināšanā ar eksperimentu palīdzību un daudz reālākās pasaules scenārijos..
Kas ir regresija?
Regresija ir statistikas metode, ko izmanto, lai izveidotu sakarību starp diviem mainīgajiem. Bieži vien, vācot datus, var būt mainīgi lielumi, kas ir atkarīgi no citiem. Precīza šo mainīgo saikne var tikt noteikta tikai ar regresijas metodēm. Šo attiecību noteikšana palīdz izprast un paredzēt viena mainīgā uzvedību otram.
Regresijas analīzes visizplatītākais pielietojums ir atkarīgā mainīgā lieluma noteikšana dotajai vērtībai vai neatkarīgo mainīgo vērtību diapazonam. Piemēram, izmantojot regresiju, mēs varam noteikt sakarību starp preču cenu un patēriņu, pamatojoties uz datiem, kas savākti no nejaušas izlases. Regresijas analīze rada datu kopas regresijas funkciju, kas ir matemātiskais modelis, kas vislabāk atbilst pieejamajiem datiem. To var viegli attēlot ar izkliedes diagrammu. Grafiski regresija ir līdzvērtīga vislabākās datu līknei atbilstošās līknes atrašanai. Līknes funkcija ir regresijas funkcija. Izmantojot matemātisko modeli, var prognozēt preces pieprasījumu par noteiktu cenu.
Tāpēc regresijas analīze tiek plaši izmantota prognozēšanā un prognozēšanā. To izmanto arī, lai izveidotu sakarus eksperimentālos datos, fizikas, ķīmijas, kā arī daudzās dabaszinātnēs un inženierzinātņu disciplīnās. Ja attiecības vai regresijas funkcija ir lineāra funkcija, tad procesu sauc par lineāru regresiju. Izkliedes diagrammā to var attēlot kā taisnu līniju. Ja funkcija nav lineāra parametru kombinācija, tad regresija nav lineāra.
Kas ir korelācija?
Korelācija ir divu mainīgo lielumu attiecības stipruma mērs. Korelācijas koeficients kvantitatīvi nosaka viena mainīgā izmaiņu pakāpi, pamatojoties uz izmaiņām otrā mainīgajā. Statistikā korelācija ir saistīta ar atkarības jēdzienu, kas ir statistiskā saistība starp diviem mainīgajiem.
Pīrsona korelācijas koeficients vai tikai korelācijas koeficients r ir vērtība no -1 līdz 1 (-1≤r≤ + 1). Tas ir visbiežāk izmantotais korelācijas koeficients un derīgs tikai lineārai sakarībai starp mainīgajiem. Ja r = 0, tad attiecības nepastāv, un ja r≥0, tad sakarība ir tieši proporcionāla; t.i., viena mainīgā vērtība palielinās, palielinoties otra. Ja r≤0, attiecības ir apgriezti proporcionālas; t.i., viens mainīgais samazinās, palielinoties otram.
Linearitātes nosacījuma dēļ korelācijas koeficientu r var izmantot arī, lai noteiktu lineāras attiecības esamību starp mainīgajiem.
Kāda ir atšķirība starp regresiju un korelāciju?
Regresija dod attiecību formu starp diviem nejaušiem mainīgajiem, un korelācija dod attiecību stiprības pakāpi.
Regresijas analīze rada regresijas funkciju, kas palīdz ekstrapolēt un prognozēt rezultātus, savukārt korelācija var sniegt tikai informāciju par to, kādā virzienā tā var mainīties.
Precīzākus lineārās regresijas modeļus dod analīze, ja korelācijas koeficients ir lielāks. (| r | ≥0,8)