Lineārā un loģistiskā regresija
Statistiskajā analīzē ir svarīgi identificēt sakarības starp attiecīgajiem mainīgajiem pētījumā. Dažreiz tas var būt pašas analīzes vienīgais mērķis. Viens spēcīgs rīks, kas tiek izmantots attiecību esamības noteikšanai un sakarību identificēšanai, ir regresijas analīze.
Vienkāršākā regresijas analīzes forma ir lineārā regresija, kur mainīgo attiecība ir lineāra. Statistiski tas izceļ sakarības starp skaidrojošo mainīgo un atbildes mainīgo. Piemēram, izmantojot regresiju, mēs varam noteikt sakarību starp preču cenu un patēriņu, pamatojoties uz datiem, kas savākti no nejaušas izlases. Regresijas analīze radīs datu kopas regresijas funkciju, kas ir matemātiskais modelis, kas vislabāk atbilst pieejamajiem datiem. To var viegli attēlot ar izkliedes diagrammu. Grafiska regresija ir līdzvērtīga labākās dotās datu kopas līknes atrašanai. Līknes funkcija ir regresijas funkcija. Izmantojot matemātisko modeli, preces cenu var paredzēt par noteiktu cenu.
Tāpēc regresijas analīze tiek plaši izmantota prognozēšanā un prognozēšanā. To izmanto arī, lai izveidotu sakarības eksperimentālajos datos, fizikas, ķīmijas, kā arī daudzās dabaszinātnēs un inženierzinātņu disciplīnās. Ja attiecības vai regresijas funkcija ir lineāra funkcija, tad procesu sauc par lineāru regresiju. Izkliedes diagrammā to var attēlot kā taisnu līniju. Ja funkcija nav lineāra parametru kombinācija, tad regresija nav lineāra.
Loģistiskā regresija ir salīdzināma ar daudzdimensiju regresiju, un tā rada modeli, lai izskaidrotu vairāku prognozētāju ietekmi uz reakcijas mainīgo. Tomēr loģistiskajā regresijā gala rezultāta mainīgajam jābūt kategoriskam (parasti dalīts; t.i., sasniedzamu iznākumu pāris, piemēram, nāve vai izdzīvošana, lai arī īpašas tehnikas ļauj modelēt vairāk klasificētu informāciju). Nepārtrauktu iznākuma mainīgo var pārveidot par kategorisku mainīgo lielumu, ko izmanto loģistikas regresijai; tomēr šādā veidā nepārtrauktu mainīgo sabrukšana lielākoties ir mazināta, jo tas samazina precizitāti.
Atšķirībā no lineārās regresijas, attiecībā pret vidējo, loģistiskās regresijas prognozējošajiem mainīgajiem nav jāpiespiež būt lineāri savienotiem, izplatītiem vai vienādām dispersijām katrā klasterī. Rezultātā sakarība starp prognozētāju un iznākuma mainīgajiem, visticamāk, nebūs lineāra funkcija.
Kāda ir atšķirība starp loģistisko un lineāro regresiju?
• Lineārā regresijā tiek pieņemta lineāra sakarība starp skaidrojošo mainīgo un atbildes mainīgo lielumu, un, analizējot modeli, tiek atrasti modeli apmierinošie parametri, lai iegūtu precīzu sakarību.
• Kvantitatīvajiem mainīgajiem tiek veikta lineārā regresija, un iegūtā funkcija ir kvantitatīvā.
• Loģistiskajā regresijā izmantotie dati var būt kategoriski vai kvantitatīvi, bet rezultāts vienmēr ir kategorisks.