galvenā atšķirība starp klasifikāciju un regresijas koku tas ir klasifikācijā atkarīgie mainīgie ir kategoriski un nav sakārtoti, savukārt regresijā atkarīgie mainīgie ir nepārtrauktas vai sakārtotas veselas vērtības.
Klasifikācija un regresija ir mācīšanās metodes, lai no apkopotajiem datiem izveidotu prognozēšanas modeļus. Abas tehnikas ir grafiski attēlotas kā klasifikācijas un regresijas koki vai drīzāk blokshēmas ar datu dalījumiem pēc katra soļa, vai drīzāk - “atzarojums” kokā. Šo procesu sauc par rekursīvo sadalīšanu. Tādās jomās kā kalnrūpniecība tiek izmantotas šīs klasifikācijas un regresijas mācīšanās metodes. Šajā rakstā uzmanība tiek pievērsta klasifikācijas kokam un regresijas kokam.
1. Pārskats un galvenās atšķirības
2. Kas ir klasifikācija?
3. Kas ir regresija
4. Salīdzinājums blakus - klasifikācija vs regresija tabulas formā
5. Kopsavilkums
Klasifikācija ir paņēmiens, ko izmanto, lai iegūtu shēmu, kas parāda datu organizāciju, sākot ar prekursora mainīgo. Atkarīgie mainīgie ir tie, kas klasificē datus.
01. attēls. Datu ieguve
Klasifikācijas koks sākas ar neatkarīgo mainīgo, kas sadalās divās grupās, kā to nosaka esošie atkarīgie mainīgie. Tas ir domāts, lai noskaidrotu atbildes kategorizēšanas veidā, ko rada atkarīgie mainīgie.
Regresija ir pareģošanas metode, kas balstās uz pieņemto vai zināmo skaitlisko izejas vērtību. Šī izvades vērtība ir atkārtotas sadalīšanas virknes rezultāts, katram posmam ir viena skaitliska vērtība un cita atkarīgo mainīgo grupa, kas sazarojas ar citu pāri, piemēram, šo..
Regresijas koks sākas ar vienu vai vairākiem prekursoru mainīgajiem un beidzas ar vienu galīgo izvades mainīgo. Atkarīgie mainīgie ir nepārtraukti vai diskrēti skaitliskie mainīgie.
Klasifikācija vs regresija | |
Koka modelis, kurā mērķa mainīgais var iegūt diskrētu vērtību kopu. | Koka modelis, kurā mērķa mainīgais var ņemt nepārtrauktas vērtības, parasti reālos skaitļus. |
Atkarīgais mainīgais | |
Klasifikācijas kokam atkarīgie mainīgie ir kategoriski. | Regresijas kokam atkarīgie mainīgie ir skaitliski. |
Vērtības | |
Tam ir noteikts daudzums nesakārtotu vērtību. | Ir vai nu diskrētas, bet vēl sakārtotas vērtības, vai arī nešķirtas vērtības. |
Būvniecības mērķis | |
Regresijas koka konstruēšanas mērķis ir pielāgot regresijas sistēmu katrai noteicošajai filiālei tādā veidā, lai iegūtu paredzamo izlaides vērtību. | Klasifikācijas koks sazarojas, kā to nosaka atkarīgais mainīgais, kas iegūts no iepriekšējā mezgla. |
Regresijas un klasifikācijas koki ir noderīgas metodes, lai izplānotu procesu, kas norāda uz pētītu rezultātu klasifikācijā vai atsevišķā skaitliskā vērtībā. Atšķirība starp klasifikācijas koku un regresijas koku ir no tiem atkarīgais mainīgais. Klasifikācijas kokiem ir atkarīgi mainīgie, kas ir kategoriski un nesakārtoti. Regresijas kokiem ir atkarīgi mainīgie, kas ir nepārtrauktas vērtības vai sakārtotas veselas vērtības.
1. “Lēmumu koku apgūšana.” Wikipedia, Wikimedia Foundation, 2018. gada 13. maijs. Pieejams šeit
1.Data Mining'By Arbeck - Savs darbs, (CC BY 3.0), izmantojot Commons Wikimedia