Vadītas mācības un nepārraudzītas mācības ir divi mašīnmācības pamatjēdzieni. Vadīta mācīšanās ir mašīnmācīšanās uzdevums, lai iemācītos funkciju, kas ieeju pievada izvadei, pamatojoties uz ieejas-izvades pāriem. Neuzraudzīta mācīšanās ir mašīnmācīšanās uzdevums, lai secinātu funkciju, lai aprakstītu slēptu struktūru no neapzīmētiem datiem. galvenā atšķirība starp uzraudzītu un neuzraudzītu mašīnu apguvi ir tieši tas uzraudzītā mācīšanās izmanto marķētus datus, savukārt neuzraudzītā mācīšanās izmanto marķētus datus.
Mašīnmācība ir joma datorzinātnēs, kas dod datorsistēmai iespēju mācīties no datiem, tieši to neprogrammējot. Tas ļauj analizēt datus un paredzēt modeļus tajos. Mašīnmācībai ir daudz lietojumu. Daži no tiem ir sejas atpazīšana, žestu atpazīšana un runas atpazīšana. Ir dažādi algoritmi, kas saistīti ar mašīnu mācīšanos. Daži no tiem ir regresija, klasifikācija un klasterizācija. Visizplatītākās programmēšanas valodas mašīnmācības lietojumprogrammu izstrādei ir R un Python. Var izmantot arī citas valodas, piemēram, Java, C ++ un Matlab.
1. Pārskats un galvenās atšķirības
2. Kas ir uzraudzītā mācīšanās?
3. Kas ir neuzraudzīta mācīšanās
4. Līdzības starp uzraudzītu un neuzraudzītu mašīnu apguvi
5. Salīdzinājums blakus - kontrolēta vai neuzraudzīta mašīnu apguve tabulas formā
6. Kopsavilkums
Mašīnmācības balstītās sistēmās modelis darbojas pēc algoritma. Pārraudzītā mācībā modelis tiek uzraudzīts. Pirmkārt, ir nepieciešams apmācīt modeli. Izmantojot iegūtās zināšanas, tas var paredzēt atbildes turpmākajiem gadījumiem. Modelis tiek apmācīts, izmantojot marķētu datu kopu. Ja sistēmai tiek doti paraugdati, tā var paredzēt rezultātu. Šis ir neliels izraksts no populārās IRIS datu kopas.
Saskaņā ar iepriekš minēto tabulu Sepala garumu, Sepala platumu, Patela garumu, Patela platumu un Sugas sauc par atribūtiem. Kolonnas sauc par funkcijām. Vienā rindā ir dati par visiem atribūtiem. Tāpēc vienu rindu sauc par novērojumu. Dati var būt gan skaitliski, gan kategoriski. Modelim ir doti novērojumi ar atbilstošo sugas nosaukumu kā ievadi. Kad tiek veikts jauns novērojums, modelim būtu jāparedz sugu tips, kurai tas pieder.
Pārraudzītā mācībā ir klasificēšanas un regresijas algoritmi. Klasifikācija ir marķēto datu klasifikācijas process. Modelis izveidoja robežas, kas atdalīja datu kategorijas. Kad modelim tiek sniegti jauni dati, to var klasificēt atkarībā no tā, kur atrodas punkts. K-tuvākie kaimiņi (KNN) ir klasifikācijas modelis. Atkarībā no k vērtības tiek izlemta kategorija. Piemēram, ja k ir 5, ja konkrēts datu punkts atrodas tuvu astoņiem A kategorijas datu punktiem un sešiem B kategorijas datu punktiem, tad datu punkts tiks klasificēts kā A.
Regresija ir iepriekšējo datu tendences prognozēšanas process, lai prognozētu jauno datu iznākumu. Regresijā izeja var sastāvēt no viena vai vairākiem nepārtrauktiem mainīgajiem. Prognozēšana tiek veikta, izmantojot līniju, kas aptver lielāko daļu datu punktu. Vienkāršākais regresijas modelis ir lineārā regresija. Tas ir ātrs un neprasa iestatīšanas parametrus, piemēram, KNN. Ja dati parāda parabolisko tendenci, tad lineārās regresijas modelis nav piemērots.
Šie ir daži uzraudzītu mācību algoritmu piemēri. Parasti rezultāti, kas iegūti no uzraudzītām mācību metodēm, ir precīzāki un uzticamāki, jo ieejas dati ir labi zināmi un marķēti. Tāpēc mašīnai jāanalizē tikai slēptie paraugi.
Neapmierinātās mācībās modelis netiek uzraudzīts. Modelis darbojas patstāvīgi, lai prognozētu rezultātus. Tas izmanto mašīnmācīšanās algoritmus, lai izdarītu secinājumus par neapzīmētiem datiem. Parasti neuzraudzīti mācību algoritmi ir grūtāki nekā uzraudzīti mācību algoritmi, jo informācijas ir maz. Klasterēšana ir nepieminētas mācīšanās veids. To var izmantot, lai grupētu nezināmus datus, izmantojot algoritmus. K vidējais un blīvuma grupēšana ir divi klasterizācijas algoritmi.
k vidējais algoritms, novieto k centraidu pēc nejaušības principa katrai kopai. Tad katru datu punktu piešķir vistuvākajam centraidam. Eiklīda attālumu izmanto, lai aprēķinātu attālumu no datu punkta līdz centraidam. Datu punkti tiek klasificēti grupās. Atkal tiek aprēķinātas k centraīdu pozīcijas. Jauno centraidu pozīciju nosaka ar vidējo punktu starp visiem grupas punktiem. Katru datu punktu atkal piešķir vistuvākajam centraidam. Šis process atkārtojas, līdz centraīdi vairs nemainās. k-mean ir ātrs klasterizācijas algoritms, bet nav noteikts klasterizācijas punktu inicializācija. Ir arī lielas klasteru modeļu variācijas, kuru pamatā ir klasteru punktu inicializēšana.
Vēl viens klasterizācijas algoritms ir Uz blīvumu balstīta klasterizācija. Tas ir arī pazīstams kā telpiskās klasterizācijas lietojumi, kuru pamatā ir blīvums un kuros ir troksnis. Tas darbojas, definējot kopu kā maksimālo blīvumam pievienoto punktu kopu. Tie ir divi parametri, ko izmanto klasterizācijā, kuras pamatā ir blīvums. Tie ir Ɛ (epsilon) un minimālie punkti. Ɛ ir apkārtnes maksimālais rādiuss. Minimālie punkti ir minimālais punktu skaits Ɛ apkārtnē, lai definētu kopu. Šie ir daži klasterizācijas piemēri, kas ietilpst neuzraudzītā mācībā.
Parasti rezultāti, kas iegūti no neuzraudzītiem mācību algoritmiem, nav daudz precīzi un ticami, jo mašīnai pirms slēpto shēmu un funkciju noteikšanas ir jādefinē un jāmarķē ievades dati..
Uzraudzīta vs neuzraudzīta mašīnu apguve | |
Uzraudzīta mācīšanās ir mašīnmācīšanās uzdevums, lai iemācītos funkciju, kas ieeju pievada izvadei, pamatojoties uz ieejas-izvades pāru piemēriem. | Neuzraudzīta mācīšanās ir mašīnmācīšanās uzdevums, lai secinātu funkciju, lai aprakstītu slēptu struktūru no neapzīmētiem datiem. |
Galvenā funkcionalitāte | |
Pārraudzītā apmācībā modelis paredz rezultātu, pamatojoties uz iezīmētiem ievades datiem. | Neuzraudzītas mācīšanās gadījumā modelis paredz rezultātu bez marķētiem datiem, pats identificējot modeļus. |
Rezultātu precizitāte | |
Rezultāti, kas iegūti no uzraudzītām mācību metodēm, ir precīzāki un ticamāki. | Rezultāti, kas iegūti no neuzraudzītām mācību metodēm, nav daudz precīzi un ticami. |
Galvenie algoritmi | |
Pastāv algoritmi regresijai un klasifikācijai vadītajā mācībā. | Ir algoritmi klasterizēšanai nepārraudzītā mācībā. |
Pārraudzīta mācīšanās un neuzraudzīta mācīšanās ir divi mašīnmācīšanās veidi. Uzraudzīta mācīšanās ir mašīnmācīšanās uzdevums, lai iemācītos funkciju, kas ieeju pievada izvadei, pamatojoties uz ieejas-izvades pāru piemēriem. Neuzraudzīta mācīšanās ir mašīnmācīšanās uzdevums, lai secinātu funkciju, lai aprakstītu slēptu struktūru no neapzīmētiem datiem. Atšķirība starp uzraudzītu un neuzraudzītu mašīnmācību ir tāda, ka uzraudzītā mācīšanās izmanto marķētus datus, savukārt neuzraudzīta apmācība izmanto marķētus datus.
1.TheBigDataUniversity. Mašīnmācība - Vadīta VS neuzraudzīta mācīšanās, izziņas klase, 2017. gada 13. marts. Pieejama šeit
2. “Nepietiekama apmācība.” Wikipedia, Wikimedia Foundation, 2018. gada 20. marts. Pieejams šeit
3. “Pārraudzīta mācīšanās”. Wikipedia, Wikimedia Foundation, 2018. gada 15. marts. Pieejams šeit
1.'2729781 ”, izmantojot pixabay, iesniedza GDJ (publiskais domēns)