Atšķirība starp datu ieguvi un OLAP

Datu ieguve vs OLAP

Gan datu ieguve, gan OLAP ir divas no ierastajām biznesa informācijas (BI) tehnoloģijām. Biznesa intelekts attiecas uz datorizētām metodēm noderīgas informācijas identificēšanai un ieguvei no biznesa datiem. Datu ieguve ir datorzinātnes joma, kas nodarbojas ar interesantu modeļu iegūšanu no lieliem datu kopumiem. Tas apvieno daudzas metodes no mākslīgā intelekta, statistikas un datu bāzes pārvaldības. OLAP (tiešsaistes analītiskā apstrāde), kā norāda nosaukums, ir apkopojums par veidiem, kā veikt vaicājumus daudzdimensiju datu bāzēs.

Datu ieguve ir pazīstama arī kā zināšanu atklāšana datos (KDD). Kā minēts iepriekš, tā ir datorzinātnes joma, kas nodarbojas ar iepriekš nezināmas un interesantas informācijas iegūšanu no neapstrādātiem datiem. Sakarā ar eksponenciālo datu pieaugumu, it īpaši tādās jomās kā bizness, datu ieguve ir kļuvusi par ļoti svarīgu rīku, lai pārveidotu šo lielo datu bagātību biznesa izlūkošanā, jo dažās pēdējās desmitgadēs šķietami manuāla datu iegūšana ir kļuvusi neiespējama. Piemēram, pašlaik to izmanto dažādām lietojumprogrammām, piemēram, sociālā tīkla analīzei, krāpšanas atklāšanai un mārketingam. Datu ieguve parasti nodarbojas ar četriem šādiem uzdevumiem: klasterizēšanu, klasifikāciju, regresiju un asociāciju. Klasterēšana identificē līdzīgas grupas no nestrukturētiem datiem. Klasifikācija ir mācīšanās noteikumi, kurus var izmantot jauniem datiem, un parasti tie ietver šādus soļus: datu priekšapstrāde, modelēšanas izstrāde, mācīšanās / funkciju atlase un novērtēšana / apstiprināšana. Regresija ir funkciju atrašana ar minimālām kļūdām datu modelēšanā. Un asociācija meklē sakarības starp mainīgajiem. Datu ieguve parasti tiek izmantota, lai atbildētu uz jautājumiem, piemēram, kas ir galvenie produkti, kas nākamajā gadā varētu palīdzēt gūt lielu peļņu Wal-Mart.

OLAP ir sistēmu klase, kas nodrošina atbildes uz daudzdimensionāliem jautājumiem. Parasti OLAP izmanto mārketinga, budžeta sastādīšanas, prognozēšanas un līdzīgām lietojumprogrammām. Pats par sevi saprotams, ka OLAP izmantotās datu bāzes ir konfigurētas sarežģītiem un ad-hoc jautājumiem, ņemot vērā ātru veiktspēju. Parasti matricu izmanto, lai parādītu OLAP izvadi. Rindas un kolonnas veido vaicājuma izmēri. Viņi bieži izmanto apkopošanas metodes vairākās tabulās, lai iegūtu kopsavilkumus. Piemēram, to var izmantot, lai uzzinātu par Wal-Mart šī gada pārdošanas apjomiem, salīdzinot ar pagājušo gadu? Kādas ir pārdošanas prognozes nākamajā ceturksnī? Ko var teikt par tendenci, apskatot procentuālās izmaiņas?

Lai gan ir acīmredzams, ka Datu ieguve un OLAP ir līdzīgas, jo tās darbojas ar datiem, lai iegūtu izlūkdatus, galvenā atšķirība rodas no tā, kā tie darbojas ar datiem. OLAP rīki nodrošina daudzdimensionālu datu analīzi, un tie sniedz datu kopsavilkumus, bet pretstatā tam, datu ieguve koncentrējas uz koeficientiem, modeļiem un ietekmēm datu kopā. Tas ir OLAP darījums ar apkopošanu, kura pamatā ir datu darbība ar “pievienošanas” palīdzību, bet datu ieguve atbilst “dalīšanai”. Cita ievērojama atšķirība ir tā, ka, lai arī datu ieguves rīki modelē datus un atgrieza izpildāmus noteikumus, OLAP reālā laikā veiks salīdzināšanas un kontrasta tehnikas visā biznesa dimensijā..