Vārds dati attiecas uz informāciju, kas tiek savākta un ierakstīta. Tas var būt skaitļu, vārdu, mērījumu un daudz ko citu formā.
Ir divu veidu dati, un tie ir kvalitatīvi un kvantitatīvi dati. Atšķirība starp diviem datu veidiem ir tā, ka skaitliskās informācijas aprakstīšanai tiek izmantoti kvantitatīvie dati. Piemēram, uz šāda veida datiem attiecas temperatūras mērīšana.
No otras puses, kvalitatīvie dati tiek izmantoti, lai aprakstītu informāciju vārdos. Pēc datu apkopošanas tas ir jāorganizē, līdz ar to jāsadala grupēti dati no nesagrupētiem datiem. Abi ir noderīgi datu veidi, taču atšķirība starp tiem ir tā, ka nesagrupēti dati ir neapstrādāti dati. Tas nozīmē, ka tas tikko ir savākts, bet nav sakārtots nevienā grupā vai klasē. No otras puses, sagrupēti dati ir dati, kas no izejas datiem ir sakārtoti grupās.
Kā minēts iepriekš, grupēti dati ir datu veids, kas pēc savākšanas tiek klasificēts grupās. Neapstrādātie dati tiek iedalīti dažādās grupās un tiek izveidota tabula. Galvenais tabulas mērķis ir parādīt datu punktus, kas rodas katrā grupā. Piemēram, kad tiek veikts tests, rezultāti ir dati šajā scenārijā, un ir daudz veidu, kā šos datus grupēt. Piemēram, var reģistrēt studentu skaitu, kuri ieguvuši atzīmi virs katras 20 atzīmes.
Alternatīvi var izmantot atzīmes. Piemēram, 90-100 līdz F 0-59 ar katru kategoriju parāda, cik studentu ir katrā kategorijā. Grupētu datu parādīšanai un interpretēšanai vislabāk izmantot histogrammas un frekvences tabulu. Šeit ir piemērs
Datu grupēšanai ir šādas priekšrocības:
Nesagrupēti dati, ko sauc arī par izejas datiem, ir dati, kas pēc savākšanas nav ievietoti nevienā grupā vai kategorijā. Dati ir sagrupēti skaitļos vai raksturlielumos, tāpēc dati, kas nav ievietoti nevienā no kategorijām, ir sagrupēti. Piemēram, veicot skaitīšanu un vēlaties analizēt, cik daudz sieviešu vecumā virs 45 gadiem atrodas noteiktā apgabalā, vispirms jāzina, cik cilvēku dzīvo šajā apgabalā.
Šajā apgabalā dzīvojošo personu skaits nav sagrupēts dati vai neapstrādāta informācija, jo nekas nav klasificēts. Tāpēc mēs varam secināt, ka nesagrupēti dati ir dati, ko izmanto, lai parādītu informāciju par atsevišķu izlases locekli vai populāciju.
Dažas no nesagrupētu datu priekšrocībām ir šādas;
Grupēti dati ir dati, kas ir sakārtoti klasēs pēc to analīzes. Kā piemērus var minēt to, cik lieli kukurūzas maisi lietus sezonā bija slikti. No otras puses, nesagrupēti dati ir dati, kas neietilpst nevienā grupā. Tas joprojām ir neapstrādāti dati.
Apkopojot datus, priekšroka tiek dota nesagrupētiem datiem, jo informācija joprojām ir sākotnējā formā. To nav sagrozījusi ne klasifikācija, ne dalīšana. Tomēr, analizējot to un zīmējot grafikus, priekšroka dodama grupētiem datiem, jo tos ir viegli interpretēt.
Aprēķinot grupētu un nesagrupētu datu vidus, būs atšķirības. Priekšroka dodama grupētu datu vidējam stāvoklim, jo tas ir precīzāks, salīdzinot ar nesagrupētu datu vidējo. Nesagrupētu datu vidējā vērtība var izraisīt nepareizas manipulācijas ar mediānu, tāpēc vairumā gadījumu to uzskata par neefektīvu.
Frekvences tabulas tiek izmantotas, lai parādītu sagrupētu datu informāciju, turpretī nesagrupētu datu gadījumā informācija parādās kā liels skaitļu saraksts. Tas ir saistīts ar faktu, ka informācija joprojām ir neapstrādāta.
Grupēti dati ir dati, kas ir sakārtoti frekvenču sadalījumā, turpretī nesagrupētie dati nekādā veidā nav apkopoti.