galvenā atšķirība starp RDBMS un Hadoop ir tas, ka RDBMS glabā strukturētus datus, savukārt Hadoop glabā strukturētus, daļēji strukturētus un nestrukturētus datus.
RDBMS ir datu bāzes pārvaldības sistēma, kuras pamatā ir relāciju modelis. Hadoop ir programmatūra datu glabāšanai un lietojumprogrammu darbināšanai preču aparatūras klasteros.
1. Pārskats un galvenās atšķirības
2. Kas ir RDBMS?
3. Kas ir Hadoop
4. Salīdzinājums blakus - RDBMS vs Hadoop tabulas formā
5. Kopsavilkums
RDBMS apzīmē Relāciju datu bāzes pārvaldības sistēmu, kuras pamatā ir relāciju modelis. RDBMS tabulas tiek izmantotas datu glabāšanai, un atslēgas un indeksi palīdz tabulas savienot. Tabula ir datu elementu kolekcija, un tās ir entītijas. Tajā ir rindas un kolonnas. Rindas attēlo vienu ierakstu tabulā. Slejas attēlo atribūtus.
Piemēram, pārdošanas datu bāzē var būt klientu un produktu vienības. Klientam var būt atribūti, piemēram, klienta_id, vārds, adrese, tālruņa_nr. Vienumam var būt atribūti, piemēram, produkta_vid, nosaukums utt. Klientu tabulas galvenā atslēga ir klienta_id, savukārt produkta tabulas primārā atslēga ir produkta_id. Ievietojot produkta_id klientu tabulā kā svešu atslēgu, šīs divas entītijas tiek savienotas. Tāpat arī tabulas ir savstarpēji saistītas. Tie nodrošina datu integritāti, normalizēšanu un daudz ko citu. Tikai daži no RDBMS ir MySQL, MSSQL un Oracle. Vaicāšanai viņi izmanto SQL.
Hadoop ir Java rakstīts Apache atvērtā koda ietvars. Tas palīdz uzglabāt un apstrādāt lielu datu daudzumu datoru kopās, izmantojot vienkāršus programmēšanas modeļus. Hadoop galvenais mērķis ir lielo datu glabāšana un apstrāde, kas attiecas uz lielu daudzumu sarežģītu datu. Hadoop caurlaidspēja, kas ir spēja apstrādāt datu apjomu noteiktā laika posmā, ir augsta.
Hadoop arhitektūrā ir četri moduļi. Tie ir Hadoop, YARN, Hadoop izplatītā failu sistēma (HDFS) un Hadoop MapReduce. Kopējā modulī ir Java bibliotēkas un utilītas. Tam ir arī faili Hadoop palaišanai. Hadoop YARN veic darbu plānošanu un klasteru resursu pārvaldību.
Turklāt Hadoop izplatītā failu sistēma (HDFS) ir Hadoop glabāšanas sistēma. Tas izmanto galvenā-verga arhitektūru. Galvenais mezgls ir NameNode, un tas pārvalda failu sistēmas meta datus. Citi datori ir vergu mezgli vai DataNodes. Viņi saglabā faktiskos datus. No otras puses, Hadoop MapReduce veic izplatīto aprēķinu. Tam ir datu apstrādes algoritmi. HDFS galvenajā mezglā ir darba izsekotājs. Tas palaiž karti, samazinot darbus vergu mezglos. Katram vergu mezglam ir uzdevumu izsekotājs, lai pabeigtu datu apstrādi un rezultātu nosūtītu atpakaļ galvenajam mezglam. Kopumā Hadoop nodrošina masveida datu glabāšanu ar lielu apstrādes jaudu.
RDBMS vs Hadoop | |
RDBMS ir sistēmas programmatūra datu bāzu izveidošanai un pārvaldīšanai, kuru pamatā ir relāciju modelis. | Hadoop ir atvērtā pirmkoda programmatūras kolekcija, kas savieno daudzus datorus, lai atrisinātu problēmas, kas saistītas ar lielu datu daudzumu un aprēķinu. |
Datu daudzveidība | |
RDBMS glabā strukturētus datus. | Hadoop saglabā strukturētus, daļēji strukturētus un nestrukturētus datus. |
Datu glabāšana | |
RDBMS saglabā vidējo datu daudzumu. | Hadoop glabā lielu datu daudzumu nekā RDBMS. |
Ātrums | |
RDBMS lasījumi notiek ātri. | Hadoop lasīšana un rakstīšana notiek ātri. |
Mērogojamība | |
RDBMS ir vertikāla mērogojamība. | Hadoop ir horizontāla mērogojamība. |
Aparatūra | |
RDBMS izmanto augstākās klases serverus. | Hadoop izmanto preču aparatūru. |
Caurlaidspēja | |
RDBMS caurlaidspēja ir augstāka. | Hadoop caurlaidspēja ir zemāka. |
Šajā rakstā tika apskatīta atšķirība starp RDBMS un Hadoop. Galvenā atšķirība starp RDBMS un Hadoop ir tā, ka RDBMS glabā strukturētus datus, savukārt Hadoop glabā strukturētus, daļēji strukturētus un nestrukturētus datus.
1.Pamācību punkts. “SQL RDBMS koncepcijas.” , Konsultāciju punkts, 2018. gada 8. janvāris. Pieejams šeit
2.Pamācības punkts. “Hadoop apmācība.” , Konsultāciju punkts, 2018. gada 8. janvāris. Pieejams šeit
1.'8552968000'by Intel Free Press (CC BY-SA 2.0), izmantojot Flickr