Atšķirība starp Semi Join un Bloom Join

Daļēji pievienoties vs Bloom Join

Daļējs savienojums un Bloom join ir divas savienošanas metodes, ko izmanto vaicājumu apstrādē sadalītajām datu bāzēm. Apstrādājot vaicājumus sadalītās datu bāzēs, dati ir jāpārraida starp datu bāzēm, kas atrodas dažādās vietnēs. Tā varētu būt dārga operācija atkarībā no pārsūtāmo datu apjoma. Tāpēc, apstrādājot vaicājumus izplatītā datu bāzes vidē, ir svarīgi optimizēt vaicājumus, lai samazinātu starp vietnēm pārsūtīto datu daudzumu. Daļēja pievienošanās un pievienošanās bloom ir divas metodes, kuras var izmantot, lai samazinātu datu pārsūtīšanas apjomu un veiktu efektīvu vaicājumu apstrādi.

Kas ir Semi Join?

Semi join ir metode, ko izmanto efektīvai vaicājumu apstrādei izkliedētās datu bāzes vidēs. Apsveriet situāciju, kad Darbinieku datu bāze (kurā ir informācija, piemēram, darbinieka vārds, nodaļas numurs, kurā viņa strādā, utt.), Kas atrodas 1. vietā, un departamenta datu bāze (kurā atrodas tāda informācija kā nodaļas numurs, nodaļas nosaukums, atrašanās vieta utt.), Kas atrodas vietnē 2. Piemēram, ja mēs vēlamies iegūt darbinieka vārdu un nodaļas nosaukumu, kurā viņa strādā (tikai departamentiem, kas atrodas “Ņujorkā”), izpildot vaicājumu pieprasījumu apstrādātājā, kas atrodas 3. vietnē, ir vairāki veidi, kā datus varētu pārsūtīt starp trim vietnēm, lai sasniegtu šo uzdevumu. Bet, pārsūtot datus, ir svarīgi atzīmēt, ka nav nepieciešams visu datu bāzi pārsūtīt starp vietnēm. Tikai daži no atribūtiem (vai noformējumiem), kas nepieciešami savienošanai, ir jāpārvieto starp vietnēm, lai efektīvi izpildītu vaicājumu. Daļēja pievienošanās ir metode, kuru var izmantot, lai samazinātu starp vietnēm nosūtīto datu daudzumu. Daļēji savienojot, tikai savienojuma kolonna tiek pārvietota no vienas vietas uz otru, un pēc tam šo pārvietoto kolonnu izmanto, lai samazinātu nosūtīto attiecību lielumu starp citām vietnēm. Iepriekšminētajā piemērā jūs vienkārši varat pārsūtīt nodaļas numuru un nodaļas nosaukumus ar atrašanās vietu = “New York” no 2. vietnes uz 1. vietni un veikt savienošanu 1. vietā un pārsūtīt galīgo saistību atpakaļ uz 3. vietni..

Kas ir Bloom Join?

Kā jau minēts iepriekš, pievienošanās bloom ir vēl viena metode, ko izmanto, lai izvairītos no nevajadzīgu datu pārsūtīšanas starp vietnēm, izpildot vaicājumus izplatītās datu bāzes vidēs. Ziedošā savienojumā, nevis pašas pārsūtīšanas kolonnas pārsūtīšanā, starp vietām tiek pārsūtīts kompakts savienojošās kolonnas attēlojums. Bloom join izmanto bloom filtru, kas izmanto mazliet vektoru, lai izpildītu dalības vaicājumus. Pirmkārt, izmantojot savienošanas kolonnu, tiek izveidots ziedēšanas filtrs, un tas tiek pārsūtīts starp vietnēm, un pēc tam tiek veiktas savienošanas darbības.

Kāda ir atšķirība starp Semi Join un Bloom Join?

Kaut arī gan daļēji, gan bloom apvienošanas metodes tiek izmantotas, lai samazinātu starp vietnēm pārsūtītā datu daudzumu, izpildot vaicājumus izkliedētās datu bāzes vidē, bloom join samazina datu pārsūtīto datu daudzumu (kopiju skaits), salīdzinot ar daļēji pievienošanos, izmantojot Ziedu filtru koncepcija, kas izmanto mazliet vektoru, lai noteiktu iestatītās dalības. Tāpēc bloom join izmantošana būs daudz efektīvāka nekā puspievienošanās izmantošana.