Starpība starp GZIP un BZIP2

GZIP vs BZIP2

GNU zip (pazīstams arī kā GZIP) ir programmatūras lietojumprogramma ar mērķi saspiest failus. Sākotnēji bija paredzēts aizstāt saspiešanas programmu, kas tika izmantota agrīnajās Unix sistēmās - izmantošanai GNU projektā (bezmaksas programmatūras projekts)..

BZIP2 ir atvērtā koda beztaras datu saspiešanas algoritms - pamatā datu saspiešanas algoritmu klase, kas ļauj saspiestā faila sākotnējos datus pilnībā rekonstruēt no saspiestajiem datiem.

GZIP pamatā ir algoritms, kas pazīstams kā DEFLATE. Tas ir arī bezzaudējumu datu saspiešanas algoritms. Tas izmanto gan LZ77 algoritmu, gan Huffman kodējumu. Būtībā GZIP attiecas uz tāda paša nosaukuma faila formātu. Šis formāts ir 10 baitu galvene, kurā ir maģiskais skaitlis (kas nozīmē skaitlisku vai teksta vērtību, kas nekad nemainās un tiek izmantota, lai apzīmētu faila formātu vai protokolu, nenosaukta skaitliskā vērtība, kas nekad nemainās, vai atšķirīgas vērtības, kuras nevar sajaukt visam citam), papildu galvenes, kuras faktiski var būt vajadzīgas (piemēram, oriģinālais faila nosaukums), korpuss, kas satur saspiestu derīgo slodzi ar DEFLATE (kas ir galvenes pārvadātie dati) un 8 baitu kājene kurā ir CRC-32 kontrolsumma, kā arī sākotnējo nesaspiesto datu faktiskais garums.

BZIP2 formātā tiek izmantotas dažādas saspiešanas metodes, kuras viena otrai ir sakārtotas vairākās kārtās. Tie rodas ļoti atšķirīgā secībā: palaišanas garuma kodēšana (kas ir jebkura četru līdz 255 simbolu kopiju secība, ko aizvieto ar pirmajiem četriem simboliem, un kodēšanas garums, kas atkārtojas no 0 līdz 251), Burrows-Wheeler transformācija ( kas ir atgriezeniska bloku kārta, kas veido BZIP2 kodolu), virzīties uz priekšu (atstāj apstrādātā bloka lielumu nemainītu), izpildes garuma kodējums (kas sastāv no gariem simbolu virknēm - parasti nullēm), kas pastāvīgi atkārto izvadē un tiek aizstāti gan ar simbolu, gan ar divu kodu secību), Huffman kodēšana (tas ir process, kura laikā 8 bitu baitu fiksēta garuma simboli tiek aizstāti ar mainīgiem garuma kodiem), Multiple Hoffman kodēšana (kas sastāv no vairākas vienāda lieluma Hoffmana tabulas), Unary bāzes 1 kodējumu, Delta kodējumu un Sparse bit masīvu.

Kopsavilkums:

1. GZIP ir bezmaksas lietojumprogramma, ko izmanto failu saspiešanai; BZIP2 ir atvērtā koda bezsaistes datu saspiešanas algoritms, kas ļauj izgūt saspiestā faila sākotnējos datus.

2. GZIP sastāv no 10 baitu galvenes, izvēles galvenēm, pamatteksta un 8 baitu kājenes; BZIP2 sastāv no ne mazāk kā deviņiem saspiešanas tehnikas slāņiem.