Opties en vergelijking voor Linux-bestandscompressie

Linux File Compression Options



Compressie is over het algemeen een nuttige methode die in wezen informatie codeert met minder gegevens dan de originele. In het geval van Linux zijn er verschillende compressie-opties, elk met zijn eigen voordelen.

Een generieke Linux-distributie biedt toegang tot een handvol echt nuttige en eenvoudige compressiemechanismen. Dit artikel zal zich alleen op hen concentreren.







Compressietypen

Compressie is het coderen en weergeven van informatie met minder bits dan het oorspronkelijk was. In het geval van bestandscompressie gebruikt een compressiemethode zijn eigen algoritme en wiskundige berekening om een ​​uitvoer te genereren die over het algemeen kleiner is dan de grootte van het originele bestand. Vanwege de manier waarop verschillende compressie werkt en de willekeurige aard van bestanden, kan het aantal kilometers sterk variëren.



Er zijn 2 soorten compressie.



  • Compressie met verlies : Dit is een riskante vorm van compressie die de gegevensintegriteit niet garandeert. In wezen bestaat er, eenmaal gecomprimeerd, een risico dat het originele bestand niet kan worden gereconstrueerd met behulp van het gecomprimeerde archief.
    Een goed voorbeeld van deze vorm van compressie is het bekende MP3-formaat. Wanneer een MP3 wordt gemaakt van het originele audiobestand, is het aanzienlijk kleiner dan het originele bronmuziekbestand. Dit veroorzaakt verlies van enige geluidskwaliteit.
  • Compressie zonder verlies : Dit is het meest gebruikte type compressie. Met behulp van een verliesvrije compressiemethode kan het originele bestand worden gereconstrueerd uit het gecomprimeerde bestand. De compressiemethoden die ik in dit artikel zal bespreken, zijn allemaal verliesvrije compressiemethoden.

Linux-compressie

De meeste compressiemethoden zijn beschikbaar via de tool teer . Wat betreft de zip-compressie, we gebruiken de zip hulpmiddel. Ervan uitgaande dat uw systeem deze hulpprogramma's al heeft geïnstalleerd, laten we aan de slag gaan.





In eerste instantie hebben we een testbestand nodig. Voer de volgende opdracht uit om er een te maken.

$base64/dev/urandom| hoofd -C 20000000 >bestand.txt



Er wordt een tekstbestand gemaakt met een grootte van 20 MB.

Laten we nu 10 kopieën van het bestand maken. Samen is het 200 MB.

Zip voor compressie

Zip is heel gebruikelijk. Voor het maken van een zip-bestand heeft de zip-tool de volgende opdrachtstructuur nodig.

$zip <uitvoer>.zip<invoer>

Voer deze opdracht uit om alle bestanden onder de testmap in één zipbestand te comprimeren.

$ziptest.zip*

De invoergrootte was 200 MB. Na compressie is het nu 152 MB!

Standaard past de zip-tool de DEFLATE-compressie toe. Het is echter ook in staat om bzip2-compressie te gebruiken. Niet alleen dat, u kunt ook met een wachtwoord beveiligde zip-bestanden maken! Meer informatie over zip .

Tar voor compressie op Linux

Teer is geen compressiemethode. In plaats daarvan wordt het meestal gebruikt voor het maken van archieven. Het kan echter een aantal populaire compressiemethoden in het archief implementeren.

Voor het verwerken van het tar-archief (ook bekend als tarball) is er de tar-tool. Lees meer over teer. Over het algemeen gebruikt de tar-tool de volgende opdrachtstructuur.

$teer <opties> <output_file> <invoer>

Voer de volgende opdracht uit om de testbestanden toe te voegen aan een enkel tar-archief.

$teer -cvftest.tar*

Hier blijft de bestandsgrootte hetzelfde.

Gzip voor compressie op Linux

GNU Zip of gzip is een andere populaire compressiemethode die naar mijn mening beter is dan de traditionele zip vanwege de betere compressie. Het is een open-sourceproduct gemaakt door Mark Adler en Jean-Loup Gailly dat oorspronkelijk bedoeld was om de UNIX te vervangen samenpersen nut.

Voor het beheren van gzip-archieven zijn er 2 tools beschikbaar: tar en gzip. Laten we ze allebei eens bekijken.

Ten eerste de gzip-tool. Hier ziet u hoe de gzip-opdrachtstructuur eruitziet.

$gzip <optie> <invoer>

De volgende opdracht vervangt bijvoorbeeld het gecomprimeerde bestand test1.txt door test1.txt.gz.

$gzip -vtest1.txt

Als je een hele map wilt comprimeren met gzip, voer je deze opdracht uit. Hier is de vlag -r voor recursieve compressie. Gzip doorloopt alle mappen en comprimeert de individuele bestanden in elk van hen.

$gzip -R <map_pad>

Gzip ondersteunt verschillende compressiesterktewaarden, beginnend van 1 (minste compressie, snelste) tot 9 (beste compressie, langzaamste).

$gzip -v -9 <het dossier>

Voor een betere controle over de output en gebruiksgemak is teer beter voor de taak. Voer de volgende opdracht uit.

$teer -cvzftest.tar.gz*

Het resultaat is vergelijkbaar met zip met DEFLATE, wat resulteert in 152 MB na compressie.

Bzip2 voor compressie op Linux

Bzip2 is een gratis en open-source tool die het Burrows-Wheeler-algoritme gebruikt voor compressie. Bzip2 werd voor het eerst geïntroduceerd in 1996 en wordt veel gebruikt als alternatief voor de gzip-compressie.

Net als gzip zijn er 2 tools om met bzip2 te werken: tar en bzip2.

De bzip2-tool werkt vergelijkbaar met de gzip-tool. Het kan maar met één bestand tegelijk werken. Hier is de commandostructuur.

$bzip2 <optie> <invoer>

Laten we het bestand test1.txt comprimeren. Hier is de vlag -v voor de uitgebreide modus.

$bzip2 -vtest1.txt

Net als gzip ondersteunt bzip2 ook verschillende compressieniveaus, beginnend van 1 (standaard, minder geheugengebruik) tot 9 (extreme compressie, hoog geheugengebruik).

$bzip2 -v -9 <het dossier>

De betere manier om bzip2-compressie te gebruiken is door tar te gebruiken. Gebruik de volgende opdracht.

$teer -cvjftest.tar.bz2*

De compressie is iets verbeterd dan de vorige. Nu is de bestandsgrootte geslonken tot 151,7 MB.

XZ voor compressie op Linux

Het is een relatieve nieuwkomer op het gebied van compressie. Het werd voor het eerst uitgebracht in 2009 en heeft sindsdien een gestage groei van het gebruik gezien.

De xz-compressietool gebruikt het LZMA2-algoritme dat bekend staat om zijn grotere compressieverhouding in vergelijking met gzip en bzip2, waardoor het een uitstekende keuze is als u de maximale hoeveelheid schijfruimte wilt besparen. Dit gaat echter gepaard met de kosten van hogere geheugenvereisten en tijdverbruik.

Bestand gemaakt door de XZ-compressietool heeft de extensie .xz. Voor het comprimeren van een enkel bestand kunt u rechtstreeks de XZ-tool aanroepen.

$xz<optie> <het dossier>

Voer bijvoorbeeld de volgende opdracht uit om het bestand test1.txt te comprimeren.

$xz-vtest1.txt

Net als andere genoemde compressiemethoden, ondersteunt xz ook verschillende compressiesterktes, beginnend van 1 (laagste compressie, snelste) tot 9 (beste compressie, langzaamste). Als je geen oog hebt voor tijd en gewoon ruimte wilt besparen, ga dan voor het uiterste.

$xz-v -9 <het dossier>

Voer deze opdracht uit om een ​​gecomprimeerd XZ-bestand te maken van alle testbestanden.

$teer -cvJftest.tar.xz*

Hier is de grootte van het uitvoerbestand 153,7 MB.

Gecomprimeerde archieven uitpakken

Het uitpakken van de archieven die we hebben gemaakt, is eenvoudiger dan ze te maken. Gebruik de volgende opdrachtstructuur om een ​​zipbestand uit te pakken.

$uitpakken <bestandsnaam>.zip-NS <bestemming>

Voer deze opdracht uit om het zip-archief uit te pakken dat we hebben gemaakt. Hiermee wordt alle inhoud in dezelfde map geëxtraheerd.

$uitpakkentest.zip

Voor het uitpakken van tar-, tar.gz-, tar.bz2- en tar.xz-archieven moeten we de teer hulpmiddel. Het volgende tar-commando is van toepassing om ze allemaal uit te pakken.

$teer -xvf <archief_bestandsnaam>

Laten we bijvoorbeeld alle bestanden uit het bz2 gecomprimeerde archief extraheren.

$teer -xvftest.tar.bz2

Voer deze opdracht uit om een ​​gzip-bestand (niet tar.gz) te decomprimeren.

$gzip -NS <gzip_file>

Op dezelfde manier zal de volgende opdracht het bzip2-archief decomprimeren.

$bzip2 -NS <bzip2_file>

Dezelfde commandostructuur is van toepassing op xz archive.

$xz-NS <xz_file>

Laatste gedachten

Hopelijk heb je nu genoeg kennis om de compressietaken in verschillende omstandigheden uit te voeren. Afhankelijk van de specifieke behoefte bieden alle compressiemethoden zeer aantrekkelijke eigenschappen.

Een belangrijk ding om op te merken is dat het compressieresultaat niet altijd hetzelfde zal zijn. Met verschillende gegevensinvoer zal de uitvoer anders zijn. In sommige gevallen kan xz bijvoorbeeld waanzinnige compressieresultaten bieden, terwijl dit in dit voorbeeld niet het geval was. Hetzelfde geldt voor andere methoden.

Voor meer diepgaande informatie over deze tools, bekijk hun respectievelijke man-pagina.

$Mens zip