linux文件压缩与解压
本文最后更新于 2024-08-31,文章内容可能已经过时。
压缩工具的介绍
说到文件管理,就不得不说到tar,因为tar可以压缩和解压缩linux文件,所以要先了解一下压缩和解压缩。
由于以前的计算机磁盘容量比较小,业内人士绞尽脑汁,终于开发出了一个能帮助用户节省磁盘的工具,就是压缩工具,我们知道计算机在存储数据的时候都是使用bytes来计算的,但是实际上1byte=8bits,在日常使用中并不是所有的数据都能把这个1byte用完,有的可能用了三个bits,有的可能用了四个bits,而他们的实际占用空间是2bytes=16bits,剩余的空间就浪费了,压缩工具就是通过算法,将占用三个bits的数据和占用四个bits的数据放在一个byte里,这样我们就能节省出来1byte,这种空间的节省,当你在压缩一个包含了很多文本文件的目录时是非常明显的。其实就像没有人知道早高峰的公交车里有多少人一样,一个人理论上占用的公交车内的空间,跟实际占用的空间,往往有很大差别,因为挤挤总能上去的。
压缩工具诞生的初衷和原理我们说完了,那现在它就没用了么?依然有用,只不过现在我们使用压缩工具的目的,更多的是便于存储和传输,在linux系统中压缩工具有很多,不同的工具压缩后的后缀名和大小都有差异,从远古时代说起,linux都出现了以下这些格式的压缩文件
*.Z 使用compress压缩的文件
*.zip 使用zip压缩的文件
*.gz 使用gzip压缩
*.bz2 使用bzip2压缩
*.xz 使用xz压缩
*.tar 使用tar工具打包,没有压缩
*.tar.gz 使用tar工具打包,经过gzip压缩
*.tar.bz2 使用tar工具打包,经过bzip2压缩
*.tar.xz 使用tar工具打包,经过xz压缩
其中,compress已经过时了,因为太老,个别版本的linux已经不支持了,linux下的压缩工具还是以gzip和bzip2以及后加入的xz作为主力,但是由于这些工具,最早不能压缩目录,只能针对单一文件进行压缩,所以在日常使用中,他们都是配合着tar这个打包工具,由tar把目录中的很多文件打包成一个文件,再经由对应的工具进行压缩,所以我们会看上面的那些tar.*的压缩包。好了我们先来学习下这些压缩工具如何使用
压缩文件的好处有如下几点:
- 文件更小,便于网络传输,效率高;
- 避免杂乱,可以减少文件个数,多个文件一起压缩;
- 有些文件不能直接传输,比如安装程序,压缩后就可以传输了
压缩工具的使用
- gzip
[root@zutuanxue ~]# gzip -h
Usage: gzip [OPTION]... [FILE]...
-c 保留源文件
-d 解压缩
-h 显示帮助
-t 检查压缩文件的数据一致性,用来确定压缩文件是否有错误
-v 显示压缩包的相关信息,包括压缩比等
-V 显示版本号
-1 压缩最快,压缩比低
-9 压缩最慢,压缩比高
例子:
[root@zutuanxue test]# pwd
/root/test
[root@zutuanxue test]# cp /etc/services ./
[root@zutuanxue test]# gzip -v services
services: 79.4% -- replaced with services.gz
[root@zutuanxue test]# ll /etc/services services.gz
-rw-r--r--. 1 root root 692241 Sep 10 2018 /etc/services
-rw-r--r-- 1 root root 142549 Oct 20 23:32 services.gz
[root@zutuanxue test]# zcat services.gz
由于service文件本来就是一个文本文档,所以还可以使用zmore,zless去查看内容
[root@zutuanxue test]# ls
services.gz
[root@zutuanxue test]# gzip -d services.gz
[root@zutuanxue test]# ls
services
我们可以看到,gzip这个工具压缩文件和源文件默认只保留一个,所以还可以
[root@zutuanxue test]# gzip -1 -c services > test.gz
[root@zutuanxue test]# ls
services test.gz
[root@zutuanxue test]# zgrep -n ssh test.gz
44:ssh 22/tcp # The Secure Shell (SSH) Protocol
45:ssh 22/udp # The Secure Shell (SSH) Protocol
你也可以使用zgrep找出指定的关键字在压缩文件的那几行
- bzip2
[root@zutuanxue test]# bzip2 -h
-h 帮助
-d 解压
-z 压缩 默认值
-k 保留源文件
-v 查看版本信息
-1 ..-9 同gzip相同
bzip2的使用与gzip相同,两种工具的区别就是压缩算法不同,bzip2的压缩比更好一些,bzip的包查看的时候使用的是bzcat,bzmore,bzless,bzgrep同gzip用法相同
[root@zutuanxue test]# gzip -c services > services.gz
[root@zutuanxue test]# bzip2 -k services
[root@zutuanxue test]# ll
总用量 948
-rw-r--r-- 1 root root 692241 10月 21 01:31 services
-rw-r--r-- 1 root root 129788 10月 21 01:31 services.bz2
-rw-r--r-- 1 root root 142549 10月 21 01:32 services.gz
- xz
虽然bzip2的压缩效果相对比gzip已经提升很多,但是技术是永无止境的,于是出现了xz,它的用法跟gzip和bzip2一样
[root@zutuanxue test]# xz -h
-d 解压缩
-t 检查压缩文件的完整性
-l 查看压缩文件的相关信息
-k 保留源文件
-c 将信息输出到显示器上
-0 ... -9 指定压缩级别
-h 显示帮助
[root@zutuanxue test]# xz -k services
[root@zutuanxue test]# ll
总用量 1052
-rw-r--r-- 1 root root 692241 10月 21 01:31 services
-rw-r--r-- 1 root root 129788 10月 21 01:31 services.bz2
-rw-r--r-- 1 root root 142549 10月 21 01:32 services.gz
-rw-r--r-- 1 root root 105872 10月 21 01:31 services.xz
可以看到,在使用默认压缩比压缩的情况下,xz压缩完的文件体积更小
[root@zutuanxue test]# xz -l services.xz 查看相关信息
Strms Blocks Compressed Uncompressed Ratio Check Filename
1 1 103.4 KiB 676.0 KiB 0.153 CRC64 services.xz
[root@zutuanxue test]# xzcat services.xz 查看文件内容
[root@zutuanxue test]# xz -d services.xz 解压缩
虽然xz的压缩算法更好,但是相对来说时间也比较长
[root@zutuanxue test]# time gzip -c services > services.gz
real 0m0.023s
user 0m0.020s
sys 0m0.003s
[root@zutuanxue test]# time bzip2 -k services
real 0m0.047s
user 0m0.043s
sys 0m0.003s
[root@zutuanxue test]# time xz -k services
real 0m0.264s
user 0m0.258s
sys 0m0.003s
我们可以使用time这个命令去对比一下时间gzip,bzip2,xz的时间分别是0.023,0.047,0.264,可以看到xz所使用的时间是比较长的,而这个时间会跟文件体积成正比,所以这三种压缩方式大家在使用的时候也要把时间成本考虑在内,除非你很富有。
- tar
前面我们提到了,大多数压缩工具只能针对单一文件进行操作,如果你要压缩目录的话就会很麻烦,这时候我们可以使用tar这个打包工具,将目录内的多个文件打包成一个文件,再进行压缩。
[root@zutuanxue test]# tar --help
用法: tar [选项...] [FILE]...
-C 解压到指定目录
-c 建立tar包
-t 查看tar包内的文件
-x 解压tar包
-p 不修改文件属性
-f 指定文件名称
-j 使用bzip2算法
-J 使用xz算法
-z 使用gzip算法
-P 允许压缩路径中包含有"/"
-v 显示详细信息
-?, --help 查看帮助
--exclude 压缩过程中排除指定的文件
例:
压缩
[root@zutuanxue test]# tar -czf etc.tar.gz etc
[root@zutuanxue test]# ls
etc etc.tar.gz
解压缩
[root@zutuanxue test]# ls
etc.tar.gz
[root@zutuanxue test]# tar -xf etc.tar.gz
[root@zutuanxue test]# ls
etc etc.tar.gz
查看压缩包内容
[root@zutuanxue test]# tar -tf etc.tar.gz
etc/
etc/libreport/
etc/libreport/workflows.d/
etc/libreport/workflows.d/report_uploader.conf
etc/libreport/workflows.d/anaconda_event.conf
.
.
.
查询压缩包里面的文件信息
[root@zutuanxue test]# tar -tvf etc.tar.gz |more
drwxr-xr-x root/root 0 2019-10-21 04:35 etc/
drwxr-xr-x root/root 0 2019-10-21 04:35 etc/libreport/
drwxr-xr-x root/root 0 2019-10-21 04:35 etc/libreport/workflows.d/
.
.
.
解压压缩包指定的文件
[root@zutuanxue test]# tar -tvf etc.tar.gz | grep shadow
---------- root/root 792 2019-10-21 04:35 etc/gshadow
---------- root/root 1506 2019-10-21 04:35 etc/shadow
---------- root/root 781 2019-10-21 04:35 etc/gshadow-
---------- root/root 1374 2019-10-21 04:35 etc/shadow-
-rw-r--r-- root/root 214 2019-10-21 04:35 etc/pam.d/sssd-shadowutils
[root@zutuanxue test]# tar -xf etc.tar.gz etc/shadow
[root@zutuanxue test]# ls
etc etc.tar.gz
[root@zutuanxue test]# ls etc
shadow