为什么有的文件压缩了还是很大?

如题所述

这个跟压缩算法有关,一般字符文件的压缩比较高,可以达到50%左右,视频、音频、图像文件,压缩比一般80%左右。

如果是影音文件1.5g,压缩后小不了多少,可能是1.3~1.4G。

有的图像文件如JPG格式的,本来就是带压缩的,再用rar等工具压缩的效果不明显,如果是BMP文件,压缩效果更好。

每个文件都由各种不同代码组成,比如01代码。

这类文件只有数字0与1组合。压缩原理就是【通过寻找其中的规律,简化数字的排列】。

比如:00000110001111111111可以简化成5个0,2个1,3个0,10个1的排列;100000000000可以简化成数学的:10^10。

根据香农的信息理论,任何一个文件被无损压缩后的结果不可能小于其熵(信息论)。

换句话说,如果一个文件有20多个G的大小,但是其信息熵只有20多M,则实现一个1000倍的压缩是完全可能的(比如楼主放出的几小时全黑视频);反过来看,一个文件如果虽然只有100M,但是其信息熵却高达90M,则这样的文件是无论如何也不可能被无损压缩至20M大小的。

多说一句,一个文件的信息熵有多少,靠一个公式是完全可以算出来的。所以只要提供任何一个文件,我们都能知道它最小可以被压缩到多少。

以上说法仅限于无损压缩,对于有损压缩来说,压缩了多少倍皆有可能。

扩展资料:

经过压缩软件压缩的文件是压缩文件,压缩的原理是把文件的二进制代码压缩,把相邻的0,1代码减少,比如有000000,可以把它变成6个0的写法60,来减少该文件的空间。

压缩文件的基本原理是查找文件内的重复字节,并建立一个相同字节的"词典"文件,并用一个代码表示,比如在文件里有几处有一个相同的词"中华人民共和国"用一个代码表示并写入"词典"文件,这样就可以达到缩小文件的目的。

其实,所有的计算机文件归根结底都是以“1”和“0”的形式存储的,和蓝色像点一样,只要通过合理的数学计算公式,文件的体积都能够被大大压缩以达到“数据无损稠密”的效果。总的来说,压缩可以分为有损和无损压缩两种。

参考资料:百度百科-压缩文件

温馨提示:答案为网友推荐,仅供参考