全部代码github链接
哈夫曼编码原理我这里就不讲了,这里主要谈谈项目思路或者我碰到的问题:
文件有个一个叫文件头的东西,这个东西在压缩图片呀什么的不能漏了, 文本文件没有文件头,可以不管,不同的文件格式有不同的文件头.
文件头百度百科
所以在压缩图片时要先读取文件头
那么问题来了
给了一个文件,要把它压要另一个压缩文件,压缩文件里面存什么??
我把我的压缩文件分成这几个部分
第1个部分 存文件头(如果不是文本文件)
第2个部分 存哈夫曼树里叶子节点的个数(也就是n) 为了解压时读取
第3部分 存n结构体 结构体里是 字符(0~255)和字符出现的频度
第4部分存的是tail 就是按位压缩时,8的余数
第5个部分 存01串(被按位压缩过的01串) 重建哈夫曼树后还原要用
思路就是这个样子,具体代码见github,其实我做的不太好,只需看看我的思路就好了,但我的思路也不是很好,有的人好像可以无视文件头,即对任何文件压缩(应该是思路不一样)。OTC