Huffman文件压缩之文件夹压缩

2023-07-05 09:42:22

思路

应用huffman是带权路径最小二叉树这个性质，完成的文件压缩。我们可以应用这个性质。让一个文件中，每个字符出现的次数作为权值。这样离根节点越近的节点，它的字符出现的次数就越多。然后根据这个节点在父节点左，有效编码为0，在右，有效编码为1，从跟遍历到该节点，得到相应的huffman编码，然后用huffman编码去替代该文件中该字符得而实现压缩。

其实上面说的是字符，我们不应该单单把它看成一个字符。而是应该把它当成在单个字节中的一个数字。我们实际不是统计每个字符出现的次数，而是统计的是在待压缩文件中，每个字节相应的数字在该文件中出现了多少次。一个字节，总共有256种数字。所以我们要统计一个文件中这256种数字到底出现了多少次，然后拿它们的次数去创建huffman树，得到编码后完成压缩。

我的文件夹压缩就是基于上面huffman压缩的实现原理。我压缩文件夹时候，先调用了opendir函数，然后再调用了readdir函数，根据深度优先遍历了该文件夹（目录）下的所有文件，然后把所有文件的路径保存到了一个vector中。最后一个一个压缩vector中的文件，从而实现的压缩文件夹。

遍历目录时思路图

Huffman文件压缩之文件夹压缩

压缩思路

通过对文件每一个字节进行次数统计，并建立huffman tree

Huffman文件压缩之文件夹压缩

通过huffman Tree 的编码对文件内容进行压测。为什么可以这样呢? 因为我们观察 Huffman Tree 只有叶子节点才带有真正内容，也就是说Huffman Code 不存在 A 是B的前缀的情况，这也就造成了我们可以通过Huffman Code 进行编码，然后解压的时候，读取每相关编码内容进行解码，因为不存在前缀的情况，我们可以读取一堆 010101的编码，对其一一解码。

现象

Huffman文件压缩之文件夹压缩

代码

https://github.com/sdoyuxuan/Dircompress

Huffman文件压缩之文件夹压缩

思路

遍历目录时思路图

压缩思路

现象

代码

继续阅读

Java压缩文件和文件夹为zip格式

用JS模拟购物车（jQuery实现）

python 统计哈姆雷特词汇频率

爬取bian图网的图片

Linux下的通讯录项目

Kaggle实战——Gender Recognition by Voice声音的性别区分（结构化数据）（一）

python网络爬虫，爬取图片信息

从零实现加密隧道（三）：epoll 用法

Java初学者也可以实现的图书系统小练习🌕一、需求分析🌕二、具体实现过程🌕 三、效果展示🌕四、小戴想说的话

C语言小项目：万年历的编写

【小项目】Vue 整合 AxiosVue 整合 Axios一、需求说明二、数据库三、前端四、后端五、测试

Java使用Servlet连接mysql实现登录注册功能前言一、项目目录二、配置三、数据库的创建四、后端代码四、前端代码五、界面展示

使用6818开发板进行触屏控制图片功能：加载图片目录、自动播放、删除、上一张、下一张、退出

初级练手的小项目列表

C语言模拟实现(动态版通讯录)

PHP购物网站（含购物车、全部源码、数据库设计表及其源码）声明！请勿转载！