欢迎来到天天文库
浏览记录
ID:35217672
大小:547.33 KB
页数:9页
时间:2019-03-22
《哈夫曼算法实现字符串压缩——实验报告单》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、华北科技学院《用哈夫曼编码实现文件压缩》实验报告《用哈夫曼编码实现文件压缩》实验报告课程名称《数据结构B》实验学期2011至2012学年第一学期学生所在系部计算机系年级2009级专业班级计科B09—1学生姓名韩翼学号200907014106任课教师盛建瓴实验成绩华北科技学院《用哈夫曼编码实现文件压缩》实验报告一、实验题目:用哈夫曼编码实现文件压缩二、实验目的:1、了解文件的概念。2、掌握线性链表的插入、删除等算法。3、掌握Huffman树的概念及构造方法。4、掌握二叉树的存储结构及遍历算法。5、利用Huffman树
2、及Huffman编码,掌握实现文件压缩的一般原理。三、实验设备与环境:微型计算机、Windows系列操作系统、VisualC++6.0软件四、实验内容:根据ascii码文件中各ascii字符出现的频率情况创建Haffman树,再将各字符对应的哈夫曼编码写入文件中,实现文件压缩。五、概要设计:本次试验采用将字符用长度尽可能短的二进制数位表示方法,即对于文件中出现的字符,无须全部都用8位的ASCLL码进行存储,根据他们在文件中出现的频率不同,我们利用Haffman算法使每个字符能以最短的二进制字符进行存储,以达到节省存
3、储空间,压缩文件的目的。解决了压缩需采用的算法,程序的思路已然清晰:1、统计需压缩文件中每个字符出现的频率。2、将每个字符的出现频率作为叶子结点构建Haffman树,然后将树中结点引向其左孩子的分支标“0”,引向其右孩子的分支标“1”;每个字符的编码即为从根到每个叶子的路径上得到的0、1序列,这样便完成了Haffman编码,将每个字符用最短的二进制字符表示。3、打开需压缩的文件,再将需压缩文件中的每个ASCII码对应的编码按bit单位输出。4、文件压缩结束。六、详细设计:(1)Huffman树简介路径:从树中一个结
4、点到另一个结点之间的分支构成这两个结点间的路径路径长度:路径上的分支数树的路径长度:从树根到每一个结点的路径长度之和树的带权路径长度:树中所有带权结点的路径长度之和华北科技学院《用哈夫曼编码实现文件压缩》实验报告Huffman树——设有n个权值{w1,w2,……wn},构造一棵有n个叶子结点的二叉树,每个叶子的权值为wi,则wpl最小的二叉树叫Huffman树。(2)构造Huffman树的方法——Huffman算法构造Huffman树步骤(a)根据给定的n个权值{w1,w2,……wn},构造n棵只有根结点的二叉树,
5、令起权值为wj。(b)在森林中选取两棵根结点权值最小的树作左右子树,构造一棵新的二叉树,置新二叉树根结点权值为其左右子树根结点权值之和。(c)在森林中删除这两棵树,同时将新得到的二叉树加入森林中。(d)重复上述两步,直到只含一棵树为止,这棵树即哈夫曼树。对于Haffman的创建算法,有以下几点说明:a)这里的Haffman树采用的是基于数组的带左右儿子结点及父结点下标作为存储结点的二叉树形式,这种空间上的消耗带来了算法实现上的便捷。华北科技学院《用哈夫曼编码实现文件压缩》实验报告b)由于对于最后生成的Haffman
6、树,其所有叶子结点均为从一个内部树扩充出去的,所以,当外部叶子结点数为m个时,内部结点数为m-1,整个Haffman树的需要的结点数为2m-1c)初始化Hafffman树分两步进行,先将所有结点赋值,再将前m个叶子结点赋初值。d)在查找权值最小并且父结点为空的两个结点时,通过逐个比较,将两结点的位置下标与权值分别保存。方便在与其父结点建立联系时调用。(3)Huffman编码:数据通信用的二进制编码思想:根据字符出现频率编码,使电文总长最短编码:根据字符出现频率构造Huffman树,然后将树中结点引向其左孩子的分支标
7、“0”,引向其右孩子的分支标“1”;每个字符的编码即为从根到每个叶子的路径上得到的0、1序列。(4)压缩过程的实现:压缩过程的流程是清晰而简单的:1>创建Haffman树2>打开需压缩文件3>将需压缩文件中的每个ASCII码对应的Haffman编码按bit单位输出?4文件压缩结束。其中,步骤1和步骤3是压缩过程的关键。a)步骤1:这里所要做工作是得到Haffman数中各叶子结点字符出现的频率并进行创建。b)步骤3:将需压缩文件中的每个ASCII码对应的Haffman编码按bit单位输出,这是本压缩程序中最关键的部分
8、。这里涉及“转换”和“输出”两个关键步骤:“转换”部分大可不必去通过遍历Haffman树来找到每个字符对应的哈夫曼编码,可以将每个ASCII码值及其对应的ASCII码存放于如下所示的结构体中:typedefstruct{charasciiCode;unsignedlonghaffCode;inthaffCodeLen;}HaffCode;创建由该结构体结点所
此文档下载收益归作者所有