资源描述:
《大数据的结构实验报告材料-文件资料压缩》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、实用标准文案数据结构与程序设计实验实验报告课程名称数据结构与程序设计实验课程编号0906550实验项目名称文件压缩学号年级姓名专业计算机科学与技术学生所在学院计算机学院指导教师杨静实验室名称地点21B276精彩文档实用标准文案哈尔滨工程大学精彩文档实用标准文案实验报告四实验课名称:数据结构与程序设计实验实验名称:文件压缩班级:学号:姓名:时间:2016.04.21一、问题描述哈夫曼编码是一种常用的数据压缩技术,对数据文件进行哈夫曼编码可大大缩短文件的传输长度,提高信道利用率及传输效率。要求采用哈夫曼编码原理,统计文本文件中
2、字符出现的词频,以词频作为权值,对文件进行哈夫曼编码以达到压缩文件的目的,再用哈夫曼编码进行译码解压缩。l统计待压缩的文本文件中各字符的词频,以词频为权值建立哈夫曼树,并将该哈夫曼树保存到文件HufTree.dat中。l根据哈夫曼树(保存在HufTree.dat中)对每个字符进行哈夫曼编码,并将字符编码保存到HufCode.txt文件中。l压缩:根据哈夫曼编码,将源文件进行编码得到压缩文件CodeFile.dat。l解压:将CodeFile.dat文件利用哈夫曼树译码解压,恢复为源文件。二、数据结构设计由于哈夫曼树中没有度
3、为1的结点,则一棵树有n个叶子结点的哈夫曼树共有2n-1个结点,可以存储在一个大小为2n-1的一维数组中,而且对每个结点而言,即需知双亲结点的信息,又需知孩子结点的信息,由此可采用如下数据结构。1.使用结构体数组统计词频,并存储:typedefstructNode{intweight;//叶子结点的权值charc;//叶子结点intnum;//叶子结点的二进制码的长度}LeafNode[N];2.使用结构体数组存储哈夫曼树:typedefstruct{unsignedintweight;//权值unsignedintpar
4、ent,LChild,RChild;}HTNode,Huffman[M+1];//huffman树3.使用字符指针数组存储哈夫曼编码表:typedefchar*HuffmanCode[2*M];//haffman编码表三、算法设计1.读取文件,获得字符串voidread_file(charconst*file_name,char*ch){FILE*in_file=Fopen(file_name,"r");unsignedintflag=fread(ch,sizeof(char),N,in_file);if(flag==0)
5、{printf("%s读取失败",file_name);fflush(stdout);}printf("读入的字符串是:%s",ch);Fclose(in_file);intlen=strlen(ch);精彩文档实用标准文案ch[len-1]=' ';}2.统计叶子结点的字符和权值并存储voidCreateLeaf(charch[],int*ch_len,LeafNodeleaves,int*leaf_num){intlen,j,k;inttag;*leaf_num=0;//叶子节点个数//统计字符出现个数,
6、放入CWfor(len=0;ch[len]!=' ';len++){//遍历字符串ch[]tag=1;for(j=0;j