欢迎来到天天文库
浏览记录
ID:25480233
大小:50.50 KB
页数:3页
时间:2018-11-20
《一种高效率的信息检索算法论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、一种高效率的信息检索算法论文摘要构造一个新的HASH函数,结合索引顺序表和二分检索法的思想,提出了一种高效率的信息检索算法,通过理论计算和实验证明此算法的平均检索长度小于1.352(N100)。关键词HASH函数检索平均检索长度信息时代如何提高信息检索的效率一直是信息管理人员关注的问题。提高信息检索效率的有效途径是构建被检索信息与其存放地址之间的关系(HASH)。到目前为止,构造HASH函数的方法很多,常用的方法有:直接定址法、数字分析法、平方取中法、折叠法、除留余数法、随机数法等转换算法。但是不论哪种算法都会出现“碰撞”现象,因而就限制了上述方
2、法的普遍使用。为了解决或减少“碰撞”,我们把HASH的思想和索引顺序表检索的思想,以及二分检索法的思想结合起来提出一种基于HASH表的二分检索法,通过理论分析和实验证明,该算法检索效率极高。一、HASH函数的构造桶排序法,先把被排数据所分布的区间Dmin,Dmax(在这里Dmax,Dmin分别为被排数据的最大.freelax=dataN-1,Dmin=data0,N为数据个数)二、基于HASH函数的二分检索算法HS算法HS使用二个数组,data数组的元素data0~dataN-1中存放按升序排列的N个数据,address数组的元素address1
3、~addressN中用来存贮经HASH函数转换后得到相同地址的数据个数。算法HSHS1清address数组将ddress1~addressN都置0HS2Dmax中置最大值、Dmin中置最小值Dmax←dataN-1,Dmin←data0HS3i置初始值i←0HS4求数据datai的HASH变换后的地址adadHS5地址“碰撞”记数器addressad加1addressad←addressad+1HS6修改ii←i+1HS7比较i与N-1若i=N-1,则转HS4,否则转HS8。HS8address0置初值1address0←1HS9j置初始值j←1
4、HS10求地址发生“碰撞”的数据在DATA数组中的首地址addressj=addressj+addressj-1HS11修改jj←j+1HS12比较j与N若j=N则转HS10,否则转HS13。HS13输入一个被检索的数据XHS14对被检索数据X用HASH函数得地址adHS15确定“块”的下界lo个数据转换得到相同地址的概率为:(m=1,..毕业2,…,N)
此文档下载收益归作者所有