欢迎来到天天文库
浏览记录
ID:34431646
大小:65.50 KB
页数:4页
时间:2019-03-06
《二叉树是我们都非常熟悉的一种数据结构》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、二叉树是我们都非常熟悉的一种数据结构。它支持包括查找、插入、删除等一系列的操作。但它有一个致命的弱点,就是当数据的随机性不够时,会导致其树型结构的不平衡,从而直接影响到算法的效率。跳跃表(SkipList)是1987年才诞生的一种崭新的数据结构,它在进行查找、插入、删除等操作时的期望时间复杂度均为O(logn),有着近乎替代平衡树的本领。而且最重要的一点,就是它的编程复杂度较同类的AVL树,红黑树等要低得多,这使得其无论是在理解还是在推广性上,都有着十分明显的优势。跳跃表由多条链构成(S0,S1,S2……,Sh),且满足如下三个条件:(1)每条链必须包含两个特殊元素:+∞和-∞
2、(2)S0包含所有的元素,并且所有链中的元素按照升序排列。(3)每条链中的元素集合必须包含于序数较小的链的元素集合,即:【基本操作】在对跳跃表有一个初步的认识以后,我们来看一下基于它的几个最基本的操作。一、查找目的:在跳跃表中查找一个元素x在跳跃表中查找一个元素x,按照如下几个步骤进行:i)从最上层的链(Sh)的开头开始ii)假设当前位置为p,它向右指向的节点为q(p与q不一定相邻),且q的值为y。将y与x作比较(1)x=y输出查询成功及相关信息(2)x>y从p向右移动到q的位置(3)x3、询失败二、插入目的:向跳跃表中插入一个元素x首先明确,向跳跃表中插入一个元素,相当于在表中插入一列从S0中某一位置出发向上的连续一段元素。有两个参数需要确定,即插入列的位置以及它的“高度”。关于插入的位置,我们先利用跳跃表的查找功能,找到比x小的最大的数y。根据跳跃表中所有链均是递增序列的原则,x必然就插在y的后面。而插入列的“高度”较前者来说显得更加重要,也更加难以确定。由于它的不确定性,使得不同的决策可能会导致截然不同的算法效率。为了使插入数据之后,保持该数据结构进行各种操作均为O(logn)复杂度的性质,我们引入随机化算法(RandomizedAlgorithms)。我们4、定义一个随机决策模块,它的大致内容如下:·产生一个0到1的随机数rr←random()·如果r小于一个常数p,则执行方案A,ifr5、子:假设当前我们要插入元素“40”,且在执行了随机决策模块后得到高度为4·步骤一:找到表中比40小的最大的数,确定插入位置,步骤二:插入高度为4的列,并维护跳跃表的结构三、删除目的:从跳跃表中删除一个元素x删除操作分为以下三个步骤:(1)在跳跃表中查找到这个元素的位置,如果未找到,则退出*(2)将该元素所在整列从表中删除*(3)将多余的“空链”删除*所谓“记忆化”查找,就是在前一次查找的基础上进行进一步的查找。它可以利用前一次查找所得到的信息,取其中可以被当前查找所利用的部分。利用“记忆化”查找可以将一次查找的复杂度变为O(logk),其中k为此次与前一次两个被查找元素在跳跃表6、中位置的距离。下面来看一下记忆化搜索的具体实现方法:假设上一次操作我们查询的元素为i,此次操作我们欲查询的元素为j。我们用一个update数组来记录在查找i时,指针在每一层所“跳”到的最右边的位置。如图4.1中橘黄色的元素。(蓝色为路径上的其它元素),在插入元素j时,分为两种情况:4(1)i<=j从S0层开始向上遍历update数组中的元素,直到找到某个元素,它向右指向的元素大于等于j,并于此处开始新一轮对j的查找(与一般的查找过程相同)(2)i>j从S0层开始向上遍历update数组中的元素,直到找到某个元素小于等于j,并于此处开始新一轮对j的查找(与一般的查找过程相同)图47、.2十分详细地说明了在查找了i=37之后,继续查找j=15或53时的两种不同情况。【复杂度分析】一个数据结构的好坏大部分取决于它自身的空间复杂度以及基于它一系列操作的时间复杂度。跳跃表之所以被誉为几乎能够代替平衡树,其复杂度方面自然不会落后。我们来看一下跳跃表的相关复杂度:空间复杂度:O(n)(期望)跳跃表高度:O(logn)(期望)相关操作的时间复杂度:查找:O(logn)(期望)插入:O(logn)(期望)删除:O(logn)(期望)之所以在每一项后面都加一个“期望”,是因为跳跃表的复杂
3、询失败二、插入目的:向跳跃表中插入一个元素x首先明确,向跳跃表中插入一个元素,相当于在表中插入一列从S0中某一位置出发向上的连续一段元素。有两个参数需要确定,即插入列的位置以及它的“高度”。关于插入的位置,我们先利用跳跃表的查找功能,找到比x小的最大的数y。根据跳跃表中所有链均是递增序列的原则,x必然就插在y的后面。而插入列的“高度”较前者来说显得更加重要,也更加难以确定。由于它的不确定性,使得不同的决策可能会导致截然不同的算法效率。为了使插入数据之后,保持该数据结构进行各种操作均为O(logn)复杂度的性质,我们引入随机化算法(RandomizedAlgorithms)。我们
4、定义一个随机决策模块,它的大致内容如下:·产生一个0到1的随机数rr←random()·如果r小于一个常数p,则执行方案A,ifr5、子:假设当前我们要插入元素“40”,且在执行了随机决策模块后得到高度为4·步骤一:找到表中比40小的最大的数,确定插入位置,步骤二:插入高度为4的列,并维护跳跃表的结构三、删除目的:从跳跃表中删除一个元素x删除操作分为以下三个步骤:(1)在跳跃表中查找到这个元素的位置,如果未找到,则退出*(2)将该元素所在整列从表中删除*(3)将多余的“空链”删除*所谓“记忆化”查找,就是在前一次查找的基础上进行进一步的查找。它可以利用前一次查找所得到的信息,取其中可以被当前查找所利用的部分。利用“记忆化”查找可以将一次查找的复杂度变为O(logk),其中k为此次与前一次两个被查找元素在跳跃表6、中位置的距离。下面来看一下记忆化搜索的具体实现方法:假设上一次操作我们查询的元素为i,此次操作我们欲查询的元素为j。我们用一个update数组来记录在查找i时,指针在每一层所“跳”到的最右边的位置。如图4.1中橘黄色的元素。(蓝色为路径上的其它元素),在插入元素j时,分为两种情况:4(1)i<=j从S0层开始向上遍历update数组中的元素,直到找到某个元素,它向右指向的元素大于等于j,并于此处开始新一轮对j的查找(与一般的查找过程相同)(2)i>j从S0层开始向上遍历update数组中的元素,直到找到某个元素小于等于j,并于此处开始新一轮对j的查找(与一般的查找过程相同)图47、.2十分详细地说明了在查找了i=37之后,继续查找j=15或53时的两种不同情况。【复杂度分析】一个数据结构的好坏大部分取决于它自身的空间复杂度以及基于它一系列操作的时间复杂度。跳跃表之所以被誉为几乎能够代替平衡树,其复杂度方面自然不会落后。我们来看一下跳跃表的相关复杂度:空间复杂度:O(n)(期望)跳跃表高度:O(logn)(期望)相关操作的时间复杂度:查找:O(logn)(期望)插入:O(logn)(期望)删除:O(logn)(期望)之所以在每一项后面都加一个“期望”,是因为跳跃表的复杂
5、子:假设当前我们要插入元素“40”,且在执行了随机决策模块后得到高度为4·步骤一:找到表中比40小的最大的数,确定插入位置,步骤二:插入高度为4的列,并维护跳跃表的结构三、删除目的:从跳跃表中删除一个元素x删除操作分为以下三个步骤:(1)在跳跃表中查找到这个元素的位置,如果未找到,则退出*(2)将该元素所在整列从表中删除*(3)将多余的“空链”删除*所谓“记忆化”查找,就是在前一次查找的基础上进行进一步的查找。它可以利用前一次查找所得到的信息,取其中可以被当前查找所利用的部分。利用“记忆化”查找可以将一次查找的复杂度变为O(logk),其中k为此次与前一次两个被查找元素在跳跃表
6、中位置的距离。下面来看一下记忆化搜索的具体实现方法:假设上一次操作我们查询的元素为i,此次操作我们欲查询的元素为j。我们用一个update数组来记录在查找i时,指针在每一层所“跳”到的最右边的位置。如图4.1中橘黄色的元素。(蓝色为路径上的其它元素),在插入元素j时,分为两种情况:4(1)i<=j从S0层开始向上遍历update数组中的元素,直到找到某个元素,它向右指向的元素大于等于j,并于此处开始新一轮对j的查找(与一般的查找过程相同)(2)i>j从S0层开始向上遍历update数组中的元素,直到找到某个元素小于等于j,并于此处开始新一轮对j的查找(与一般的查找过程相同)图4
7、.2十分详细地说明了在查找了i=37之后,继续查找j=15或53时的两种不同情况。【复杂度分析】一个数据结构的好坏大部分取决于它自身的空间复杂度以及基于它一系列操作的时间复杂度。跳跃表之所以被誉为几乎能够代替平衡树,其复杂度方面自然不会落后。我们来看一下跳跃表的相关复杂度:空间复杂度:O(n)(期望)跳跃表高度:O(logn)(期望)相关操作的时间复杂度:查找:O(logn)(期望)插入:O(logn)(期望)删除:O(logn)(期望)之所以在每一项后面都加一个“期望”,是因为跳跃表的复杂
此文档下载收益归作者所有