资源描述:
《海量数据库的 查询优化及分页算法方案》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、海量数据库的查询优化及分页算法方案在以下的文章中,我将以“办公自动化”系统为例,探讨如何在有着1000万条数据的MSSQLSERVER数据库中实现快速的数据提取和数据分页。以下代码说明了我们实例中数据库的“红头文件”一表的部分数据结构:CREATETABLE[dbo].[TGongwen](--TGongwen是红头文件表名[Gid][int]IDENTITY(1,1)NOTNULL,--本表的id号,也是主键[title][varchar](80)COLLATEChinese_PRC_CI_ASNULL,--红头文件的标题[f
2、ariqi][datetime]NULL,--发布日期[neibuYonghu][varchar](70)COLLATEChinese_PRC_CI_ASNULL,--发布用户[reader][varchar](900)COLLATEChinese_PRC_CI_ASNULL,--需要浏览的用户。每个用户中间用分隔符“,”分开)ON[PRIMARY]TEXTIMAGE_ON[PRIMARY]GO下面,我们来往数据库中添加1000万条数据:declare@iintset@i=1while@i<=250000begininserti
3、ntoTgongwen(fariqi,neibuyonghu,reader,title)values('2004-2-5','通信科','通信科,办公室,王局长,刘局长,张局长,admin,刑侦支队,特勤支队,交巡警支队,经侦支队,户政科,治安支队,外事科','这是最先的25万条记录')set@i=@i+1endGOdeclare@iintset@i=1while@i<=250000begininsertintoTgongwen(fariqi,neibuyonghu,reader,title)values('2004-9-16'
4、,'办公室','办公室,通信科,王局长,刘局长,张局长,admin,刑侦支队,特勤支队,交巡警支队,经侦支队,户政科,外事科','这是中间的25万条记录')set@i=@i+1endGOdeclare@hintset@h=1while@h<=100begindeclare@iintset@i=2002while@i<=2003begindeclare@jintset@j=0while@j<50begindeclare@kintset@k=0while@k<50begininsertintoTgongwen(fariqi,neib
5、uyonghu,reader,title)values(cast(@iasvarchar(4))+'-8-153:'+cast(@jasvarchar(2))+':'+cast(@jasvarchar(2)),'通信科','办公室,通信科,王局长,刘局长,张局长,admin,刑侦支队,特勤支队,交巡警支队,经侦支队,户政科,外事科','这是最后的50万条记录')set@k=@k+1endset@j=@j+1endset@i=@i+1endset@h=@h+1endGOdeclare@iintset@i=1while@i<=900
6、0000begininsertintoTgongwen(fariqi,neibuyonghu,reader,title)values('2004-5-5','通信科','通信科,办公室,王局长,刘局长,张局长,admin,刑侦支队,特勤支队,交巡警支队,经侦支队,户政科,治安支队,外事科','这是最后添加的900万条记录')set@i=@i+1000000endGO通过以上语句,我们创建了25万条由通信科于2004年2月5日发布的记录,25万条由办公室于2004年9月6日发布的记录,2002年和2003年各100个2500条相同
7、日期、不同分秒的由通信科发布的记录(共50万条),还有由通信科于2004年5月5日发布的900万条记录,合计1000万条。一、因情制宜,建立“适当”的索引建立“适当”的索引是实现查询优化的首要前提。索引(index)是除表之外另一重要的、用户定义的存储在物理介质上的数据结构。当根据索引码的值搜索数据时,索引提供了对数据的快速访问。事实上,没有索引,数据库也能根据SELECT语句成功地检索到结果,但随着表变得越来越大,使用“适当”的索引的效果就越来越明显。注意,在这句话中,我们用了“适当”这个词,这是因为,如果使用索引时不认真考虑
8、其实现过程,索引既可以提高也会破坏数据库的工作性能。(一)深入浅出理解索引结构实际上,您可以把索引理解为一种特殊的目录。微软的SQLSERVER提供了两种索引:聚集索引(clusteredindex,也称聚类索引、簇集索引)和非聚集索引(nonclustered