资源描述:
《海量数据库的 查询优化及分页算法方案》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、海量数据库的查询优化及分页算法方案明月松间照,清泉石上流。鞠躬尽瘁,死而后已。花自飘零水自流,一种相思,两处闲愁。余将董道而不豫兮,固将重昏而终身。疏影横斜水清浅,暗香浮动月黄昏。随着“金盾工程”建设的逐步深入和公安信息化的高速发展,公安计算机应用系统被广泛应用在各警种、各部门。与此同时,应用系统体系的核心、系统数据的存放地――数据库也随着实际应用而急剧膨胀,一些大规模的系统,如人口系统的数据甚至超过了1000万条,可谓海量。那么,如何实现快速地从这些超大容量的数据库中提取数据(查询)、分析、统计以及提取数据后进行数据分页已成为各地系统管理员和数据库管理员亟待解决的难题。在以下的
2、文章中,我将以“办公自动化”系统为例,探讨如何在有着1000万条数据的MSSQLSERVER数据库中实现快速的数据提取和数据分页。以下代码说明了我们实例中数据库的“红头文件”一表的部分数据结构:CREATETABLE[dbo].[TGongwen](--TGongwen是红头文件表名[Gid][int]IDENTITY(1,1)NOTNULL,--本表的id号,也是主键[title][varchar](80)COLLATEChinese_PRC_CI_ASNULL,--红头文件的标题[fariqi][datetime]NULL,--发布日期[neibuYonghu][varcha
3、r](70)COLLATEChinese_PRC_CI_ASNULL,--发布用户[reader][varchar](900)COLLATEChinese_PRC_CI_ASNULL,--需要浏览的用户。每个用户中间用分隔符“,”分开)ON[PRIMARY]TEXTIMAGE_ON[PRIMARY]GO下面,我们来往数据库中添加1000万条数据:declare@iintset@i=1while@i<=250000begininsertintoTgongwen(fariqi,neibuyonghu,reader,title)values('2004-2-5','通信科','通信科,
4、办公室,王局长,刘局长,张局长,admin,刑侦支队,特勤支队,交巡警支队,经侦支队,户政科,治安支队,外事科','这是最先的25万条记录')set@i=@i+1endGOdeclare@iintset@i=1while@i<=250000begininsertintoTgongwen(fariqi,neibuyonghu,reader,title)values('2004-9-16','办公室','办公室,通信科,王局长,刘局长,张局长,admin,刑侦支队,特勤支队,交巡警支队,经侦支队,户政科,外事科','这是中间的25万条记录')set@i=@i+1endGOdeclar
5、e@hintset@h=1while@h<=100begindeclare@iintset@i=2002while@i<=2003begindeclare@jintset@j=0while@j<50begindeclare@kintset@k=0while@k<50begininsertintoTgongwen(fariqi,neibuyonghu,reader,title)values(cast(@iasvarchar(4))+'-8-153:'+cast(@jasvarchar(2))+':'+cast(@jasvarchar(2)),'通信科','办公室,通信科,王局长,刘
6、局长,张局长,admin,刑侦支队,特勤支队,交巡警支队,经侦支队,户政科,外事科','这是最后的50万条记录')set@k=@k+1endset@j=@j+1endset@i=@i+1endset@h=@h+1endGOdeclare@iintset@i=1while@i<=9000000begininsertintoTgongwen(fariqi,neibuyonghu,reader,title)values('2004-5-5','通信科','通信科,办公室,王局长,刘局长,张局长,admin,刑侦支队,特勤支队,交巡警支队,经侦支队,户政科,治安支队,外事科','这是最后
7、添加的900万条记录')set@i=@i+1000000endGO通过以上语句,我们创建了25万条由通信科于2004年2月5日发布的记录,25万条由办公室于2004年9月6日发布的记录,2002年和2003年各100个2500条相同日期、不同分秒的由通信科发布的记录(共50万条),还有由通信科于2004年5月5日发布的900万条记录,合计1000万条。一、因情制宜,建立“适当”的索引建立“适当”的索引是实现查询优化的首要前提。索引(index)是除表之外另一重要的、用户定义的存储