欢迎来到天天文库
浏览记录
ID:9752554
大小:61.00 KB
页数:8页
时间:2018-05-07
《数据库的查询优化技术--》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、数据库的查询优化技术>> 数据库系统是管理信息系统的核心,基于数据库的联机事务处理(OLTP)以及联机分析处理(OLAP)是银行、企业、政府等部门最为重要的计算机应用之一。从大多数系统的应用实例来看,查询操作在各种数据库操作中所占据的比重最大,而查询操作所基于的SELECT语句在SQL语句中又是代价最大的语句。举例来说,如果数据的量积累到一定的程度,比如一个银行的账户数据库表信息积累到上百万甚至上千万条记录,全表扫描一次往往需要数十分钟,甚至数小时。如果采用比全表扫描更好的查询策略,往往可以使查询时间降为几分钟,由此可
2、见查询优化技术的重要性。 笔者在应用项目的实施中发现,许多程序员在利用一些前端数据库开发工具(如Poix为例,介绍改善用户查询计划的方法。 1.合理使用索引 索引是数据库中重要的数据结构,它的根本目的就是为了提高查询效率。现在大多数的数据库产品都采用IBM最先提出的ISAM索引结构。索引的使用要恰到好处,其使用原则如下: 在经常进行连接,但是没有指定为外键的列上建立索引,而不经常连接的字段则由优化器自动生成索引。 在频繁进行排序或分组(即进行groupby或orderby操作)的列上建立索引。 在条件表达式中
3、经常用到的不同值较多的列上建立检索,在不同值少的列上不要建立索引。比如在雇员表的性别列上只有男与女两个不同值,因此就无必要建立索引。如果建立索引不但不会提高查询效率,反而会严重降低更新速度。 如果待排序的列有多个,可以在这些列上建立复合索引(poundindex)。 使用系统工具。如Informix数据库有一个tbcheck工具,可以在可疑的索引上进行检查。在一些数据库服务器上,索引可能失效或者因为频繁操作而使得读取效率降低,如果一个使用索引的查询不明不白地慢下来,可以试着用tbcheck工具检查索引的完整性,必要时
4、进行修复。另外,当数据库表更新大量数据后,删除并重建索引可以提高查询速度。 2.避免或简化排序 应当简化或避免对大型表进行重复的排序。当能够利用索引自动以适当的次序产生输出时,优化器就避免了排序的步骤。以下是一些影响因素: 索引中不包括一个或几个待排序的列; groupby或orderby子句中列的次序与索引的次序不一样; 排序的列来自不同的表。 为了避免不必要的排序,就要正确地增建索引,合理地合并数据库表(尽管有时可能影响表的规范化,但相对于效率的提高是值得的)。如果排序不可避免,那么应当试图简化它,如缩小
5、排序的列的范围等。 3.消除对大型表行数据的顺序存取 在嵌套查询中,对表的顺序存取对查询效率可能产生致命的影响。比如采用顺序存取策略,一个嵌套3层的查询,如果每层都查询1000行,那么这个查询就要查询10亿行数据。避免这种情况的主要方法就是对连接的列进行索引。例如,两个表:学生表(学号、姓名、年龄)和选课表(学号、课程号、成绩)。如果两个表要做连接,就要在学号这个连接字段上建立索引。 还可以使用并集来避免顺序存取。尽管在所有的检查列上都有索引,但某些形式的er_num=104ANDorder_num>1001
6、)ORorder_num=1008 虽然在customer_num和order_num上建有索引,但是在上面的语句中优化器还是使用顺序存取路径扫描整个表。因为这个语句要检索的是分离的行的集合,所以应该改为如下语句:SELECT*FROMordersorders=1008 这样就能利用索引路径处理查询。 4.避免相关子查询 一个列的标签同时在主查询和erWHEREzipcodeLIKE98___123下一页>>>>这篇文章来自..,。 即使在zipcode字段上建立了索引,在这种情况下也还是采用顺序扫描的方式。如
7、果把语句改为SELECT*FROMcustomercustomercust,rcvblescust,rcvblesPcust_)(part_desc)(othercolumn) 102,032Seageat30Gdisk 500,049Novel10M)(vendor_name)(othercolumn) 910,257SeageatCorp 523,045IBMCorp 3.parven表 零件号厂商号零件数量
8、 (part_num)(vendor_num)(part_amount) 102,032910,2573,450,000 234,423321,0014,000,000 下面的查询将在这些表上定期运行,并产生关于所有零件数量的报表:SELECTpart_desc,ven
此文档下载收益归作者所有