一、SQL编写注意事项(标准)在多在应用系统开发初期,由于开发数据库数据比较少,对于查询SQL语句的编写等体会不出SQL语句各种写法的性能优劣,但是如果将应用系统提交实际应用后,随着数据库中数据的增加,系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于大量数据,劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍,可见对于一个系统不是简单地能实现其功能就可,而是要写出高质量的SQL语句,提高系统的可用性。在多数情况下,Oracle使用索引来更快地遍历表,优化器主要根据定义的索引来提高性能。但是,如果在SQL语句的where子句中写的SQL代码不合理,就会造成优化器删去索引而使用全表扫描,一般就这种SQL语句就是所谓的劣质SQL语句。在编写SQL语句时我们应清楚优化器根据何种原则来使用索引,这有助于写出高性能的SQL语句。改成下面:10 二、SQL语句的编写原则:●选择一个好的表联接顺序(这是一个比较重要的原则)当在WHERE子句中有多个表联接时,WHERE子句中排在最后的表应当是返回行数可能最少的表,有过滤条件的子句应放在WHERE子句中的最后。如:设从emp表查到的数据比较少或该表的过滤条件比较确定,能大大缩小查询范围,则将最具有选择性部分放在WHERE子句中的最后:select * from emp e,dept d where d.deptno >10 and e.deptno =30; 如果dept表返回的记录数较多的话,上面的查询语句会比下面的查询语句响应快得多。select * from emp e,dept d where e.deptno =30 and d.deptno >10;●最好不要在WHERE子句中使用函数或表达式,如果要使用的话,最好统一使用相同的表达式或函数,这样便于以后使用合理的索引。SELECT *FROM T1WHERE F1*2=100 改成 SELECT *FROM T1WHEREF1=100/2● 使用WHERE (NOT)EXISTS 来代替(NOT)IN子句,使用NOT EXISTS 子句可以有效地利用索引。尽可能使用NOT EXISTS来代替NOT IN,尽管二者都使用了NOT(但NOTIN不能使用索引而降低速度),NOT EXISTS要比NOT IN查询效率更高。例子1: 10 SELECT dname, deptno FROM dept WHERE deptno NOT IN (SELECT deptno FROM emp); 例子2:SELECT dname, deptno FROM dept WHERE NOT EXISTS (SELECT deptno FROM emp WHERE dept.deptno = emp.deptno); 明显的,2要比1的执行性能好很多。因为1中对emp进行了全表扫描,这是很浪费时间的操作。而且1中没有用到emp的索引, 因为没有where子句。而2中的语句对emp进行的是缩小范围的查询。● 通过使用>=、<=等,避免使用NOT命令如这个例子:select * from employee where salary<>3000; 对这个查询,可以改写为不使用NOT:select * from employee where salary<3000 or salary>3000; 虽然这两种查询的结果一样,但是第二种查询方案会比第一种查询方案更快些。第二种查询允许Oracle对salary列使用索引,而第一种查询则不能使用索引。●外部联接+的用法外部联接+按其在=的左边或右边分左联接和右联接。若不带+运算符的表中的一个行不直接匹配于带+预算符的表中的任何行,则前者的行与后者中的一个空行相匹配并被返回。利用外部联接+,可以替代效率十分低下的 not in 运算,大大提高运行速度。例如,下面这条命令执行起来很慢:select a.empno from emp a where a.empno not in(select empno from emp1 where job=‘SALE’);索引倘若利用外部联接,改写命令如下: select a.empno from emp aleftjoinemp1 b on a.empno=b.empno where b.empno is null and b.job=‘SALE’;例如表少,但情况复杂的时候应该写如下语句:selecta.empnoASempno,(selectemp2.addressfromemp2wherea.id=emp2.id)ASaddress,(selectemp3.address1fromemp3whereb.id=emp3.id)ASaddress1fromempaleftjoinemp1bona.empno=b.empnowhereb.empnoisnullandb.job=‘SALE’这样运行速度明显提高.●在查询时尽量少用格式转换如用 WHERE a.order_no = b.order_no 而不用 WHERE TO_NUMBER (substr(a.order_no, instr(b.order_no, ’.’)-1)= TO_NUMBER (substr(a.order_no, instr(b.order_no, .’) - 1)10 ●Order by语句索引ORDER BY语句决定了Oracle如何将返回的查询结果排序。Order by语句对要排序的列没有什么特别的限制,也可以将函数加入列中(象联接或者附加等)。任何在Order by语句的非索引项或者有计算表达式都将降低查询速度。仔细检查order by语句以找出非索引项或者表达式,它们会降低性能。解决这个问题的办法就是重写order by语句以使用索引,也可以为所使用的列建立另外一个索引,同时应绝对避免在order by子句中使用表达式。如必须使用排序操作,请遵循如下规则:如结果集不需唯一,使用unionall代替union。●IS NULL 与 IS NOT NULL不能用null作索引,任何包含null值的列都将不会被包含在索引中。即使索引有多列这样的情况下,只要这些列中有一列含有null,该列就会从索引中排除。也就是说如果某列存在空值,即使对该列建索引也不会提高性能。任何在where子句中使用is null或is not null的语句优化器是不允许使用索引的。●SELECT子句中避免使用‘*‘SELECT*FROM EMP应改为:SELECTCOLUMNFROM EMP●当在SQL语句中连接多个表时,最好使用表别名并把别名加在每个列上●其他使用count(*)而不要使用count(column_name)。避免困难的正规表达式:LIKE通配符匹配,技术上叫正规表达式。但这种匹配特别耗费时间。例如:SELECT*FROMcustomerWHEREzipcodeLIKE“98___”即使在zipcode字段上建立了索引,也还是采用顺序扫描的方式。如果把语句改为SELECT*FROMcustomerWHEREzipcode>98000在执行查询时就会利用索引来查询,显然会大大提高速度。另外,以下语句也不会使用索引:SELECT*FROMcustomerWHEREzipcodeLIKE'[C-P]arsen'SELECT*FROMcustomerWHEREzipcodeLIKE'parsen[^L]%'SELECT*FROMcustomerWHEREzipcodeLIKE'%parsen'10 三、其他经验性规则 1、用多表连接代替EXISTS子句。如例(1) 2、少用DISTINCT,用EXISTS代替如例(2),where条件满足后,可以一次 性返回结果集3、如果有两张表联接利用COUNT的时候最好将急纪录少的表放放在后后面 表TAB116,384条记录 表TAB25000条记录selectcount(tab2.*)fromtab1,tab2wheretab2.id=tab1.id这个速度要快些。selectcount(tab2.*)fromtab2,tab1wheretab2.id=tab1.id如果还有tab3表,而且tab3表是tab1和tab2表的联协表,也叫交集表,此时,将tab3放在最后效率要高很多。selectcount(tab2.*)fromtab2,tab1,tab3wheretab2.name=tab1.nameandtab3.sex=tab1.sexandtab3.age=tab2.age示例: 例1: XSELECT*FROMempWHEREEXISTS(SELECT'X'FROMdept WHEREdept_no=e.dept_noANDdept_cat='A'); OSELECT*FROMempe,deptdWHEREe.dept_no=d.dept_no ANDdept_cat='A'; 例2: XSELECTDISTINCTd.dept_code,d.dept_nameFROMdeptd,empe WHEREe.dept_code=d.dept_code; OSELECTdept_code,dept_nameFROMdeptd WHEREEXISTS(SELECT'X'FROMempe WHEREe.dept_code=d.dept_code);10 SQL性能调整原则以下就某些SQL语句的where子句编写及性能优化中需要注意的问题作详细介绍。在这些where子句中,虽然某些列存在索引,但是由于编写了劣质的SQL,系统在运行该SQL语句时也不能使用该索引,而同样使用全表扫描,这就造成了响应速度的极大降低。1.ISNULL与ISNOTNULL在应不能用null作索引,任何包含null值的列都将不会被包含在索引中。即使索引有多列这样的情况下,只要这些列中有一列含有null,该列就会从索引中排除。也就是说如果某列存在空值,即使对该列建索引也不会提高性能。任何在where子句中使用isnull或isnotnull的语句优化器是不允许使用索引的。例:dropindextemp_zhao.aaaindexselect*fromtemp_zhaowhereaulnameisnotnullcreateclusteredindexaaaindexontemp_zhao(aulname)select*fromtemp_zhaowhereaulnameisnotnull2.联接列在应对于有联接的列,即使最后的联接值为一个静态值,优化器是不会使用索引的。我们一起来看一个例子,假定有一个职工表(employee),对于一个职工的姓和名分成两列存放(FIRST_NAME和LAST_NAME),现在要查询一个叫比尔.克林顿(BillCliton)的职工。下面是一个采用联接查询的SQL语句:select*fromemploysswherefirst_name||''||last_name='BeillCliton';上面这条语句完全可以查询出是否有BillCliton这个员工,但是这里需要注意,系统优化器对基于last_name创建的索引没有使用。应当采用下面这种SQL语句的编写,Oracle系统就可以采用基于last_name创建的索引。Select*fromemployeewherefirst_name='Beill'andlast_name='Cliton';例:dropindextemp_zhao.aaaindexselect*fromtemp_zhaowhereaulname+''+au_fname='WhiteJohnson'select*fromtemp_zhaowhereaulname='White'andau_fname='Johnson'createclusteredindexaaaindexontemp_zhao(au_fname)10 select*fromtemp_zhaowhereaulname+''+au_fname='WhiteJohnson'select*fromtemp_zhaowhereaulname='White'andau_fname='Johnson'3.带通配符(%)的like语句同样以上面的例子来看这种情况。目前的需求是这样的,要求在职工表中查询名字中包含cliton的人。可以采用如下的查询SQL语句:select*fromemployeewherelast_namelike'%cliton%';这里由于通配符(%)在搜寻词首出现,所以Oracle系统不使用last_name的索引。在很多情况下可能无法避免这种情况,但是一定要心中有底,通配符如此使用会降低查询速度。然而当通配符出现在字符串其他位置时,优化器就能利用索引。在下面的查询中索引得到了使用:select*fromemployeewherelast_namelike'cliton%';例:dropindextemp_zhao.aaaindexselect*fromtemp_zhaowhereaulnamelike'G%'oraulnamelike'W%'oraulnamelike'b%'createclusteredindexaaaindexontemp_zhao(aulname)select*fromtemp_zhaowhereaulnamelike'G%'oraulnamelike'W%'oraulnamelike'b%'4.Orderby语句ORDERBY语句决定了Oracle如何将返回的查询结果排序。Orderby语句对要排序的列没有什么特别的限制,也可以将函数加入列中(象联接或者附加等)。任何在Orderby语句的非索引项或者有计算表达式都将降低查询速度。仔细检查orderby语句以找出非索引项或者表达式,它们会降低性能。解决这个问题的办法就是重写orderby语句以使用索引,也可以为所使用的列建立另外一个索引,同时应绝对避免在orderby子句中使用表达式。例:Orderby语句dropindextemp_zhao.aaaindexselect*fromtemp_zhaoorderbyau_idcreateclusteredindexaaaindexontemp_zhao(au_id)select*fromtemp_zhaoorderbyau_idGroupby语句dropindextemp_zhao.aaaindexselectaulnamefromtemp_zhaogroupbyaulnamecreateclusteredindexaaaindexontemp_zhao(aulname)selectaulnamefromtemp_zhaogroupbyaulname10 5.NOT我们在查询时经常在where子句使用一些逻辑表达式,如大于、小于、等于以及不等于等等,也可以使用and(与)、or(或)以及not(非)。NOT可用来对任何逻辑运算符号取反。下面是一个NOT子句的例子:...wherenot(status='VALID')如果要使用NOT,则应在取反的短语前面加上括号,并在短语前面加上NOT运算符。NOT运算符包含在另外一个逻辑运算符中,这就是不等于(<>)运算符。换句话说,即使不在查询where子句中显式地加入NOT词,NOT仍在运算符中,见下例:...wherestatus<> 'INVALID';再看下面这个例子:select*fromemployeewhere salary<>3000;对这个查询,可以改写为不使用NOT:select*fromemployeewhere salary<3000orsalary>3000;例:dropindextemp_zhao.aaaindexselect*fromtemp_zhaowherezip<>94609createclusteredindexaaaindexontemp_zhao(zip)select*fromtemp_zhaowherezip<>94609select*fromtemp_zhaowherezip>94609orzip<94609虽然这两种查询的结果一样,但是第二种查询方案会比第一种查询方案更快些。第二种查询允许Oracle对salary列使用索引,而第一种查询则不能使用索引。6.IN和EXISTS有时候会将一列和一系列值相比较。最简单的办法就是在where子句中使用子查询。在where子句中可以使用两种格式的子查询。第一种格式是使用IN操作符:...wherecolumnin(select*from...where...);第二种格式是使用EXIST操作符:...whereexists(select'X'from...where...);相信绝大多数人会使用第一种格式,因为它比较容易编写,而实际上第二种格式要远比第一种格式的效率高。在Oracle中可以几乎将所有的IN操作符子查询改写为使用EXISTS的子查询。在第二种格式中,子查询以‘select10 'X'开始。运用EXISTS子句不管子查询从表中抽取什么数据它只查看where子句。这样优化器就不必遍历整个表而仅根据索引就可完成工作(这里假定在where语句中使用的列存在索引)。相对于IN子句来说,EXISTS使用相连子查询,构造起来要比IN子查询困难一些。通过使用EXIST,Oracle系统会首先检查主查询,然后运行子查询直到它找到第一个匹配项,这就节省了时间。Oracle系统在执行IN子查询时,首先执行子查询,并将获得的结果列表存放在在一个加了索引的临时表中。在执行子查询之前,系统先将主查询挂起,待子查询执行完毕,存放在临时表中以后再执行主查询。这也就是使用EXISTS比使用IN通常查询速度快的原因。同时应尽可能使用NOTEXISTS来代替NOTIN,尽管二者都使用了NOT(不能使用索引而降低速度),NOTEXISTS要比NOTIN查询效率更高。例:createclusteredindexaaaindexontemp_zhao(au_id)select*fromtemp_zhaowheretemp_zhao.au_idin(selectau_idfromtemp_zhao1)select*fromtemp_zhaowhereexists(select*fromtemp_zhao1wheretemp_zhao.au_id=temp_zhao1.au_id)7、其他1、SELECT子句中避免使用‘*‘selectzipfromtemp_zhaoselect*fromtemp_zhao2、使用count(*)而不要使用count(column_name)。selectcount(zip)fromtemp_zhaoselectcount(*)fromtemp_zhao10 培训注意点总结1、语句中出现的所有表名、字段名全部小写,系统保留字、内置函数名、SQL保留字大写。2、连接符or、in、and、以及=、<=、>=等前后加上一个空格。3、对较为复杂的sql语句加上注释,说明算法、功能。4、查询多个列时,尽量使每列查询占一行,且加上注释来标明该列名称,以方便其他人以后的修改。5、where子句书写时,每个条件占一行,语句令起一行时,以保留字或者连接符开始,连接符右对齐。6、多表连接时,使用表的别名来引用列。7、变量命名不能超出ORACLE的限制(30个字符),命名要规范,要用英文命名。8、查找数据库表或视图时,只取需要字段,不要使用*来代替所有列名。9、当在WHERE子句中有多个表联接时,WHERE子句中排在最后的表应当是返回行数可能最少的表。10、过滤条件最有效的子句应放在WHERE子句中的最后。11、最好不要在WHERE子句中使用函数或表达式。12、尽可能使用NOT EXISTS来代替NOT IN,使用EXISTS来代替IN。13、通过使用>...OR<...来避免使用<>...。14、在查询时尽量少用格式转换。15、在不必要的情况下尽量避免使用ORDERBY和GROUPBY(必要时注意对索引列排序、分组)。16、尽量避免使用IS NULL 和 IS NOT NULL(尤其对具有索引的列使用)。17、在使用count时,尽量使用count(*)而不要使用count(column_name)。18、在不必要的情况下尽量避免使用DISTINCT。19、尽量避免使用‘%...‘。20、尽可能多地使用主键列(默认的会在主键上加上索引)作为条件。21、尽量避免使用UNIONALL,而用UNION代替。10