SQL Server多表查询优化方案集锦

 更新时间:2015年08月14日 16:20:23   投稿:lijiao  
本文我们主要对SQL Server多表查询的优化方案进行了总结,并给出了实际的例子进行性能与效率的对比,需要的朋友可以参考下

SQL Server多表查询的优化方案是本文我们主要要介绍的内容,本文我们给出了优化方案和具体的优化实例,接下来就让我们一起来了解一下这部分内容。

1.执行路径

ORACLE的这个功能大大地提高了SQL的执行性能并节省了内存的使用:我们发现,单表数据的统计比多表统计的速度完全是两个概念.单表统计可能只要0.02秒,但是2张表联合统计就

可能要几十秒了.这是因为ORACLE只对简单的表提供高速缓冲(cache buffering) ,这个功能并不适用于多表连接查询..数据库管理员必须在init.ora中为这个区域设置合适的参数,当这个内存区域越大,就可以保留更多的语句,当然被共享的可能性也就越大了.

2.选择最有效率的表名顺序(记录少的放在后面)

ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,因此FROM子句中写在最后的表(基础表 driving table)将被最先处理. 在FROM子句中包含多个表的情况下,你必须选择记录条数最少的表作为基础表.当ORACLE处理多个表时, 会运用排序及合并的方式连接它们.首先,扫描第一个表(FROM子句中最后的那个表)并对记录进行派序,然后扫描第二个表(FROM子句中最后第二个表),最后将所有从第二个表中检索出的记录与第一个表中合适记录进行合并.

例如:

表 TAB1 16,384 条记录

表 TAB2 1条记录

选择TAB2作为基础表 (最好的方法)

select count(*) from tab1,tab2 执行时间0.96秒

选择TAB2作为基础表 (不佳的方法)

select count(*) from tab2,tab1    执行时间26.09秒

如果有3个以上的表连接查询, 那就需要选择交叉表(intersection table)作为基础表, 交叉表是指那个被其他表所引用的表.

例如:    EMP表描述了LOCATION表和CATEGORY表的交集.

SELECT * 
FROM LOCATION L , 
    CATEGORY C, 
    EMP E 
WHERE E.EMP_NO BETWEEN 1000 AND 2000 
AND E.CAT_NO = C.CAT_NO 
AND E.LOCN = L.LOCN 

将比下列SQL更有效率

SELECT * 
FROM EMP E , 
LOCATION L , 
    CATEGORY C 
WHERE  E.CAT_NO = C.CAT_NO 
AND E.LOCN = L.LOCN 
AND E.EMP_NO BETWEEN 1000 AND 2000 

3.WHERE子句中的连接顺序(条件细的放在后面)

ORACLE采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的连接必须写在其他WHERE条件之前, 那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾.

例如:

(低效,执行时间156.3秒)

SELECT … 
FROM EMP E 
WHERE  SAL > 50000 
AND   JOB = ‘MANAGER' 
AND   25 < (SELECT COUNT(*) FROM EMP 
WHERE MGR=E.EMPNO); 
(高效,执行时间10.6秒) 
SELECT … 
FROM EMP E 
WHERE 25 < (SELECT COUNT(*) FROM EMP 
       WHERE MGR=E.EMPNO) 
AND   SAL > 50000 
AND   JOB = ‘MANAGER'; 

4.SELECT子句中避免使用'* '

当你想在SELECT子句中列出所有的COLUMN时,使用动态SQL列引用 '*' 是一个方便的方法.不幸的是,这是一个非常低效的方法. 实际上,ORACLE在解析的过程中, 会将'*' 依次转换成所有的列名, 这个工作是通过查询数据字典完成的, 这意味着将耗费更多的时间.

5.减少访问数据库的次数

当执行每条SQL语句时, ORACLE在内部执行了许多工作: 解析SQL语句, 估算索引的利用率, 绑定变量 , 读数据块等等. 由此可见, 减少访问数据库的次数 , 就能实际上减少ORACLE的工作量.

方法1 (低效)

SELECT EMP_NAME , SALARY , GRADE 
   FROM EMP 
   WHERE EMP_NO = 342; 
   SELECT EMP_NAME , SALARY , GRADE 
   FROM EMP 
   WHERE EMP_NO = 291; 

方法2 (高效)

SELECT A.EMP_NAME , A.SALARY , A.GRADE, 
       B.EMP_NAME , B.SALARY , B.GRADE 
   FROM EMP A,EMP B 
   WHERE A.EMP_NO = 342 
   AND  B.EMP_NO = 291; 

6.删除重复记录

最高效的删除重复记录方法 ( 因为使用了ROWID)

DELETE FROM EMP E 
WHERE E.ROWID > (SELECT MIN(X.ROWID) 
          FROM EMP X 
          WHERE X.EMP_NO = E.EMP_NO); 

7.用TRUNCATE替代DELETE

当删除表中的记录时,在通常情况下, 回滚段(rollback segments ) 用来存放可以被恢复的信息. 如果你没有COMMIT事务,ORACLE会将数据恢复到删除之前的状态(准确地说是恢复到执行删除命令之前的状况),而当运用TRUNCATE时, 回滚段不再存放任何可被恢复的信息.当命令运行后,数据不能被恢复.因此很少的资源被调用,执行时间也会很短.

8.尽量多使用COMMIT

只要有可能,在程序中尽量多使用COMMIT, 这样程序的性能得到提高,需求也会因为COMMIT所释放的资源而减少:

COMMIT所释放的资源:

a.  回滚段上用于恢复数据的信息.

b.  被程序语句获得的锁

c.  redo log buffer 中的空间

d.  ORACLE为管理上述3种资源中的内部花费(在使用COMMIT时必须要注意到事务的完整性,现实中效率和事务完整性往往是鱼和熊掌不可得兼)

9.减少对表的查询

在含有子查询的SQL语句中,要特别注意减少对表的查询.

例如:

低效:

SELECT TAB_NAME 
      FROM TABLES 
      WHERE TAB_NAME = ( SELECT TAB_NAME 
                 FROM TAB_COLUMNS 
                 WHERE VERSION = 604) 
      AND DB_VER= ( SELECT DB_VER 
              FROM TAB_COLUMNS 
              WHERE VERSION = 604 

高效:

SELECT TAB_NAME 
      FROM TABLES 
      WHERE  (TAB_NAME,DB_VER) 
= ( SELECT TAB_NAME,DB_VER) 
          FROM TAB_COLUMNS 
          WHERE VERSION = 604) 


Update 多个Column 例子:

低效:

UPDATE EMP 
      SET EMP_CAT = (SELECT MAX(CATEGORY) FROM EMP_CATEGORIES), 
        SAL_RANGE = (SELECT MAX(SAL_RANGE) FROM EMP_CATEGORIES) 
      WHERE EMP_DEPT = 0020; 

高效:

UPDATE EMP 
      SET (EMP_CAT, SAL_RANGE) 
= (SELECT MAX(CATEGORY) , MAX(SAL_RANGE) 
FROM EMP_CATEGORIES) 
      WHERE EMP_DEPT = 0020; 

10.用EXISTS替代IN,用NOT EXISTS替代NOT IN

在许多基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接.在这种情况下, 使用EXISTS(或NOT EXISTS)通常将提高查询的效率.

低效:

SELECT * 
FROM EMP (基础表) 
WHERE EMPNO > 0 
AND DEPTNO IN (SELECT DEPTNO 
FROM DEPT 
WHERE LOC = ‘MELB') 

高效:

SELECT * 
FROM EMP (基础表) 
WHERE EMPNO > 0 
AND EXISTS (SELECT ‘X' 
FROM DEPT 
WHERE DEPT.DEPTNO = EMP.DEPTNO 
AND LOC = ‘MELB') 

(相对来说,用NOT EXISTS替换NOT IN 将更显著地提高效率)

在子查询中,NOT IN子句将执行一个内部的排序和合并. 无论在哪种情况下,NOT IN都是最低效的 (因为它对子查询中的表执行了一个全表遍历).   为了避免使用NOT IN ,我们可以把它改写成外连接(Outer Joins)或NOT EXISTS.

例如:

SELECT … 
FROM EMP 
WHERE DEPT_NO NOT IN (SELECT DEPT_NO 
             FROM DEPT 
             WHERE DEPT_CAT='A'); 

为了提高效率.改写为:

(方法一: 高效)

SELECT …. 
FROM EMP A,DEPT B 
WHERE A.DEPT_NO = B.DEPT(+) 
AND B.DEPT_NO IS NULL 
AND B.DEPT_CAT(+) = 'A' 

(方法二: 最高效)

SELECT …. 
FROM EMP E 
WHERE NOT EXISTS (SELECT 'X' 
           FROM DEPT D 
           WHERE D.DEPT_NO = E.DEPT_NO 
           AND DEPT_CAT = 'A'); 

当然,最高效率的方法是有表关联.直接两表关系对联的速度是最快的!

11.识别'低效执行'的SQL语句

用下列SQL工具找出低效SQL:

SELECT EXECUTIONS , DISK_READS, BUFFER_GETS, 
     ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio, 
     ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run, 
     SQL_TEXT 
FROM  V$SQLAREA 
WHERE  EXECUTIONS>0 
AND   BUFFER_GETS > 0 
AND (BUFFER_GETS-DISK_READS)/BUFFER_GETS < 0.8 
ORDER BY 4 DESC; 

(虽然目前各种关于SQL优化的图形化工具层出不穷,但是写出自己的SQL工具来解决问题始终是一个最好的方法)

以上就是SQL Server多表查询优化方案的相关知识,希望本次的介绍能够对你有所收获!

相关文章

  • 一个简单的SQL 行列转换语句

    一个简单的SQL 行列转换语句

    在数据库开发中经常会遇到行列转换的问题,比如下面的问题,部门,员工和员工类型三张表,我们要统计类似这样的列表
    2009-08-08
  • 实例学习mssql存储过程分析

    实例学习mssql存储过程分析

    以下我来具体举三个例子说明存储过程的3个主要用法吧:
    2008-07-07
  • SQL Server作业报错特殊案例分析

    SQL Server作业报错特殊案例分析

    这篇文章主要给大家介绍了关于SQL Server作业报错特殊案例的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者使用SQL Server具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-03-03
  • 简单介绍SQL Server中的自旋锁

    简单介绍SQL Server中的自旋锁

    本文主要分为两大部分,第1部分讨论了为什么SQL Server需要实现自旋锁,第2部分讨论了对SQL Server的自旋锁如何进行故障排除,需要的朋友可以参考下
    2015-07-07
  • SQL Server 2012 创建定时作业(图文并茂,教你轻松快速创建)

    SQL Server 2012 创建定时作业(图文并茂,教你轻松快速创建)

    这篇文章主要介绍了SQL Server 2012 创建定时作业,图文并茂,教你轻松快速创建,需要的朋友可以参考下
    2015-01-01
  • 深入SQL Cursor基本用法的详细介绍

    深入SQL Cursor基本用法的详细介绍

    本篇文章是对SQL Cursor的基本用法进行了详细的分析介绍,需要的朋友参考下
    2013-06-06
  • sql 取两值之间的数据方法(例:100-200之间的数据)

    sql 取两值之间的数据方法(例:100-200之间的数据)

    这里只列举3种我测试的方法,还有别的方案就由高手补上了,3种方案的效率也不竞相同,我一直认为not in效率不好,但在这里使用not in速度最快,请高手补充说明,谢谢
    2010-05-05
  • SQL Server全文检索查询浅析

    SQL Server全文检索查询浅析

    因为项目需要,需要对上传的文件内容进行查询。通过MSDN了解到Windows索引服务可以实现对文件的全文检索,并可以通过SQL Server进行查询。项目将这两者结合,实现对上传文件的全文检索的解决方案。
    2009-11-11
  • SqlServer中根据某几列获取重复的数据将其删除并保留最新一条

    SqlServer中根据某几列获取重复的数据将其删除并保留最新一条

    有时候,我们某个数据表中,可能有几列的数据都是一样的,此时我们可能想查询出这几列数据相同的所有数据行,并保留最新一条,将其他重复的数据删除,这篇文章主要介绍了SqlServer中根据某几列获取重复的数据将其删除并保留最新一条,感兴趣的朋友一起看看吧
    2024-04-04
  • SQL Server远程连接的设置步骤(图文)

    SQL Server远程连接的设置步骤(图文)

    Sql Server 数据库之间如何进行跨网远程连接,本文就介绍SQL Server远程连接的设置步骤,文中根据图文详细介绍的十分详尽,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-03-03

最新评论