为什么你不要收缩数据库文件(国外翻译)

更新时间：2018年03月15日 20:30:35 作者：潇湘隐者博客

这几天查看了很多关于SQL SERVER收缩数据文件方面的文章，准备写一篇关于收缩日志方面的文章，但是突然有种冲动将看过经典的文章翻译出来,需要的朋友可以参考下

前言，这几天查看了很多关于SQL SERVER收缩数据文件方面的文章，准备写一篇关于收缩日志方面的文章，但是突然有种冲动将看过经典的文章翻译出来，下面这篇文章是翻译的是Paul Randal – “Why You Should Not Shrink Your Data Files”。有些比较难以翻译、清晰的地方，我会贴上原文。好了，不啰嗦了，直接看下面的翻译吧。

我最大的一个热点问题是关于收缩数据文件，虽然在微软的时候，我自己写了相关收缩数据文件代码，我再也没有机会去重写它，让它操作起来更方便。我真的不喜欢收缩。

现在，不要混淆了收缩事务日志文件和收缩数据文件，当事务日志文件的增长失控或为了移除过多的VLF碎片（这里和这里看到金佰利的优秀文章），然而，收缩事务日志数据文件不要频繁使用（罕见的操作）并且不应是你执行定期维护计划的一部分。

收缩数据文件应该执行得甚至更少。这就是为什么——数据文件收缩导致产生了大量索引碎片，让我用一个简单并且你可以运行的脚步来演示。下面的脚本将会创建一个数据文件，创建一个10MB大小的“filler”表，一个10MB大小的“production”聚簇索引，然后分析新建的聚集索引的碎片情况。

USE [master];
GO
 
IF DATABASEPROPERTYEX(N'DBMaint2008', N'Version') IS NOT NULL
  DROP DATABASE [DBMaint2008];
GO
 
CREATE DATABASE DBMaint2008;
GO
USE [DBMaint2008];
GO
 
SET NOCOUNT ON;
GO
 
-- Create the 10MB filler table at the 'front' of the data file
CREATE TABLE [FillerTable](
  [c1] INT IDENTITY,
  [c2] CHAR (8000) DEFAULT 'filler');
GO
 
-- Fill up the filler table
INSERT INTO [FillerTable] DEFAULT VALUES;
GO 1280
 
-- Create the production table, which will be 'after' the filler table in the data file
CREATE TABLE [ProdTable](
  [c1] INT IDENTITY,
  [c2] CHAR (8000) DEFAULT 'production');
CREATE CLUSTERED INDEX [prod_cl] ON [ProdTable]([c1]);
GO
 
INSERT INTO [ProdTable] DEFAULT VALUES;
GO 1280
 
-- Check the fragmentation of the production table
SELECT
  [avg_fragmentation_in_percent]
FROM sys.dm_db_index_physical_stats(
  DB_ID(N'DBMaint2008'), OBJECT_ID(N'ProdTable'), 1, NULL, 'LIMITED');
GO

执行结果如下

clipboard

聚集索引的逻辑碎片在收缩数据文件前大约接近0.4%。[但是我测试结果是0.54%，如上图所示,不过也算是接近0.4%]

现在我删除filter表，运行收缩数据文件命令后，重新分析聚集索引的碎片化。

-- Drop the filler table, creating 10MB of free space at the 'front' of the data file
DROP TABLE [FillerTable];
GO
 
-- Shrink the database
DBCC SHRINKDATABASE([DBMaint2008]);
GO
 
-- Check the index fragmentation again
SELECT
  [avg_fragmentation_in_percent]
FROM sys.dm_db_index_physical_stats(
  DB_ID(N'DBMaint2008'), OBJECT_ID(N'ProdTable'), 1, NULL, 'LIMITED');
GO

下面是我的执行结果，作者执行结果，请看原文：

原文：

Wow! After the shrink, the logical fragmentation is almost 100%. The shrink operation *completely* fragmented the index, removing any chance of efficient range scans on it by ensuring the all range-scan readahead I/Os will be single-page I/Os.

译文：

哇，真是恐怖！数据文件收缩后，索引的逻辑碎片几乎接近100%，收缩数据文件导致了索引的完全碎片化。消除了任何关于它的有效范围扫描的机会，确保所有执行提前读范围扫描的 I/O 在单页的 I/O操作
为什么会这样呢？当单个数据文件收缩操作一次后，它会用GAM位图索引找出数据文件中分配最高的页，然后尽可能的向前移动到文件能够移动的地方，就这样子，在上面的例子中，它完全反转了聚集索引，让它从非碎片化到完全碎片化。
同样的代码用于DBCC SHRINKFILE， DBCC SHRINKDATABASE，以及自动收缩，他们同样糟糕，就像索引的碎片化，数据文件的收缩同样产生了大量的I/O操作，耗费大量的CPU资源，并且生成了*load*事务日志，因为任何操作都会全部记录下来。
数据文件收缩决不能作为定期维护的一部分，你决不能启用“自动收缩”属性，我尝试把它从SQL 2005和SQL 2008产品中移除，它还存在的唯一原因是为了更好的向前兼容，不要掉入这样的陷阱：创建一个维护计划，重新生成所有索引，然后尝试回收重建索引耗费的空间采取收缩数据文件 — — 这就是你做的生成了大量事务日志，但实质没有提高性能的零和游戏。
所以，你为什么要运行一个收缩呢，？举例来说，如果你把一个相当大的数据库删除了相当大的比例，该数据库不太可能增长，或者你需要转移一个数据库文件前先清空数据文件？

译文：

我很想推荐的方法如下：

创建一个新的文件组
将所有受影响的表和索引移动到一个新的文件组用CREATE INDEX ... WITH (DROP_EXISTING=ON)的脚本，在移动表的同时，删除表中的碎片。
删掉那些你准备收缩的旧文件组，你反正要收缩（或缩小它的方式下来，如果它的主文件组）。
基本上你需要提供一些更多的空间，才可以收缩的旧文件，但它是一个更清晰的设置。

原文：

The method I like to recommend is as follows:

Create a new filegroup
Move all affected tables and indexes into the new filegroup using the CREATE INDEX … WITH (DROP_EXISTING = ON) ON syntax, to move the tables and remove fragmentation from them at the same time
Drop the old filegroup that you were going to shrink anyway (or shrink it way down if its the primary filegroup)
Basically you need to provision some more space before you can shrink the old files, but it's a much cleaner mechanism.

如果你完全没有选择需要收缩日志文件，请注意这个操作会导致索引的碎片化，你应该在收缩数据文件采取一些步骤消除它可能导致的性能问题，唯一的方式是用DBCC INDEXDEFPAGE或 ALTER INDEX ...REORGANIZE消除索引的碎片不要引起数据文件的增长,这些命令要求扩展空间8KB的页代替重建一个新的索引在索引重建操作中。
底线 — — 尽量避免不惜一切代价运行数据文件收缩

所以，还在用作业定期收缩数据文件或数据库开启了“自动收缩”属性的朋友们，请及时纠正你们的错误认识吧！

支持原著，也希望大家支持我辛苦的翻译劳动，请加上链接潇湘隐者博客。

不要收缩数据库

SQL注入之基于布尔的盲注详解
首先说明的盲注是注入的一种，指的是在不知道数据库返回值的情况下对数据中的内容进行猜测，实施SQL注入。盲注一般分为布尔盲注和基于时间的盲注。这篇文章主要讲解的是基于布尔的盲注。下面来一起看看吧。
2016-09-09
ACCESS转化成SQL2000需要注意的几个问题小结
ACCESS转化成SQL2000需要注意的几个问题小结...
2007-06-06
数据库建立索引的一般依据小结
以下是一些普遍的建立索引时的判断依据。一言以蔽之，索引的建立必须慎重，对每个索引的必要性都应该经过仔细分析，要有建立的依据
2012-05-05
Sql Server下数据库链接的使用方法
Sql Server下数据库链接的使用方法...
2006-12-12
Navicat for MySQL 乱码问题解决方法
这篇文章主要介绍了Navicat for MySQL 乱码问题解决方法,Navcat是Windows常用的Mysql管理软件,本文讲解它出现乱码的解决方法,需要的朋友可以参考下
2015-02-02
50条SQL查询技巧、查询语句示例
这篇文章主要介绍了50条SQL查询技巧、查询语句示例,本文以学生表、课程表、成绩表、教师表为例,讲解不同需求下的SQL语句写法,需要的朋友可以参考下
2015-06-06
Clickhouse系列之整合Hive数据仓库示例详解
这篇文章主要为大家介绍了Clickhouse系列之整合Hive数据仓库示例详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2022-10-10
数据库运维人员DBA工作总结
中大型公司都会有一些专攻数据库方面的牛人,专门的职位叫做DBA,对于公司的DBA他们的价值不可小觑,只要是数据库,就有吞吐量的限制,数据库访问瓶颈便是自然流量增长或者流量突增造成的
2023-10-10
免费开源数据库:SQLite、MySQL和PostgreSQL的优缺点
对于处理大规模数据和高并发访问的场景,MySQL和PostgreSQL更适合,SQLite在小型应用程序或嵌入式设备中是一种轻量级、简单和易于使用的选择,根据具体的应用需求和场景特点,选择合适的开源关系型数据库可以提供更好的性能、可扩展性和灵活性
2024-02-02
浅谈关系型数据库中的约束及应用场景
这篇文章主要介绍了浅谈关系型数据库中的约束及应用场景,关系型数据库是一种广泛应用的数据库类型，它的核心是基于关系模型的结构化数据存储和管理,在关系型数据库中，约束是一种重要的概念，它可以帮助我们保证数据的完整性和一致性,需要的朋友可以参考下
2023-07-07

为什么你不要收缩数据库文件(国外翻译)

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具