浅谈mysql的timestamp存在的时区问题
简介
众所周知,mysql中有两个时间类型,timestamp与datetime,但当在网上搜索timestamp与datetime区别时,会发现网上有不少与时区有关的完全相反的结论,主要两种:
timestamp没有时区问题,而datetime有时区问题,原因是timestamp是以UTC格式存储的,而datetime存储类似于时间字符串的形式,示例博文:MySQL 中 datetime 和 timestamp 的区别与选择timestamp也有时区问题,示例博文:mysql中timestamp时区的问题
两种观点让人迷惑,那timestamp到底会不会有时区问题呢?
答:因为mysql数据库未指定所在时区默认为美国中部时间
(UTC-06:00),美国从“3月11日”至“11月7日”实行夏令时,美国中部时间改为 UTC-05:00,与 UTC+08:00 相差 13 小时,冬令时则相差14个小时。所以存储的时候时间就已经有“误差了”。
各位小伙伴使用timestamp类型的时候一定要注意指定时区,不管是在数据库配置指定还是数据库连接的参数设置,一定要指定时区。
serverTimezone=Asia/Shanghai show variables like ‘%time_zone%'; set time_zone='+08:00'; select now();
基本概念
时区:
由于地域的限制,人们发明了时区的概念,用来适应人们在时间感受上的差异,比如中国的时区是东8区,表示为+8:00
,或GMT+8
,而日本的时区是东9区,表示为+9:00
,或GMT+9
,当中国是早上8点时,日本是早上9点,即东8区的8点与东9区的9点,这两个时间是相等的。
另外时间还有如下两个概念:
绝对时间:
如unix时间缀,是1970-01-01 00:00:00
开始到现在的秒数,如:1582416000
,这种表示是绝对时间,不受时区影响,也叫纪元时epoch。
本地时间:
相对于某一时区的时间,是本地时间,比如东8区的2020-02-23 08:00:00
,是中国人的本地时间,而在此时,日本人的本地时间是2020-02-23 09:00:00
,所以本地时间都是与某一时区相关的,脱离时区看本地时间,是没有意义的,因为你并不知道这具体是指的什么时间点。
比如在Java中,Date
对象是绝对时间,通过SimpleDateFormat
格式化出来的yyyy-MM-dd HH:mm:ss形式的时间字符串,是本地时间,如果SimpleDateFormat
没有调用setTimeZone()
显示指定时区,那么默认用的是jvm运行在的操作系统上的时区,我们开发机上的时区基本都是GMT+8
。
timestamp与datetime区别
如下,我创建了一张表,里面time_stamp是timestamp类型,date_time是datetime类型,create_timestamp、create_datetime是timestamp与datetime类型,但是它们可以由数据库自动生成。
CREATE TABLE `time_test` ( `id` bigint unsigned, `time_stamp` timestamp, `date_time` datetime, `create_timestamp` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间', `create_datetime` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间', PRIMARY KEY (`id`) )
1、首先将数据库时区设置为+8:00,即中国的东8区
2、然后如下手动插入一个固定时间的数据,以及用now()函数插入当前时间
3、当插入完数据后,然后我们修改当前会话的时区为+9:00
,即日本的东9区,然后再次查看数据
4、如上,定义为timestamp
类型的列time_stamp
、create_timestamp
不管是手动插入的,还是now()
函数插入的,东9区都比东8区的时间大1个小时,这是正确的,说明timestamp
类型是时区相关的,然而定义为datetime
类型的date_time
、create_datetime
字段,时间都没有变化,这说明datetime
类型是时区无关的。
结论:timestamp
在存储上是包含时区的,而datetime是不包含时区,说明网上的第一种说法是对的。
再看个例子
我们将东8区的的2020-02-23 08:00:00
转换为unix时间缀(绝对时间),再插入数据库试试?
如下,使用linux的date命令转换时间串为unix时间缀:
$ "date" --date="2020-02-23 08:00:00 +08:00" +%s 1582416000
然后用mysql的()
函数,将unix时间缀转换为mysql时间类型来插入数据。
如上,查询出来的时间,也是东9区的9点,时间也是正确的。
为什么网上又说timestamp类型存在时区问题?
我发现网上说timestamp有时区问题,都是应用端插入数据,然后到数据库中去看,结果发现时间不一样,因此我打算在Java中写个Demo试一下,看能不能重现这个问题。
1、首先,下面是Java中Entity的定义,与上面的time_test表对应,注意,这里面时间属性都是用Date类型定义的,如下:
2、然后,我写了两个接口/insert
与/queryAll
来插入与查询数据,如下:
3、然后我把数据库的时区设置为+09:00
时区,即日本的东9区,如下:
4、然后调用/insert
接口插入数据,注意我接口传入的时间是东8区的8点,如下:
5、插入完后,去数据库中查询一把,如下:
可以看到,time_stamp字段时间是9点,且我已将数据库时区设置为东9区,东9区的9点与东8区的8点,这两个时间实际是相等的,因此时间数据没错。
6、然后我使用/queryAll
接口将数据查询出来,如下:
timeStamp
属性是1582416000000
,这是毫秒级的时间缀,秒级则是1582416000
,对应是东8区的2020-02-23 08:00:00
,时间数据也没错!
7、然后我又将mysql时区修改回+8:00
,并重启我们的java应用,如下:
8、再查询一下数据,如下:
timeStamp
属性还是1582416000000
,时间没有变化,这也是正确的。
那为什么网上会说timestamp存在时区问题?
经过一翻查看,我发现他们都提到了jdbc的serverTimezone
,会不会是这个配置错误导致的呢?就先试试吧!
1、如图,我把数据库时区修改回+9:00
时区,然后故意把jdbc的url上的serverTimezone配置为与数据库不一致的GMT+8
时区,然后重启java应用,如下:
url: jdbc:mysql://localhost:3306/testdb?serverTimezone=GMT%2B8&useUnicode=true&characterEncoding=utf8
其中GMT%2B8
就是GMT+8
,因为在url上需要urlencode,所以就变成了GMT%2B8
。
2、重新插入数据,注意插入的时间还是东8区的8点,如下:
3、然后,我再到数据库中查询一把,如下:
time_stamp
中时间竟然是8点!要知道我们虽然插入的是东8区的8点,但当前会话可是东9区的,东8区的8点等于东9区的9点,所以正确显示应该为9点才对,时间差了1小时!
4、然后,我又调用/queryAll
接口查询了一把,想看看mybatis查询出来的时间数据对不对,如下:
可以看到timeStamp
是1582416000000
,秒级是1582416000
,这个时间就是东8区的8点,东9区的9点啊!查询出来的时间竟然是正确的,为什么???
serverTimezone的本质
为了找出问题所在,我调试了一下mysql的jdbc驱动代码,终于弄明白了原因,主要可以看看如下这几点:
1.mysql驱动创建连接后,会调用com.mysql.jdbc.ConnectionImpl#configureTimezone()
来配置此连接的时区,如果配置了serverTimezone,则会使用serverTimezone配置的时区,没配置时会去取数据库中的time_zone变量,这就是为什么我们没有配置serverTimezone变量时,结果也是正确的。
//若使用普通驱动,使用此方法配置mysql连接的时区 com.mysql.jdbc.ConnectionImpl#configureTimezone() //若使用cj驱动,使用此方法配置mysql连接的时区 com.mysql.cj.protocol.a.NativeProtocol#configureTimezone()
2.调用jdbc的setTimestamp()
方法时,实际调用的是com.mysql.cj.jdbc.ClientPreparedStatement#setTimestamp()
,这里面会根据serverTimezone指定的时区,将对应的Timestamp
对象转换为serverTimezone指定时区的本地时间字符串。
3.执行sql语句时,会执行com.mysql.cj.jdbc.ClientPreparedStatement#execute()
,这里面sendPacket变量保存着真实会发送到mysql的sql语句。
注:看的是8.0.11版本mysql-connector-java驱动源码,不同版本代码会稍有差异,比如5.2.16版本驱动,jdbc url上需要同时配置这两个配置:
useTimezone=true&serverTimezone=GMT%2B8
,且setTimestamp()
对应的是com.mysql.jdbc.PreparedStatement#setTimestampInternal
方法。
原理总结如下:
mysql驱动在发送sql前,会将jdbc中的Date对象参数,根据serverTimeZone配置的时区转化为日期字符串后,再发送sql请求给mysql server,同样在mysql server返回查询结果后,结果中的日期值也是日期字符串,mysql驱动会根据serverTimeZone配置的时区,将日期字符串转化为Date对象。
因此,当serverTimeZone与数据库实际时区不一致时,会发生时区转换错误,导致时间偏差,如下:
a、比如sql参数是一个Date对象,时间值是东8区的2020-02-23 08:00:00
,注意它里面存储的可不是2020-02-23 08:00:00
这个字符串,它是Date对象(绝对时间),只是我用文字表达出来是东8区的2020-02-23 08:00:00
。
b、然后,由于serverTimeZone配置的是东8区,mysql驱动会将这个Date对象转为2020-02-23 08:00:00
,注意这时已经是字符串了,然后再将sql发送给mysql,注意这里的sql里面已经将Date参数替换为2020-02-23 08:00:00
了,因为Date对象本身是无法走网络的。
c、然后mysql数据库接收到这个时间字符串2020-02-23 08:00:00
后,由于数据库时区配置是东9区,它会认为这个时间是东9区的,它会以东9区解析这个时间字符串,这时数据库保存的时间是东9区的2020-02-23 08:00:00
,也就是东8区的2020-02-23 07:00:00
,保存的时间就偏差了1个小时。
d、查询结果里时间为什么又对了呢,因为查询结果返回了东9区的时间字符串,而java应用又将其理解为是东8区的时间,负负得正了!
将serverTimezone与mysql时区保持一致
so,那么如果我们将serverTimezone配置改正确,即与数据库保持一致时,应该查询到的时间就会是错的,会少1个小时。
1、jdbc url中使用与数据库一样的东9区GMT+9
,如下:
url: jdbc:mysql://localhost:3306/testdb?serverTimezone=GMT%2B9&useUnicode=true&characterEncoding=utf8
其中的GMT%2B9
,即是GMT+9
。
2、然后重启Java应用,再查询一把看看,如下:
返回的是毫秒级时间缀1582412400000
,秒级就是1582412400
,使用linux的date命令转换为时间字符串形式:
$ "date" --date="@1582412400" +"%F %T %z" 2020-02-23 07:00:00 +0800
看到没,它是东8区的7点,刚好差了1个小时。
3、所以,使用mysql的timestamp类型时,对于java应用来说,一定要保证jdbc url中的serverTimezone与数据库中的时区配置是一致的。
另外一点是,当没有配置serverTimezone时,mysql驱动会自动读取mysql server中配置的时区,这里面也有坑!如下:
mysql驱动自动读取数据库时区的坑
3.1 mysql安装好后,默认时区是SYSTEM
,而SYSTEM
指的是system_time_zone
变量的时区,如下:
3.2 当mysql驱动读到time_zone变量是SYSTEM
时,会再去读取system_time_zone
变量,而system_time_zone
对于国内来说,默认是CST
,这是一个混乱的时区,是4个不同时区的缩写,如下:
对于Linux或MySQL,会认为CST是中国标准时间(+8:00),但Java却认为CST是美国标准时间(-6:00)(注:可能和Java运行在Windows中有关):
如下,linux中CST等于+0800
,即中国时区:
$ "date" +"%F %T %Z %z" 2021-09-12 18:35:49 CST +0800
如下,java中CST等于-06:00
,美国时区:
3.3 因此mysql驱动取到CST这个时区值时,它会以为这是-6:00
时区,但MySQL却理解为+8:00
时区,因此MySQL时区一定不要配置为CST,而要配置为具体的时区,如+8:00
,但如果MySQL时区为CST且不可修改的情况下,一定要配置jdbc的serverTimezone为清晰的时区(如:GMT+8
)。
Entity中日期属性是String呢?
1、我们将Entity对象中的时间属性改为String(不推荐),如下:
2、然后也写两个接口,/insert2
与/queryAll2
,如下:
3、然后插入数据,注意这时我是直接将无时区的8点,作为参数给到sql的,如下:
4、然后再查询一把,如下:
如上所示,time_stamp字段值是8点,但此时数据库时区是东9区,所以这是东9区的8点。
5、然后我将数据库与jdbc中serverTimezone都改为东8区呢,改完后重启Java应用,如下:
url: jdbc:mysql://localhost:3306/testdb?serverTimezone=GMT%2B8&useUnicode=true&characterEncoding=utf8
6、再次插入数据,参数还是无时区的8点,如下:
7、再查询一把,如下:
如上所示,time_stamp字段值是8点,但现在数据库时间是东8区,所以这是东8区的8点。
8、然后我再将jdbc url上的serverTimezone调整为东9区,然后重启Java应用,如下:
url: jdbc:mysql://localhost:3306/testdb?serverTimezone=GMT%2B9&useUnicode=true&characterEncoding=utf8
现在serverTimezone与数据库中不一致,数据库是东8区,serverTimezone是东9区。
9、我们再次插入无时区的8点,如下:
10、然后再查询一把,如下:
time_stamp字段值还是8点,数据库是东8区,所以这是东8区的8点,但我们serverTimezone与数据库的时区不一致啊,没看到时间有偏差,为什么?
解释一下
前面说过了,对于jdbc中的Date对象,在发送给mysql前,会先根据serverTimezone转换为相应时区的时间字符串,但现在Entity中时间属性是String类型,mysql驱动不会进行转换,所以不管serverTimezone怎么配置,对String类型的时间串都没影响。
这样的话,似乎java中日期类型用时间字符串来存还好些,不容易出错,但请再认真考虑一下,调用方传了一个无时区的8点,数据库自作主张,就将其认为是东9区的8点,但如果这个时间字符串实际是东8区的8点呢?这时如果保存到数据库中为东9区的8点,那数据就存错了!
那如果目前api接口就传的无时区的时间串,Entity中就定义的String,怎么解决呢?
1、询问接口定义人员,这个接口的时间串指的是哪个时区的,比如是东8区的2020-02-23 08:00:00。
2、然后接口接收到时间后,要以东8区将时间字符串转换为Date对象,如下:
SimpleDateFormat sdf = new SimpleDateFormat('yyyy-MM-dd HH:mm:ss'); sdf.setTimeZone(TimeZone.getTimeZone("GMT+8")); Date date = sdf.parse("2020-02-23 08:00:00");
3、然后如果Entity中时间属性定义的是String,那么我们要再将Date对象以数据库的时区格式化为对应的时间字符串,比如数据库时区是东9区,那么格式化后就是2020-02-23 09:00:00
,如下:
SimpleDateFormat sdf = new SimpleDateFormat('yyyy-MM-dd HH:mm:ss'); sdf.setTimeZone(TimeZone.getTimeZone("GMT+9")); String dateStr = sdf.format(date); entity.setTimeStamp(dateStr);
4、然后将Entity保存到mysql中的,就也会是东9区的2020-02-23 09:00:00,结果正确。
所以,使用String类型来存储时间数据,要想将时间值保存正确,超级麻烦,不建议在实际开发中这种使用。
最佳实践
1、大多数团队会规定api中传递时间要用unix时间缀,因为如果你传一个2020-02-23 08:00:00
时间值,它到底是哪个时区的8点呢?对于unix时间缀,就不会有此问题,因为它是绝对时间。而如果某些特殊原因,一定要使用时间字符串,最好使用ISO8601
规范那种带时区的时间串,比如:2020-02-23T08:00:00+08:00
。
2、Mybatis中Entity定义要与数据库定义一致,数据库中是timestamp,那么Entity中要定义为Date对象,因为mysql驱动在执行sql时,会自动根据serverTimezone配置帮你转换为数据库时区的时间串,如果你自己来转换,你极有可能因为忘记调用setTimeZone()
方法,而使用当前java应用所在机器的默认时区,一旦java应用所在机器的时区与数据库的时区不一致,就会出现时区问题。
3、jdbc的serverTimezone参数,要配置正确,当不配置时,mysql驱动会自动读取mysql server的时区,此时一定要将mysql server的时区指定为清晰的时区(如:+08:00
),切勿使用CST。
4、如果数据库时区修改后,jdbc的serverTimezone也要跟着修改,并重启Java应用,就算没有配置serverTimezone,也需要重启,因为mysql驱动初始化连接时,会将当前数据库时区缓存到一个java变量中,不重启Java应用它不会变。
数据库中用timestamp还是int来存储时间?
如果用int型时间缀存储,不管数据库时区是啥,都不影响,因为存储的是绝对时间,看起来完美解决了时区问题。
但从某些角度看,这种方案只是把时区问题从数据库端推到应用端去了,时区问题将出现在将时间字符串转换为时间缀的过程中,比如某程序员从api接口中拿到时间字符串后,没考虑时区,直接转为unix时间缀,就可能出现时区问题。
因此,对于不带时区的时间串解析,一定要问清楚这是哪个时区的时间,并在代码中显式指定!
另外,用int存储时间还有如下3个不好的点:
开发人员看到这个字段后,无法一目了然的了解到这个时间缀大概是个什么时间,需要去转换一下,会很繁琐。像update_time
这样的字段,数据库提供了DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP
的机制,这样在更新任何字段时,update_time
会自动更新,而如果使用int存储,就需要程序员每次更新表时,重新set这个字段,容易遗忘。由于int只有4个字节,用它来存储时间,会在2038年后溢出,而对于timestamp来说,MySQL将其底层存储统一修改为8个字节,相对来说还是比较容易的。
当然,也并不是建议不用int,这是见仁见智的,不管用timestamp还是int,都没有致命性问题的。
总结
timestamp本身是没有时区问题的,时区问题是由于serverTimezone配置错误、mysql使用CST这种混乱时区或Entity中将日期定义String类型导致的。
到此这篇关于浅谈mysql的timestamp存在的时区问题的文章就介绍到这了,更多相关mysql timestamp时区问题内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
最新评论