Pandas 2.1发布更新功能介绍

更新时间：2023年09月01日 10:52:44 作者：Deephub

这篇文章主要为大家介绍了Pandas 2.1发布更新功能介绍,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

引言

2023年3月1日，Pandas 发布了2.0版本。6个月后（8月30日），更新了新的2.1版。让我们看看他有什么重要的更新。

更好的PyArrow支持

PyArrow是在Panda 2.0中新加入的后端，对于大数据来说提供了优于NumPy的性能。Pandas 2.1增强了对PyArrow的支持。官方在这次更新中使用最大的高亮字体宣布 PyArrow 将是 Pandas 3.0的基础依赖，这说明Panda 是认定了PyArrow了。

映射所有数组类型时可以忽略NaN类值

在以前版本，可空类型上调用map会在存在类似nan的值时触发错误。而现在可以设定na_action= " ignore "参数，将忽略所有类型数组中的nan值。

以下是发行说明中的一个例子:

 In [5]: ser = pd.Series(["a", "b", np.nan], dtype="category")
 In [6]: ser.map(str.upper, na_action="ignore")
 Out[6]: 
 0      A
 1      B
 2    NaN
 dtype: category
 Categories (2, object): ['A', 'B']
 ##no errors !

字符串的默认类型

默认情况下，所有字符串都存储在具有NumPy对象dtype的列中，如果你安装了PyArrow，则会将所有字符串推断为PyArrow支持的字符串，这个选项需要使用这个参数设置：

pd.options.future.infer_string = True

Copy-On-Write改进

写时复制在很久以前就出现了。在Pandas中有时你对数据做一些操作，修改的不是数据源的副本，而是数据源本身。例子:

 In [5]: pd.options.mode.copy_on_write = True
 In [6]: df = pd.DataFrame({"foo": [1, 2, 3], "bar": [4, 5, 6]})
 In [7]: subset = df["foo"]
 In [8]: subset.iloc[0] = 100
 In [9]: df
 Out[9]: 
    foo  bar
 0    1    4
 1    2    5
 2    3    6

写时复制是一种防止意外可变性的机制。当从其他数据推断数据时，可以保证只更改副本。这意味着代码将更加统一。Pandas将识别何时复制对象，并且只在必要时复制对象。在Pandas 2.1中，花了很多精力使许多地方的Copy-On-Write保持一致。

新的日期方法

在Pandas 2.1中，增加了一组新处理日期的新方法。

以下是一些最值得注意的方法:

Series.dt.is_month_start,
Series.dt.is_month_end,
Series.dt.is_year_start,
Series.dt.is_year_end,
Series.dt.is_quarter_start,
Series.dt.is_quarter_end,
Series.dt.days_in_month,
Series.dt.unit,
Series.dt.normalize,
Series.dt.day_name(),
Series.dt.month_name(),

这些方法对我们实际应用来说还是很好的

Python 3.9

pandas 2.1.0支持的最低版本是Python 3.9，也就是说我们如果有低版本的Python项目，要尽快升级了，或者说新项目的话最低也要3.9了

总结

在这次更新中提到了Pandas3.0，说明官方已经开始对它进行设计了，而且也强调了PyArrow的重要性，所以要用好Pandas，PyArrow的基础是需要掌握的。

以上就是Pandas 2.1发布更新功能介绍的详细内容，更多关于Pandas 2.1发布更新的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

pytorch 彩色图像转灰度图像实例
今天小编就为大家分享一篇pytorch 彩色图像转灰度图像实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-01-01
Python通过90行代码搭建一个音乐搜索工具
这篇文章主要介绍了Python通过90行代码搭建一个音乐搜索工具,需要的朋友可以参考下
2015-07-07
python中如何使用朴素贝叶斯算法
本文主要介绍了python中如何使用朴素贝叶斯算法的相关知识。具有很好的参考价值。下面跟着小编一起来看下吧
2017-04-04
django_orm查询性能优化方法
这篇文章主要介绍了django_orm查询性能优化方法，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2018-08-08
python目标检测yolo2详解及预测代码复现
这篇文章主要为大家介绍了python目标检测yolo2详解及其预测代码复现，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2022-05-05
Django发送html邮件的方法
这篇文章主要介绍了Django发送html邮件的方法,涉及Django框架操作邮件的相关技巧,需要的朋友可以参考下
2015-05-05
python基础编程小实例之计算圆的面积
Python是最常用的编程语言,这种语言就是一种可以快速开发应用的解释型语言,有些用户不知道该怎么在Python编程里计算圆的面积,现在就给大家具体解释一下,下面这篇文章主要给大家介绍了关于python基础编程小实例之计算圆的面积的相关资料,需要的朋友可以参考下
2023-03-03
python TKinter获取文本框内容的方法
今天小编就为大家分享一篇python TKinter获取文本框内容的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-10-10
Python如何基于selenium实现自动登录博客园
这篇文章主要介绍了Python如何基于selenium实现自动登录博客园,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2019-12-12
Python实现socket非阻塞通讯功能示例
这篇文章主要介绍了Python实现socket非阻塞通讯功能,结合实例形式分析了Python使用socket模块进行非阻塞通讯的原理、多线程及客户端、服务器端相关实现技巧,需要的朋友可以参考下
2019-11-11