Pandas数据合并的两种实现方法

 更新时间:2023年11月26日 10:42:24   作者:GarsonW  
本文主要介绍了Pandas数据合并的两种实现方法,DataFrame数据合并主要使用merge()方法和concat()方法,具有一定的参考价值,感兴趣的可以了解一下

DataFrame数据合并主要使用merge()方法和concat()方法。

1.数据合并(merge()方法)

Pandas模块的merge()进行数据合并时,两个DataFrame对象必须有相同的列。

1.常规合并

import pandas as pd

df1 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '语文':[110,105,109],
                    '数学':[105,88,120],
                    '英语':[99,115,130]})

df2 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '体育':[34.5,39.7,38]})

df_merge=pd.merge(df1,df2,on='编号')
print(df_merge)

该示例中,编号是相同的,所以会将df2中“体育”作为新的一列加入到df1中。 

2.通过索引合并

import pandas as pd

df1 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '语文':[110,105,109],
                    '数学':[105,88,120],
                    '英语':[99,115,130]})

df2 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '体育':[34.5,39.7,38]})

df_merge=pd.merge(df1,df2,left_index=True,right_index=True)
print(df_merge)

3.对合并数据去重

使用到how属性,就是让df1保留所有的行列数据,df2则根据df1的行列进行补全。

import pandas as pd

df1 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '语文':[110,105,109],
                    '数学':[105,88,120],
                    '英语':[99,115,130]})

df2 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '体育':[34.5,39.7,38]})

df_merge=pd.merge(df1,df2,on='编号',left_index=True,right_index=True)
print(df_merge)
df_merge=pd.merge(df1,df2,on='编号',how='left')
print(df_merge)

4.多对一的数据合并

根据共有列中的数据进行合并,df2根据df1的行列进行补全。

import pandas as pd

df1 = pd.DataFrame({'编号':['mr001','mr002','mr003'],
                    '学生姓名':['明日同学','高猿员','钱多多']})

df2 = pd.DataFrame({'编号':['mr001','mr001','mr003'],
                    '语文':[110,105,109],
                    '数学':[105,88,120],
                    '英语':[99,115,130],
                    '时间':['1月','2月','1月']})

df_merge=pd.merge(df1,df2,on='编号')
print(df_merge)

5.多对多的数据合并

根据共有列中的数据进行合并,df2,df1相互补全。

import pandas as pd

df1 = pd.DataFrame({'编号':['mr001','mr002','mr003','mr001','mr001'],
                    '体育':[34.5,39.7,38,33,35]})

df2 = pd.DataFrame({'编号':['mr001','mr002','mr003','mr003','mr003'],
                    '语文':[110,105,109,110,108],
                    '数学':[105,88,120,123,119],
                    '英语':[99,115,130,109,128]})

df_merge=pd.merge(df1,df2)
print(df_merge)

2.数据合并(concat()方法)

1.相同字段的表首尾相连

dfs = [df1,df2,df3]
result = pd.concat(dfs)

如果需要标记源数据来自于哪张表,可以使用:

result = pd.concat(dfs, keys=['第一张表','第二张表','第三张表']) 

2.横向表合并(行对齐)

用于数据列名不一致,缺失的数据使用Nan填充 。其中axis=1代表行合并。

result = pd.concat([df1,df4],axis=1)

3.交叉合并

交叉合并需要加上join参数,如值为inner,结果为两张表的交集;如果值为outer,结果为两张表的并集。 

result = pd.concat([df1,df4],axis=1,join='inner')

4.指定表对其数据(行对齐)

如果指定参数join_axes,就可以指定根据哪张表来对齐数据。如下述代码,根据df4表对其,结果表的行术和df4的行术一致,在此基础上拼接df1表。

result = pd.concat([df1,df4],axis=1,join_axes[df4.index])

到此这篇关于Pandas数据合并的两种实现方法的文章就介绍到这了,更多相关Pandas数据合并内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python使用筛选法计算小于给定数字的所有素数

    python使用筛选法计算小于给定数字的所有素数

    这篇文章主要为大家详细介绍了python使用筛选法计算小于给定数字的所有素数,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03
  • Python YAML文件的读写操作详解

    Python YAML文件的读写操作详解

    这篇文章主要介绍了Python读写yaml文件,yaml 是专门用来写配置文件的语言,非常简洁和强大,之前用ini也能写配置文件,有点类似于json格式,下面关于Python读写yaml文件的详细资料,需要的小伙伴可以参考一下
    2022-08-08
  • python爬取网页数据到保存到csv

    python爬取网页数据到保存到csv

    大家好,本篇文章主要讲的是python爬取网页数据到保存到csv,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下,方便下次浏览
    2022-01-01
  • MATLAB如何利用散点进行函数曲线拟合

    MATLAB如何利用散点进行函数曲线拟合

    这篇文章主要介绍了MATLAB如何利用散点进行函数曲线拟合问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-11-11
  • Dropout 正则化对抗 过拟合

    Dropout 正则化对抗 过拟合

    这篇文章主要为大家介绍了 Dropout 正则化对抗 过拟合重要性及应用详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-03-03
  • Python 跨文件夹导入自定义包的实现

    Python 跨文件夹导入自定义包的实现

    有时我们自己编写一些模块时,跨文件夹调用会出现ModuleNotFoundError: No module named 'XXX',本文就来介绍一下解决方法,感兴趣的可以了解一下
    2023-11-11
  • Python try-except-else-finally的具体使用

    Python try-except-else-finally的具体使用

    本文主要介绍了Python try-except-else-finally的具体使用,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-08-08
  • 一文带你安装opencv与常用库(保姆级教程)

    一文带你安装opencv与常用库(保姆级教程)

    Python OpenCV是一种流行的计算机视觉库,使用它可以进行图像处理、视频处理等操作,下面这篇文章主要给大家介绍了关于安装opencv与常用库的相关资料,需要的朋友可以参考下
    2023-05-05
  • python 实现百度网盘非会员上传超过500个文件的方法

    python 实现百度网盘非会员上传超过500个文件的方法

    这篇文章主要介绍了python 实现百度网盘非会员上传超过500个文件的方法,帮助大家更好的利用python解决问题,感兴趣的朋友可以了解下
    2021-01-01
  • Python中def()函数的实战练习题

    Python中def()函数的实战练习题

    def是define的缩写,用来自定义函数,下面这篇文章主要给大家介绍了关于Python中def()函数的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
    2022-07-07

最新评论