解决df.to_csv()中文件名的问题

 更新时间:2023年08月03日 09:32:18   作者:HealthScience  
这篇文章主要介绍了解决df.to_csv()中文件名的问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

df.to_csv()中文件名问题

下午做了一下午的拆分数据集,将具有相同母核的分子放在一个csv文件中,然后新的csv文件命名是母核的名字,然后拆分出的数据集和原始未拆分的数据集的数量总是对不上,我无语了,排查错误了很久,我快吐了,最后发现是出在了下面这一行代码上:

df_match.to_csv('drawimages/data/diffscaffold/{}.csv'.format(csv_name), index=False)

乍一看可能感觉没问题,确实也是可以存入数据,但是里面有一个坑,就是 如果现在两个母核是下面这两种的时候(这两个母核只有部分的原子大小写不一致,但是他们是不一样的),那么它只会存储其中一种(大坑)!【原因:Windows会把这两个虽然大小写不一致的文件夹认为是一种,且只能存在一种!

所以会一直导致不能存储所有的数据,总是对不上数据。。。。

O=C(NCc1ccccc1)c1c(Cc2ccccc2)sc2c1CCOC2

O=C(NCC1CCCCC1)c1c(Cc2ccccc2)sc2c1CCOC2

只需要修改代码为:

for i, core in enumerate(core_list):
    matches = []
    for j, smiles in enumerate(smiles_list):
        mol = Chem.MolFromSmiles(smiles)
        core_mol = Chem.MolFromSmiles(core)
        if mol.HasSubstructMatch(core_mol):
            matches.append(j)
    # 选取包含母核的行,并保存到一个新的csv文件中
    df_match = df.iloc[matches]
    df_match.to_csv('drawimages/data/diffscaffold/{}.csv'.format(i+1), index=False)
    print("{}.csv is done! ".format(i+1))

Pandas学习之to_csv()

用法:

df.to_csv(输出路径,参数1,参数2,,参数3...)

sep=','   #以逗号 ,作为数据的分隔符,如果分隔符不为逗号,则包含符双引号”“就会消失。分隔符为Tab时,写法如下:df.to_csv('new.csv', sep='\t')
na_rep='NA'   #确实值保存为NA,如果不写,默认是空   
shkiprows= 10   # 跳过前十行
usecols=['column1', 'column2', 'column3'] # 读取指定列
nrows = 10   # 只取前10行
chunksize=1000 # 分块大小来读取文件(每次读取多少行),不一次性把文件数据读入内存中,而是分多次
parse_dates = ['col_name']   # 指定某行读取为日期格式
index_col = ['col_1','col_2']   # 读取指定的几列
error_bad_lines = False   # 当某行数据有问题时,不报错,直接跳过,处理脏数据时使用
na_values = 'NULL'   # 将NULL识别为空值
header=0 #不保存列名
index=0   #不保存行索引
columns=['name']     #保存索引列和name列
float_format='%.2f'         #保留两位小数

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 三步解决python PermissionError: [WinError 5]拒绝访问的情况

    三步解决python PermissionError: [WinError 5]拒绝访问的情况

    这篇文章主要介绍了三步解决python PermissionError: [WinError 5]拒绝访问的情况,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • 基于python实现高速视频传输程序

    基于python实现高速视频传输程序

    这篇文章主要介绍了基于python实现高速视频传输程序的实例代码,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-05-05
  • Python构造函数与析构函数超详细分析

    Python构造函数与析构函数超详细分析

    在python之中定义一个类的时候会在类中创建一个名为__init__的函数,这个函数就叫做构造函数。它的作用就是在实例化类的时候去自动的定义一些属性和方法的值,而析构函数恰恰是一个和它相反的函数,这篇文章主要介绍了Python构造函数与析构函数
    2022-11-11
  • Python中set方法的使用教程详解

    Python中set方法的使用教程详解

    在Python中,set是一种集合数据类型,表示一个无序且不重复的集合。本文主要为大家详细介绍了Python中set方法的使用,需要的可以参考一下
    2023-04-04
  • Python结巴中文分词工具使用过程中遇到的问题及解决方法

    Python结巴中文分词工具使用过程中遇到的问题及解决方法

    这篇文章主要介绍了Python结巴中文分词工具使用过程中遇到的问题及解决方法,较为详细的讲述了Python结巴中文分词工具的下载、安装、使用方法及容易出现的问题与相应解决方法,需要的朋友可以参考下
    2017-04-04
  • Python使用QQ邮箱发送Email的方法实例

    Python使用QQ邮箱发送Email的方法实例

    实际开发过程中使用到邮箱的概率很高,那么如何借助python使用qq邮箱发送邮件呢?正好最近工作遇到这个需求,所以想着把方法分享出来方便大家,所以这篇文章主要介绍了Python使用QQ邮箱发送Email的实现方法,需要的朋友可以参考。
    2017-02-02
  • python 图片验证码代码分享

    python 图片验证码代码分享

    python 图片验证码代码分享,需要的朋友可以参考下
    2012-07-07
  • Pytorch卷积神经网络迁移学习的目标及好处

    Pytorch卷积神经网络迁移学习的目标及好处

    这篇文章主要为大家介绍了Pytorch卷积神经网络迁移学习的目标实现代码及好处介绍,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • python和pywin32实现窗口查找、遍历和点击的示例代码

    python和pywin32实现窗口查找、遍历和点击的示例代码

    这篇文章主要介绍了python和pywin32实现窗口查找、遍历和点击的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-04-04
  • Python 删除连续出现的指定字符的实例

    Python 删除连续出现的指定字符的实例

    今天小编就为大家分享一篇Python 删除连续出现的指定字符的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06

最新评论