Python中pandas库sort_values()方法的使用

 更新时间:2023年07月27日 09:50:58   作者:跳舞的皮埃尔  
最后去看了有关于 sort_values 的文档,成功解决先把单词出现频次由高往低依次排序,再把频次相同的情况下的单词按照 MD5 值排序这个问题,下面通过本文讲解下Python中pandas库sort_values()方法的使用,感兴趣的朋友一起看看吧

Python:pandas库sort_values方法的使用

1、起因

今天做到北京玛达科技有限公司2021数据处理工程师笔试题,有一题是这样:

在这里插入图片描述

按照文件中单词出现频次由高往低依次排序,这个对我来说很好实现,用上 pandas 的 sort_values 方法就手到擒来。但是他后面又加上了一个条件,如果频次相同的情况下,按照单词的 MD5 值排序。这可把我迷住了:

  • 先用sort_values方法,频次由高往低依次排,再把频次相同单独拿出来再用 MD5 排?(因为sort_values排序后,同一频次的单词顺序会改变)
  • 还是先 MD5 排,再在不改变同一频次的单词顺序情况下,频次由高往低依次排?

最后去看了有关于 sort_values 的文档,成功解决先把单词出现频次由高往低依次排序,再把频次相同的情况下的单词按照 MD5 值排序这个问题,下面我带大家回顾一下 Python pandas sort_values() 方法的使用

2、sort_values() 函数说明

pandas 库的 sort_values() 函数可以对 Dataframe 的数据集按照某个字段中的数据进行排序。该函数可以指定列数据或行数据进行排序,可以是单个,也可以是 多个(以前经常用来处理单列/行数据,忘记了 sort_values() 也可以处理多列/行数据)。 series 也有 一个 sort_values() 函数,但在参数上稍有区别。

官方文档:pandas.Series.sort_values pandas.DataFrame.sort_values

3、sort_values() 具体参数

格式如下:

DataFrame.sort_values(by=‘进行排序的列名或索引值', axis=0, ascending=True, inplace=False, kind=‘quicksort', na_position=‘last', ignore_index=False, key=None)
参数说明
by指定要进行排序的列名或索引值
axis若 axis=0 或 ‘index’,则按照指定 的数据大小排序;若 axis=1 或 ‘columns’,则按照指定 索引 中数据大小排序。默认axis=0
ascending若 ascending=True,则按照升序排序;若 ascending=False,则按降序排序,默认为True,即升序排序。如果这是一个 bool 列表,则必须匹配 by 的长度
inplace排序后的数据是否替换原来的数据,默认为False,即不替换
ignore_index是否重置索引,默认为不重置

4、sort_values() 使用

4.1 单列/行排序

import pandas as pd
df = pd.read_csv('test.csv')
# 根据hello列降序排序
data = df.sort_values(by="hello", ascending=False, ,axis=0)
# axis=0表示按列,同理axis=1表示按行

4.2 多列/行排序

import pandas as pd
df = pd.read_csv('test.csv')
# 根据第一列降序排序,当第一列相同时,根据第三列进行升序排序。并且重置索引,替换原数据
data = df.sort_values(by = ['col1','col3'],ascending=[False,True],ignore_index=True,inplace=True)

5、应用

所以一开始那道题我这样写的:

# -*- coding: utf-8 -*-
# ---
# @Software: PyCharm
# @File: main.py
# @Author: WangYunchang
# @E-mail: wangyunchang@dxy.cn
# @Site: 
# @Time: 9月 20, 2022
# ---
import csv
import pandas as pd
import hashlib
counts = {}
# 读取文件
txt = open("word2count.txt").read()
# 将大写字母转化为小写
txt = txt.lower()
# 把文章中不是英文字母的全部代替为空格
for ch in '0123456789.,()%-':
    txt = txt.replace(ch, " ")
# 分割成列表
words = txt.split()
# 统计单词
for word in words:
    counts[word] = counts.get(word, 0) + 1
items = list(counts.items())
# 将所得单词及数目写入csv文件中
csvFile = open('word_result.csv', 'w', newline='')
# 写入表头,A是单词,B是出现次数
csv.writer(csvFile).writerow(["A", "MD5", "B"])
# 统计结果写入csv
writer = csv.writer(csvFile)
for key in counts:
    # MD5值
    ss = hashlib.md5(key.encode('utf-8')).hexdigest()
    writer.writerow([key, ss, counts[key]])
csvFile.close()
df = pd.read_csv('word_result.csv')
# 根据B降序排序,当B相同时,根据MD5进行降序排序
data = df.sort_values(by=["B", "MD5"], ascending=[False, False])
# 删除MD5
data = data.drop(columns="MD5")
# 把新的数据写入文件
data.to_csv('word_result.csv', mode='w', index=False)

到此这篇关于Python中pandas库sort_values()方法的使用的文章就介绍到这了,更多相关pandas库sort_values()内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • keras 简单 lstm实例(基于one-hot编码)

    keras 简单 lstm实例(基于one-hot编码)

    这篇文章主要介绍了keras 简单 lstm实例(基于one-hot编码),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-07-07
  • Python中文件操作简明介绍

    Python中文件操作简明介绍

    这篇文章主要介绍了Python中文件操作简明介绍,本文讲解了打开文件、读取方法、写入方法、文件内移动、文件迭代、关闭文件、截取文件等内容,并给出了一个完整操作实例,需要的朋友可以参考下
    2015-04-04
  • Python数据结构之树的全面解读

    Python数据结构之树的全面解读

    数据结构中有很多树的结构,其中包括二叉树、二叉搜索树、2-3树、红黑树等等。本文中对数据结构中常见的树逻辑结构和存储结构进行了汇总,不求严格精准,但求简单易懂
    2021-11-11
  • Python中的getopt函数使用详解

    Python中的getopt函数使用详解

    这篇文章主要介绍了Python中的getopt函数使用详解,是Python进阶学习中的重要知识,需要的朋友可以参考下
    2015-07-07
  • 对python csv模块配置分隔符和引用符详解

    对python csv模块配置分隔符和引用符详解

    今天小编就为大家分享一篇对python csv模块配置分隔符和引用符详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • Python实现的堆排序算法原理与用法实例分析

    Python实现的堆排序算法原理与用法实例分析

    这篇文章主要介绍了Python实现的堆排序算法,简单描述了堆排序的原理,并结合实例形式分析了Python实现堆排序的相关操作技巧,代码中备有较为详细的注释便于理解,需要的朋友可以参考下
    2017-11-11
  • Numpy实现矩阵运算及线性代数应用

    Numpy实现矩阵运算及线性代数应用

    这篇文章主要介绍了Numpy实现矩阵运算及线性代数应用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-03-03
  • 解决mnist数据集下载的相关问题

    解决mnist数据集下载的相关问题

    这篇文章主要介绍了解决mnist数据集下载的相关问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-06-06
  • python中subprocess实例用法及知识点详解

    python中subprocess实例用法及知识点详解

    在本篇文章里小编给大家分享的是关于python中subprocess实例用法及知识点详解内容,有需要的朋友们可以跟着学习下。
    2021-10-10
  • 使用 Django 进行测试驱动开发

    使用 Django 进行测试驱动开发

    本文分享了什么是测试驱动开发,并用测试驱动开发的方式 创建了一个简单的 Django 应用程序,感兴趣的可以了解一下
    2021-11-11

最新评论