Python词频统计的两种方法详解

更新时间：2021年12月06日 15:04:51 作者：Argonaut_

这篇文章主要为大家介绍了Python词频统计，具有一定的参考价值，感兴趣的小伙伴们可以参考一下，希望能够给你带来帮助

统计文件里每个单词的个数

思路：

分别统计文档中的单词，与出现的次数

用两个列表将其保存起来，最后再用zip()函数连接输出**

想法成立开始实践

方法一：

# 导入文件
with open("passage.txt", 'r') as file:
    dates = file.readlines()
# 处理
words = []
for i in dates:
    words += i.replace("\n", "").split(" ")  # 用空字符来代替换行 words +是为了不被覆盖无+将只有最后一条数据
    # print(i.replace("\n","").split(" "))
setWords = list(set(words))  # 集合自动去重
num = []  # 统计一个单词出现的次数
for k in setWords:
    count = 0
    for j in words:
        if k == j:
            count = count + 1
    num.append(count)
print(num)
print(setWords)
# 输出
for x, y in zip(setWords, num):  # 将两个列表用zip结合
    print(x + ":" + str(y))、

效果图：

在这里插入图片描述

方法二：

此方法用来字典，较前一个相对简洁一点

# 导入
with open("passage.txt", 'r') as file:
    dates = file.readlines()
# 处理
words = []
for i in dates:
    words += i.replace("\n", "").split(" ")
    # print(i.replace("\n","").split(" "))
# setWords=list(set(words))  #可以不用这个
print(words)
print("-" * 40)
# print(setWords)
diccount = dict()
for i in words:
    if (i not in diccount):
        diccount[i] = 1  # 第一遍字典为空 赋值相当于 i=1，i为words里的单词
        # print(diccount)
    else:
        diccount[i] = diccount[i] + 1  # 等不在里面的全部遍历一遍赋值就都在里面了，我们再来记数
print(diccount)

效果图：

在这里插入图片描述

统计的文档

在这里插入图片描述

总结

本篇文章就到这里了，希望能够给你带来帮助，也希望您能够多多关注脚本之家的更多内容!

您可能感兴趣的文章:

python实现搜索文本文件内容脚本
这篇文章主要为大家详细介绍了python实现搜索文本文件内容的脚本，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-06-06
Python re模块介绍
这篇文章主要介绍了Python re模块介绍,需要的朋友可以参考下
2014-11-11
Python光学仿真学习Gauss高斯光束在空间中的分布
这篇文章主要介绍了Python光学仿真学习中Gauss高斯光束在空间中的分布理解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2021-10-10
python3.5 cv2 获取视频特定帧生成jpg图片
这篇文章主要为大家详细介绍了python3.5 cv2 获取视频特定帧生成jpg图片，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2019-08-08
python如何将两张图片生成为全景图片
这篇文章主要为大家详细介绍了python如何将两张图片生成为全景图片，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2020-03-03
Flask框架debug与配置项的开启与设置详解
这篇文章主要介绍了Flask框架debug与配置项的开启与设置，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2022-09-09
python爬虫获取小区经纬度以及结构化地址
这篇文章主要为大家详细介绍了python爬虫获取小区经纬度，以及结构化的地址，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-12-12
python两个list[]相加的实现方法
这篇文章主要介绍了python两个list[]相加的实现方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-09-09
Python数据分析pandas模块用法实例详解
这篇文章主要介绍了Python数据分析pandas模块用法,结合实例形式分析了pandas模块对象创建、数值运算等相关操作技巧与注意事项,需要的朋友可以参考下
2019-11-11
python 获取网页编码方式实现代码
这篇文章主要介绍了python 获取网页编码方式实现代码的相关资料,需要的朋友可以参考下
2017-03-03