怎么使用python生成词云图

 更新时间:2023年06月15日 08:46:07   作者:夜之王。  
这篇文章主要给大家介绍了关于怎么使用python生成词云图的相关资料,词云图主要用途是将文本数据中出现频率较高的关键词以可视化的形式展现出来,使人一眼就可以领略文本数据的主要表达意思,需要的朋友可以参考下

词云图是什么?

词云图又称文字云,是信息可视化的表现形式之一。词云是把文本中出现频率较高的关键词进行视觉上的突出显示,形成关键词云层或关键词渲染,从而过滤掉大量的文本信息。读者可以快速领略文本的主旨。

相对柱状图、折线图、饼图等用来显示数据的图表,词云图可以展示大量文本数据。每个词的重要性(出现的频率)以字号大小表示:字号越大,该关键词越重要。如果想快速了解一段文本的重点,就可以构建一张词云图,从高频词汇去粗略了解。词云图以不同文字的杂乱组合,形成一定形状的图片,不仅能够以很直观的方式展示出重点内容,而且形式炫酷,颜色多变,给人眼前一亮的感觉。

怎么使用python制作词云图?

制作词云图很简单,首先需要导入3个库:

import jieba
import wordcloud
import imageio

其中,jieba和wordcloud为第三方库,需要自行安装。而imageio为python自带的库,不需要自行安装。

然后导入一个背景模板,以及需要制作词云图的底图。注意:模板的背景一定要是白色的,不可以是其他颜色或者透明

bg=imageio.v2.imread('D:\kgr1.jpg')
with open('D:/111.txt',encoding='utf-8') as f:
    t=f.read()

提取关键字

ls=jieba.lcut(t)
txt=" ".join(ls)

生成词云

w=wordcloud.WordCloud(width=1000,height=700,#词云比例
font_path="msyh.ttc",colormap='pink',#字体&颜色
background_color='white',mask=bg)#背景色&模板
w.generate(txt)
w.to_file(r'D:\pic.png')

效果图如下:

背景模板图片:

生成的词云图:

引用的文字为melt歌词,由此可见ryo写melt的高频词为:"了".如果用这首歌鬼畜,那么在te的发音出现时加速会有很好的鬼畜效果。

wordcloud还有其他功能,可以根据以下内容适度选择喜欢的功能添加:

wordcloud = WordCloud(font_path='simhei.ttf',  # 字体
                              prefer_horizontal=  ,#大部分都是横向排放
                              background_color='  ',  # 背景色
                              max_words=  ,  # 显示单词数
                              max_font_size=  ,  #最大字号
                              stopwords=   ,  # 过滤噪声词
                              mask=  ,#背景轮廓
                              colormap=   ,#使用自定义颜色
                              collocations=False
                              ).generate(txt)
    image = wordcloud.to_image()
    image.show()  # 展示图片
    wordcloud.to_file(' ')  # 保存图片

遇到的坑

做词云图会遇到第三方库安装失败的情况。

试了很多的方法,最后发现以下的方法是可行的:

wordcloud:

安装wordcloud库可以到以下链接下载对应自己的python版本、系统版本的.whl文件:

https://www.lfd.uci.edu/~gohlke/pythonlibs/

这是按首字母排序的。比如我下的是wordcloud‑1.8.1‑cp38‑cp38‑win32.whl,其中cp38就是指我的python版本号是3.8,如果是3.8.1等等也视为3.8;win32就是系统是32位的。如果你的python也没有numpy等等的话也需要安装,如果没有这些那么wordcloud也可能运行不了。

下好了以后,打开cmd,输入pip install 文件所在路径,比如pip install D:\wordcloud‑1.8.1‑cp38‑cp38‑win32.whl,等待提示安装完成即可。如果在pycharm中还是不能运行,可以试试在pycharm中点文件→设置→项目→python解释器→+号搜索,或者直接把第三方库的文件添加到项目/venv/Lib/sitepackages直到不报错为止。

jieba:

同理,但可以试试到这个链接下下载:

https://pypi.tuna.tsinghua.edu.cn/simple/jieba/

总结

到此这篇关于怎么使用python生成词云图的文章就介绍到这了,更多相关python生成词云图内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Pycharm+Python+PyQt5使用详解

    Pycharm+Python+PyQt5使用详解

    这篇文章主要介绍了Pycharm+Python+PyQt5使用详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-09-09
  • python绘制散点图和折线图的方法

    python绘制散点图和折线图的方法

    这篇文章主要为大家详细介绍了python绘制散点图和折线图的方法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-04-04
  • Python实现滑雪小游戏

    Python实现滑雪小游戏

    这篇文章主要为大家详细介绍了Python实现滑雪小游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-09-09
  • Python selenium 加载并保存QQ群成员,去除其群主、管理员信息的示例代码

    Python selenium 加载并保存QQ群成员,去除其群主、管理员信息的示例代码

    这篇文章主要介绍了Python selenium 加载并保存QQ群成员 去除其群主、管理员信息的示例代码,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧
    2020-05-05
  • numpy实现合并多维矩阵、list的扩展方法

    numpy实现合并多维矩阵、list的扩展方法

    今天小编就为大家分享一篇numpy实现合并多维矩阵、list的扩展方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-05-05
  • python绘制立方体的方法

    python绘制立方体的方法

    这篇文章主要为大家详细介绍了python绘制立方体的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-07-07
  • Pyecharts V1和V0.5之间相互切换的方法

    Pyecharts V1和V0.5之间相互切换的方法

    这篇文章主要介绍了Pyecharts V1和V0.5之间相互切换的方法,Pyecharts这个可视化库火爆,官方如是说:Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可,下面和小编一起进入文章了解具体内容吧
    2022-02-02
  • Python常用图像形态学操作详解

    Python常用图像形态学操作详解

    这篇文章主要为大家详细介绍几个Python中常用的图像形态学操作:腐蚀、膨胀、开闭运算、梯度运算、礼帽和黑帽,感兴趣的小伙伴可以跟随小编一起学习一下
    2022-08-08
  • python离散建模之感知器学习算法

    python离散建模之感知器学习算法

    这篇文章主要介绍了python离散建模之感知器学习算法,感知机学习算法是支持向量机的基础,支持向量机通过核函数进行非线性分类,支持向量机也是感知机算法的延伸,下面就来介绍感知算法的相关内容,需要的小伙伴可以参考一下
    2022-02-02
  • 浅析Python 引号、注释、字符串

    浅析Python 引号、注释、字符串

    这篇文章主要介绍了Python 引号、注释、字符串的相关知识,文中给大家提到了python中一对单引号,一对双引号,三个单双引号的区别和用法,需要的朋友可以参考下
    2019-07-07

最新评论