Python词云展示库wordcloud配置详解

 更新时间:2023年07月26日 10:24:31   作者:Python 学习者  
这篇文章主要介绍了Python词云展示库wordcloud配置详解,词云就是将词语通过图形可视化的方式,直观和艺术的展示出来,词云在我们的生活中经常能够看到,无论是中文的词云还是英文的词云,需要的朋友可以参考下

1.介绍

wordcloud是优秀的词云展示第三方库,wordcloud能够将一段文本变成一个词云。

词云就是将词语通过图形可视化的方式,直观和艺术的展示出来。词云在我们的生活中经常能够看到,无论是中文的词云还是英文的词云。

安装第三方库需要使用pip工具,在命令行下运行安装命令(不是IDLE)。注意:需要将Python目录和其目录下的Scripts目录加到环境变量中。

使用命令pip install wordcloud安装第三方库,安装之后会提示successfully installed,告知是否安装成功。

2.使用说明

wordcloud库把词云当做一个WordCloud对象,即wordcloud.WordCloud()是一个代表文本对应词云的对象,一个词云就是一个WordCloud对象。wordcloud库可以根据文本中词语出现的频率等一系列参数来绘制词云,在绘制词云时,词云的形状、尺寸、颜色包括字体都是可以设定的。

wordcloud库对具体词云的绘制有一个基本的思路,思路是用wordcloud库中的WordCloud对象来表明一个词云,WordCloud对象是一个词云的对象基础,然后向这个对象中配置参数、加载文本、输出到文件中。这同样也是词云绘制的步骤:1.配置对象参数;2.加载词云文本;3.输出词云文件。为了完成后两个步骤,我们需要将WordCloud对象赋给一个变量名,使得后两个步骤可以调用,例如:w=wordcloud.WordCloud()。

配置对象参数(参数之间使用逗号隔开):

  • width

指定词云对象生成图片的宽度,默认400像素,例如:

w=wordcloud.WordCloud(width=600)
  • height

指定词云对象生成图片的高度,默认200像素,例如:

w=wordcloud.WordCloud(height=400)
  • min_font_size

指定词云中字体的最小字号,默认4号,例如:

w=wordcloud.WordCloud(min_font_size=10)
  • max_font_size

指定词云中字体的最大字号,根据高度自动调节,例如:

w=wordcloud.WordCloud(max_font_size=20)
  • font_step

指定词云中字体字号的步进间隔,默认为1

w=wordcloud.WordCloud(font_step=2)
  • font_path

指定字体文件的路径,默认为None

w=wordcloud.WordCloud(font_path="msyh.ttc")
  • max_words

指定词云显示的最大单词数量,默认200,例如:

w=wordcloud.WordCloud(max_words=20)
  • stop_words

指定词云的排除单词列表,即不显示的单词列表,例如:

w=wordcloud.WordCloud(stop_words={"Python"})
  • mask

指定词云形状(提供白色的形状图片),默认为长方形,在使用时需要引用imread()函数,例如:

from scipy.misc import imread
mk=imread("pic.png")
w=wordcloud.WordCloud(mask=mk)
  • background_color

指定词云图片的背景颜色,默认为黑色,例如:

w=wordcloud.WordCloud(background_color="white")

加载词云文本方法(默认前提w=wordcolud.WordCloud()):

w.generate(txt)

向WordCloud对象w中加载文本txt,例如:

w.generate("Python and WordCloud")

输出词云文件方法(默认前提w=wordcolud.WordCloud()):

w.to_file(filename)

将词云输出为图像文件,采用.png或.jpg格式,例如:

w.to_file("outfile.png")

在不指定图片宽和高时,默认图片宽为400像素,高位200像素。

由文本变为词云,wordcloud库大概做了4件事:

1.wordcloud库以空格为分隔符,将文本分割成单词;

2.wordcloud库会在文本中统计每一个单词出现的次数,单词出现次数越多,那么单词显示的词云效果的字体越大,反之则反。并且将只有1到2个字符的单词过滤掉;

3.wordcloud库会根据统计单词出现的次数,为不同的单词配置显示的字号;

4.进行布局。

英文词云实例:

import wordcloud
txt="Guido van Rossum, Father of Python"
w=wordcloud.WordCloud( \
    background_color="white")
w.generate(txt)
w.to_file("image.png")

生成的图片

在这里插入图片描述

中文词云实例:

import jieba
import wordcloud#Python小白学习交流群:725638078
txt="Python由荷兰数学和计算机科学研究学会的吉多·范罗苏姆于1990年代初设计,作为一门叫做ABC语言的替代品。 \
    Python提供了高效的高级数据结构,还能简单有效地面向对象编程。Python语法和动态类型,以及解释型语言的本质,\
    使它成为多数平台上写脚本和快速开发应用的编程语言,随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发。"
w=wordcloud.WordCloud( width=1000,font_path="msyh.ttc",height=700) #必须设置字体,否则中文会显示成方框。这里字体文件与.py文件处于同一目录下
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("image.png")

生成的图片

在这里插入图片描述

到此这篇关于Python词云展示库wordcloud配置详解的文章就介绍到这了,更多相关Python词云展示库wordcloud内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 使用pandas的box_plot去除异常值

    使用pandas的box_plot去除异常值

    今天小编就为大家分享一篇使用pandas的box_plot去除异常值,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • python使用selenium实现批量文件下载

    python使用selenium实现批量文件下载

    这篇文章主要介绍了python使用selenium实现批量文件下载,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-03-03
  • python语言中with as的用法使用详解

    python语言中with as的用法使用详解

    本篇文章主要介绍了python语言中with as的用法使用详解,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-02-02
  • python读取.mat文件及将变量存为.mat文件的详细介绍

    python读取.mat文件及将变量存为.mat文件的详细介绍

    这篇文章主要给大家介绍了关于python读取.mat文件及将变量存为.mat文件的详细介绍,​mat文件是matlab的数据存储的标准格式,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2024-06-06
  • 一文带你吃透Python中的os和sys模块

    一文带你吃透Python中的os和sys模块

    os 模块是 Python中的一个内置模块,也是 Python中整理文件和目录最为常用的模块。sys 模块主要负责与 Python 解释器进行交互,该模块提供了一系列用于控制 Python 运行时环境的不同部分(函数和变量等)。本文主要来聊聊这两个模块的使用,希望对大家有所帮助
    2023-02-02
  • 详解python的argpare和click模块小结

    详解python的argpare和click模块小结

    这篇文章主要介绍了详解python的argpare和click模块小结,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-03-03
  • Linux下将Python的Django项目部署到Apache服务器

    Linux下将Python的Django项目部署到Apache服务器

    这篇文章主要介绍了Python的Django项目部署到Apache服务器上的要点总结,文中针对的是wsgi连接方式,需要的朋友可以参考下
    2015-12-12
  • 通过python-pptx模块操作ppt文件的方法

    通过python-pptx模块操作ppt文件的方法

    这篇文章主要介绍了通过python-pptx模块操作ppt文件的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,本文给大家介绍的需要的朋友可以参考下
    2020-12-12
  • Python通过select实现异步IO的方法

    Python通过select实现异步IO的方法

    这篇文章主要介绍了Python通过select实现异步IO的方法,实例分析了Python中select模块的使用技巧,需要的朋友可以参考下
    2015-06-06
  • Python Pygame制作雪夜烟花景

    Python Pygame制作雪夜烟花景

    这篇文章主要为大家详细介绍了如何利用Python中的Pygame模块制作一个雪夜烟花景,文中的示例代码讲解详细,对我们学习Python有一定帮助,需要的可以参考一下
    2022-01-01

最新评论