python词云库wordcloud自定义词云制作步骤分享

 更新时间:2022年08月11日 10:31:36   作者:ㅤㅤㅤKaneBurger​​​​​​​  
这篇文章主要介绍了python词云库wordcloud自定义词云制作步骤分享,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的小伙伴可以参考一下

wordcloud库常规方法

import wordcloud
c=wordcloud.WordCloud()  #构建词云对象,配置对象参数
c.generate("wordcloud by python ")  #加载词云文本
c.to_file("pywordcloud.png")      #输出词云文件

词云生成步骤:

  • 分隔:以空格分隔单词
  • 统计:单词出现次数并过滤(1-2个字母会被滤掉)
  • 字体:根据统计配置字号
  • 布局:颜色环境尺寸

c=wordcloud.WordCloud(参数) 配置对象参数

参数(像素)描述
width(默认400px)c=wordcloud.WordCloud(width=600)
height(默认200px)c=wordcloud.WordCloud(height=400)
min_font_size(默认4号)c=wordcloud.WordCloud(min_font_size=10)
max_font_size(根据高度自动调节)c=wordcloud.WordCloud(max_font_size=20)
font_step(默认1,步长)c=wordcloud.WordCloud(font_step=2)
font_path(默认None,字体路径)c=wordcloud.WordCloud(font_path="msyh.ttc")
max_words(默认200,最大数量)c=wordcloud.WordCloud(max_words=20)
stop_words(指定去除单词的列表)c=wordcloud.WordCloud(stop_words={"python"})
background_color(默认黑色,词云背景色)c=wordcloud.WordCloud(background_color="red")

Scale 默认值1。值越大,图像密度越大越清晰

mask参数自定义词云形状:

#指定词云形状,默认是长方形,需要引用imread()函数
from scipy.misc import imread
mk=imread("pic.png")
c=wordcloud.WordCloud(mask=mk)

第三方库

  • numpy :多维数组运算
  • matplotlib :绘图与数据可视化
  • pillow :图片处理
  • wordcloud :词云制作
  • imageio :图像输入输出
  • jieba :中文分词
  • snownlp :中文情感和自然语言处理
  • itchat :微信好友抓取

读取文件

政府工作报告词云:

import wordcloud
# 从外部.txt文件中读取大段文本,存入变量txt中
f = open('政府工作报告.txt',encoding='utf-8')
txt = f.read()
# 构建词云对象w,设置词云图片宽、高、字体、背景颜色等参数
w = wordcloud.WordCloud(width=1000,
                        height=700,
                        background_color='white',
                        font_path='msyh.ttc')
# 将txt变量传入w的generate()方法,给词云输入文字
w.generate(txt)
# 将词云图片导出到当前文件夹
w.to_file('Test1.png')

==wordcloud中文分词(适合中文词云)==

# 导入词云制作库wordcloud和中文分词库jieba
import jieba
import wordcloud
# 构建并配置词云对象w
w = wordcloud.WordCloud(width=1000,
                        height=700,
                        background_color='white',
                        font_path='msyh.ttc')
# 调用jieba的lcut()方法对原始文本进行中文分词,得到string
txt = '由于Python语言的简洁性、易读性以及可扩展性, \
      在国外用Python做科学计算的研究机构日益增多, \
      一些知名大学已经采用Python来教授程序设计课程。 \
      例如卡耐基梅隆大学的编程基础、 \
      麻省理工学院的计算机科学及编程导论就使用Python语言讲授。'
txtlist = jieba.lcut(txt)
string = " ".join(txtlist)
# 将string变量传入w的generate()方法,给词云输入文字
w.generate(string)
# w.generate(" ".join(jieba.lcut(txt)))  #三段代码合一简写
# 将词云图片导出到当前文件夹
w.to_file('Teste2.png')

自定义绘制指定形状的词云

import jieba
import wordcloud
from scipy.misc import imread
mask=imread("图片形状.png") #导入自定义形状图片赋给mask
# 从外部.txt文件中读取大段文本,存入变量txt中
f = open('政府工作报告.txt',encoding='utf-8')
txt = f.read() #阅读提取
f.close()   #关闭
# 构建词云对象w,设置词云图片宽、高、字体、背景颜色等参数
w = wordcloud.WordCloud(width=1000,
                        height=700,
                        background_color='white',mask=mask,
                        font_path='msyh.ttc')
# 将txt变量传入w的generate()方法,给词云输入文字
w.generate(" ".join(jieba.lcut(txt)))
# 将词云图片导出到当前文件夹
w.to_file('Test1.png')

==勾勒词云轮廓==

# 导入词云制作库wordcloud
import wordcloud
# 将外部文件包含的文本保存在string变量中
string = open('hamlet.txt').read()
# 导入imageio库中的imread函数,并用这个函数读取本地图片,作为词云形状图片
import imageio
mk = imageio.imread("ren.png")
# 构建词云对象w,注意增加参数contour_width和contour_color设置轮廓宽度和颜色
w = wordcloud.WordCloud(background_color="white",
                        mask=mk,
                        contour_width=1,
                        contour_color='steelblue'
                        )
# # 将string变量传入w的generate()方法,给词云输入文字
w.generate(string)
# 将词云图片导出到当前文件夹
w.to_file('p2.png')

==按模板自身颜色绘制词云==

# 导入绘图库matplotlib和词云制作库wordcloud
import matplotlib.pyplot as plt
from wordcloud import WordCloud,ImageColorGenerator

# 将外部文件包含的文本保存在text变量中
text = open('alice.txt').read()

# 导入imageio库中的imread函数,并用这个函数读取本地图片queen2.jfif,作为词云形状图片
import imageio
mk = imageio.imread("alice.png")

# 构建词云对象w
wc = WordCloud(background_color="white",
               mask=mk,)
# 将text字符串变量传入w的generate()方法,给词云输入文字
wc.generate(text)

# 调用wordcloud库中的ImageColorGenerator()函数,提取模板图片各部分的颜色
image_colors = ImageColorGenerator(mk)

# 显示原生词云图、按模板图片颜色的词云图和模板图片,按左、中、右显示
fig, axes = plt.subplots(1, 3)
# 最左边的图片显示原生词云图
axes[0].imshow(wc)
# 中间的图片显示按模板图片颜色生成的词云图,采用双线性插值的方法显示颜色
axes[1].imshow(wc.recolor(color_func=image_colors), interpolation="bilinear")
# 右边的图片显示模板图片
axes[2].imshow(mk, cmap=plt.cm.gray)
for ax in axes:
    ax.set_axis_off()
plt.show()

# 给词云对象按模板图片的颜色重新上色
wc_color = wc.recolor(color_func=image_colors)
# 将词云图片导出到当前文件夹
wc_color.to_file('out-alice.png')

到此这篇关于python词云库wordcloud自定义词云制作步骤分享的文章就介绍到这了,更多相关python wordcloud词云制作内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python实现保存网页到本地示例

    python实现保存网页到本地示例

    这篇文章主要介绍了python实现保存网页到本地示例,需要的朋友可以参考下
    2014-03-03
  • python 获取et和excel的版本号

    python 获取et和excel的版本号

    在进行OA开发过程中,经常会用到当前办公软件的版本号,在python可以通过如下的方法获取。
    2009-04-04
  • python 协程并发数控制

    python 协程并发数控制

    这篇文章主要介绍了python 协程并发数控制,文章基于python的相关资料展开对主题烦人详细内容介绍,需要的小伙伴可以参考一下
    2022-05-05
  • python使用xpath中遇到:<Element a at 0x39a9a80>到底是什么?

    python使用xpath中遇到:<Element a at 0x39a9a80>到底是什么?

    这篇文章主要给大家详细介绍了关于python使用xpath中遇到:<Element a at 0x39a9a80>的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面随着小编来一起学习学习吧。
    2018-01-01
  • python中Switch/Case实现的示例代码

    python中Switch/Case实现的示例代码

    本篇文章主要介绍了python中Switch/Case实现的示例代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-11-11
  • Python生成不重复随机值的方法

    Python生成不重复随机值的方法

    这篇文章主要介绍了Python生成不重复随机值的方法,实例分析了Python算法实现与Python自带方法的实现技巧,非常简单实用,需要的朋友可以参考下
    2015-05-05
  • Keras官方中文文档:性能评估Metrices详解

    Keras官方中文文档:性能评估Metrices详解

    这篇文章主要介绍了Keras官方中文文档:性能评估Metrices详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • Python中scrapy下载保存图片的示例

    Python中scrapy下载保存图片的示例

    在日常爬虫练习中,我们爬取到的数据需要进行保存操作,在scrapy中我们可以使用ImagesPipeline这个类来进行相关操作,本文主要介绍了scrapy下载保存图片,感兴趣的可以了解一下
    2021-07-07
  • Python warning警告出现的原因及忽略方法

    Python warning警告出现的原因及忽略方法

    在本篇文章里小编给大家分享的是关于Python warning警告出现的原因及忽略方法,有需要的朋友们可以学习参考下。
    2020-01-01
  • 关于AnacondaNavigator Jupyter Notebook更换Python内核的问题

    关于AnacondaNavigator Jupyter Notebook更换Python内核的问题

    因为新安装的Anaconda Navigator默认安装了一个Python,Jupyter Notebook默认使用的内核就是这个Python,跟我系统安装好的Python冲突了,下面小编给大家介绍AnacondaNavigator Jupyter Notebook更换Python内核的问题,需要的朋友可以参考下
    2022-02-02

最新评论