从CentOS安装完成到生成词云python的实例

 更新时间:2017年12月01日 09:32:28   投稿:jingxian  
下面小编就为大家分享一篇从CentOS安装完成到生成词云python的实例,具有很好的参考价值,希望对大家有所帮助

前言

人生苦短,我用python。学习python怎么能不搞一下词云呢是不是(ง •̀_•́)ง

于是便有了这篇边实践边记录的笔记。

环境:VMware 12pro + CentOS7 + Python 2.7.5

安装系统

之前一直用的是win10子系统,现在试试CentOS,CentOS官网下载最新系统dvd版 安装到VMware 12pro。网上很多教程。例如这个链接。等待安装完成后开始。

第一个命令

用Ubuntu的时候没有的命令会提示你安装,感觉很简单的事。但是到CentOS上却变得很头痛。

打开终端在执行以下命令安装python-pip时提示。

sudo yum install python-pip

没有可用软件包 python-pip。

google了一下说是这个包在EPEL源里,要添加EPEL源才可以。

执行下面两个命令就安装好了。

yum install epel-release.noarch

yum install python-pip

python库安装

接下来安装一个词云wordcloud

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple wordcloud

截取部分提示错误信息 
unable to execute gcc: No such file or directory
error: command 'gcc' failed with exit status 1

连gcc都没有(ง •̀_•́)ง。先安装gcc
yum install gcc

gcc装完后继续安装wordcloud!又报了下面的错误

_posixsubprocess.c:3:20: 致命错误:Python.h:没有那个文件或目录

于是需要先安装python-devel

sudo yum install python-devel  #注意这里不是python-dev

CentOS 下叫做 python-devel,Ubuntu 下还是叫做 python-dev。

wordcloud安装完毕!

代码

生成词云一份代码,并且随便找一份英文(我在ChinaDaily找的文章 Recruiters starting to employ social media 放到 txt/word.txt中

# -*- coding: UTF-8 -*-
import matplotlib
# Force matplotlib to not use any Xwindows backend.
#matplotlib.use('Agg')

from wordcloud import WordCloud

textfile = open(u'txt/word.txt','r').read()
wordcloud = WordCloud(background_color="white",width=800, height=600, margin=5).generate(textfile)

# width,height,margin可以设置图片属性
# generate 可以对全部文本进行自动分词,但是它对中文支持不好
#background_color参数为设置背景颜色,默认颜色为黑色

wordcloud.to_file('word.png')

执行命令运行 python clouddemo.py 报错提示

SyntaxError: Non-ASCII character '\xe5' in file clouddemo.py on line 6, 
but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

原因如下

Python默认是以ASCII作为编码方式的,如果在Python源码中包含了中文(或者其他非英语系的语言),此时即使你把自己编写的Python源文件以UTF-8格式保存,但实际上,这依然是不行的。

解决办法很简单,只要在文件开头加入下面代码;指定文件的编码格式为utf-8。上面的代码我已经加好了(。・`ω´・)。

# -*- coding: UTF-8 -*- 

编码问题解决了。接下来重新运行。

还是报错!!!

ImportError: No module named Tkinter

首先yum list installed | grep ^tk

查看是否存在相应模块,如果不存在则通过yum install tkinter 和yum install -y tk-devel下载相应模块。

重新执行命令提示下一个错误

tkinter.TclError: no display name and no $DISPLAY environment variable

虽然一波N折,但是最后还是成功了!!!看看源代码目录下的词云图!

效果图如下:

image

以上这篇从CentOS安装完成到生成词云python的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python使用Joblib模块实现加快任务处理速度

    Python使用Joblib模块实现加快任务处理速度

    在Python编程中,处理大规模数据或者进行复杂的计算任务时,通常需要考虑如何提高程序的运行效率,本文主要介绍了如何使用Joblib模块来加快任务处理速度,需要的可以参考下
    2024-03-03
  • 解决在pycharm中显示额外的 figure 窗口问题

    解决在pycharm中显示额外的 figure 窗口问题

    今天小编就为大家分享一篇解决在pycharm中显示额外的 figure 窗口问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • Python实现统计mp4/avi视频的时长

    Python实现统计mp4/avi视频的时长

    moviepy是一个用于处理视频和音频的Python库,它提供了一组功能丰富的工具,所以本文将利用它实现统计mp4/avi视频的时长,希望对大家有所帮助
    2023-07-07
  • 用python读写excel的方法

    用python读写excel的方法

    这篇文章主要介绍了用python读写excel的方法,涉及xlrd模块与xlwt模块的应用,具有一定的学习借鉴价值,需要的朋友可以参考下
    2014-11-11
  • python 实现在txt指定行追加文本的方法

    python 实现在txt指定行追加文本的方法

    下面小编就为大家分享一篇python 实现在txt指定行追加文本的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • python 画函数曲线示例

    python 画函数曲线示例

    今天小编就为大家分享一篇python 画函数曲线示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • python更换国内镜像源三种实用方法

    python更换国内镜像源三种实用方法

    这篇文章主要给大家介绍了关于python更换国内镜像源三种实用方法的相关资料,更换Python镜像源可以帮助解决使用pip安装包时速度过慢或无法连接的问题,需要的朋友可以参考下
    2023-09-09
  • python反扒机制的5种解决方法

    python反扒机制的5种解决方法

    这篇文章主要介绍了python反扒机制的5种解决方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-02-02
  • python 中的list和array的不同之处及转换问题

    python 中的list和array的不同之处及转换问题

    python中的list是python的内置数据类型,list中的数据类不必相同的,而array的中的类型必须全部相同。这篇文章给大家介绍了python 中的list和array的不同之处及转换问题,需要的朋友参考下吧
    2018-03-03
  • 用Cython加速Python到“起飞”(推荐)

    用Cython加速Python到“起飞”(推荐)

    这篇文章主要介绍了用Cython加速Python到“起飞”,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-08-08

最新评论