python BeautifulSoup设置页面编码的方法

 更新时间:2015年04月03日 08:55:42   投稿:junjie  
这篇文章主要介绍了python BeautifulSoup设置页页编码的方法,本文直接给出代码救命,需要的朋友可以参考下

在用BeautifulSoup进行抓取页面的时候,会各种各样的编码错误。
可以通过在beautifulsoup中指定字符编码,解决问题。

复制代码 代码如下:

import urllib2 
from BeautifulSoup import BeautifulSoup 
 
page = urllib2.urlopen('http://www.163.com'); 
soup = BeautifulSoup(page,from_encoding="gb2312") 
 
print soup.originalEncoding
print soup.prettify() 

红色部分表示需要注意的地方。在BeautifulSoup构造器中传入fromEncoding参数即可解决乱码问题,当然具体参数值是什么就要看你获取页面的编码是什么

相关文章

  • Python3 批量扫描端口的例子

    Python3 批量扫描端口的例子

    今天小编就为大家分享一篇Python3 批量扫描端口的例子,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • Pygame实战之实现扎气球游戏

    Pygame实战之实现扎气球游戏

    这篇文章主要为大家介绍了利用Python中的Pygame模块实现的一个扎气球游戏,文中的示例代码讲解详细,对我们了解Pygame模块有一定的帮助,感兴趣的可以学习一下
    2021-12-12
  • 浅析Python中的方法重载

    浅析Python中的方法重载

    方法重载在 Python 中起着至关重要的作用, 这篇文章主要为大家详细介绍了Python中方法重载及其优点的相关知识,感兴趣的小伙伴快跟随小编一起学习一下吧
    2023-10-10
  • python基于Pandas读写MySQL数据库

    python基于Pandas读写MySQL数据库

    这篇文章主要介绍了python基于Pandas读写MySQL数据库,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下
    2021-04-04
  • Python中的并发处理之asyncio包使用的详解

    Python中的并发处理之asyncio包使用的详解

    本篇文章主要介绍了Python中的并发处理之asyncio包使用的详解,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-04-04
  • python判断设备是否联网的方法

    python判断设备是否联网的方法

    这篇文章主要为大家详细介绍了python判断设备是否联网的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-06-06
  • python实现bitmap数据结构详解

    python实现bitmap数据结构详解

    bitmap是很常用的数据结构,比如用于Bloom Filter中,下面是使用python实现bitmap数据结构的代码讲解,需要的朋友可以参考下
    2014-02-02
  • Python爬虫框架Scrapy简介

    Python爬虫框架Scrapy简介

    这篇文章介绍了Python爬虫框架Scrapy,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-06-06
  • pyqt远程批量执行Linux命令程序的方法

    pyqt远程批量执行Linux命令程序的方法

    今天小编就为大家分享一篇pyqt远程批量执行Linux命令程序的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02
  • Pytorch - TORCH.NN.INIT 参数初始化的操作

    Pytorch - TORCH.NN.INIT 参数初始化的操作

    这篇文章主要介绍了Pytorch - TORCH.NN.INIT 参数初始化的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-02-02

最新评论