python解析库Beautiful Soup安装的详细步骤

 更新时间:2023年04月20日 11:12:11   作者:smart_cat  
Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据,下面这篇文章主要给大家介绍了关于python解析库Beautiful Soup安装的详细步骤,文中通过图文介绍的非常详细,需要的朋友可以参考下

一、Beautiful Soup的安装

Beautiful Soup是Python的一个HTML或XML的解析库,使用它可以很方便地从网页中提取数据。它的解析器是依赖于lxml库的,所以在此之前,请确保已经成功安装好了lxml库。

本文环境是windows 10 64位+ python3.11, 此处以windows安装为例。

1.1 安装lxml库

lxml库的安装,首先尝试使用pip进行安装:

pip install lxml

如果pip安装报错,比如提示缺少libxml2库等信息,那么可以采用wheel方式安装

20221211174313

采用wheel方式安装,首先需要安装wheel

pip install wheel

20221211193726

然后去官网https://pypi.org/project/lxml/下载lxml对应的的wheel版本, 当前最新版本是lxml 4.9.1, 点击Download files

20221211204339

在列出的files里面,选出和自己的版本相匹配的,例如你的python版本是3.10的,你的机器是windows系统,64位版本,那么就选lxml-4.9.1-cp310-cp310-win_amd64.whl

20221211200756

这里比较坑的一点是,python版本最新的已经是3.11版本了,但是lxml没有对应的官方windows 311版本,只有linux下的311版本。可以选择对python版本降级,比如降到python3.10版。

或者在https://www.lfd.uci.edu/~gohlke/pythonlibs/里,倒是可以找到311版本的windows wheel安装包,可以自行尝试。

20221211204213

安装wheel包的话,到wheel安装包所在目录执行pip 命令即可,或者带上全路径也可以

pip install lxml-4.9.0-cp311-cp311-win_amd64.whl

20221211202526

1.2 安装beautifulsoup4

推荐使用pip来安装,执行下述安装命令

pip install beautifulsoup4

20221211173125

1.3 验证beautifulsoup4能否运行

执行以下代码,能成功输出hello,就说明可以成功使用beautifulsoup4进行解析了。

如果只有beautifulsoup4安装成功,lxml库没有正确安装的话,下面代码不能成功执行。

from bs4 import BeautifulSoup as bs

soup = bs('<p>hello</p>', 'lxml')
print(soup.p.string)

20221211203212

补充:Python 安装beautifulsoup4库失败或引用错误的解决办法

1、首先下载官网BeautifulSoup4软件包里面的beautifulsoup4库

2、然后解压缩到G:\python\Lib\site-packages\bs4目录下,打开cmd窗口,进入到解压目录下,进入 G:\python\Lib\site-packages\bs4\beautifulsoup4-4.3.2\beautifulsoup4-4.3.2

3、在该目录下运行cmd

python setup.py build
python setup.py install

可能会遇到的报错 :error in pymmseg setup command: use_2to3 is invalid.

报错的解决方案:需要把版本降低,小于58的最后一个版本是57.5.0,pip降一下就可以了:

pip install setuptools==57.5.0

就可以重新安装库了

没遇到报错,直接到这步骤即可

导入模块(测试模块导入是否成功)

进入cmd-python输入:

from bs4 import BeautifulSoup

 注意:导入这个库是要大写的,小写不行。

问题解决成功!

ps:这是我碰到的问题,解决了很久也问了很多人,还是没能够解决是靠自己经过百度查询了很多的资料才解决的,希望能帮助到你们。

总结

到此这篇关于python解析库Beautiful Soup安装的详细步骤的文章就介绍到这了,更多相关解析库Beautiful Soup安装内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python单测框架之pytest常见用法

    python单测框架之pytest常见用法

    pytest是python的单测框架,使用灵活,插件丰富,本文给大家分享python单测框架之pytest常见用法包括pytest常见的插件,感兴趣的朋友跟随小编一起看看吧
    2021-08-08
  • DjangoWeb使用Datatable进行后端分页的实现

    DjangoWeb使用Datatable进行后端分页的实现

    这篇文章主要介绍了DjangoWeb使用Datatable进行后端分页的实现,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05
  • tensorflow+k-means聚类简单实现猫狗图像分类的方法

    tensorflow+k-means聚类简单实现猫狗图像分类的方法

    这篇文章主要介绍了tensorflow+k-means聚类简单实现猫狗图像分类,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-04-04
  • 浅析Python 责任链设计模式

    浅析Python 责任链设计模式

    这篇文章主要介绍了Python 责任链设计模式的相关资料,帮助大家更好的理解和学习python 设计模式,感兴趣的朋友可以了解下
    2020-09-09
  • Python实现中文文本关键词抽取的三种方法

    Python实现中文文本关键词抽取的三种方法

    文本关键词抽取,是对文本信息进行高度凝练的一种有效手段,通过3-5个词语准确概括文本的主题,帮助读者快速理解文本信息,本文分别采用TF-IDF方法、TextRank方法和Word2Vec词聚类方法,利用Python语言进行开发,实现文本关键词的抽取,需要的朋友可以参考下
    2024-01-01
  • 关于Python使用logging库进行有效日志管理的方法详解

    关于Python使用logging库进行有效日志管理的方法详解

    在开发大型软件或处理复杂问题时,我们经常需要一种方法来记录和跟踪程序的运行状态,Python 提供了一个名为 logging 的标准库,可以帮助我们更好地完成这项任务,在这篇文章中,我们将介绍如何使用 Python 的 logging 库进行日志记录
    2023-06-06
  • 将字典转换为DataFrame并进行频次统计的方法

    将字典转换为DataFrame并进行频次统计的方法

    下面小编就为大家分享一篇将字典转换为DataFrame并进行频次统计的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • Python自动化开发学习之三级菜单制作

    Python自动化开发学习之三级菜单制作

    这篇文章主要为大家详细介绍了Python自动化开发学习之三级菜单的制作方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-07-07
  • python中altair可视化库实例用法

    python中altair可视化库实例用法

    在本篇文章里小编给大家整理的是一篇关于python中altair可视化库实例用法,对此有兴趣的朋友们可以学习下。
    2021-01-01
  • python多线程并发实例及其优化

    python多线程并发实例及其优化

    这篇文章主要介绍了python多线程并发实例及其优化,threading是扩展模块,在thread的基础上进行了封装及改进。所以只需要使用threading这个模块就能完成并发的测试,需要的朋友可以参考下
    2019-06-06

最新评论