基于pycharm的beautifulsoup4库使用方法教程

 更新时间:2022年01月26日 13:21:16   作者:雾里看花花里看雾   
这篇文章主要介绍了基于pycharm的beautifulsoup4库使用方法教程,对正在学习或者工作的你有一点的参考价值,需要的朋友可以参加一下

1.beautifulsoup4库安装

第一步:在控制台输入如下命令,安装beautifulsoup4库。

pip install beautifulsoup4

第三步:pycharm中,点击file——settings——project——python interpreter——点击+号——搜索beautifulsoup4——install package!

这样就可以在.py文件中导入模块了!

2.beautifulsoup4库使用

import requests
# 虽然库名叫做beautiful4 但是在导入时 使用的是其缩写bs4 其中BeautifulSoup是一个类名
from bs4 import BeautifulSoup

url = 'https://www.baidu.com/s?'
# 由于一般网站都是供用户访问 如果检测到User-Agent是黑客或者其他可能拒绝访问 故此处模拟浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
# 以防乱码 此处将其编码设置为utf-8 因为有中文
response.encoding = 'utf-8'
# print(response.text)
# 使用的解析器是html.parser 注意是.奥
soup = BeautifulSoup(response.text, 'html.parser')
# 打印解析后的结果
print(soup.prettify())

需要讲解的都在代码注释中了奥!

3.beautifulsoup4库基本元素

beautifulsoup4库是解析、遍历、维护“标签树”的功能库。

首先来看BeautifulSoup库解析器,前两个比较常用!

在上述代码的基础上,增加如下几行,结合基本元素的使用,可得到如图所示。

需要注意的是,.string可以跨标签,所以很有可能结果也为注释,为了区分是标签内的字符串还是注释,可以通过打印类型来判断。

接下来,看一下BeautifulSoup库的遍历,其中画红框的迭代遍历,可以用于for in循环中。

4.beautifulsoup4库的HTML查找方法

find_all( name , attrs , recursive , string , **kwargs )

find_all() 方法搜索当前tag的所有tag子节点,并判断是否符合过滤器的条件。

name 参数可以对名字为 name 的标签进行检索。

attrs参数可以对标签属性值为attrs的标签进行检索。

recursive参数表示是否对子孙全部检索,默认是TRUE,如果只想搜索当前节点的儿子信息,可以置其为FALSE。

string 参数可以标签中的字符串内容进行检索。

5.补充Json(Javascript Object Notation)

我们学过js的或者java的,应该对Json不陌生吧!

Json是一种有类型的键值对!

需要注意的是,键和值都需要用"“括起来,如果值是整数,则可以不用”"!

如果值是多值,则可以用[,];如果值是键值对,则可以用{:,:,},可以嵌套使用。

JSON一般用于接口,而YAML是无类型键值对,一般用于配置文件。

到此这篇关于基于pycharmbeautifulsoup4库使用方法教程的文章就介绍到这了,更多相关pycharmbeautifulsoup4库使用内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 使用Python快速搭建文件传输服务的方法

    使用Python快速搭建文件传输服务的方法

    这篇文章主要介绍了使用Python快速搭建一个文件传输服务,这样任何一个人都能打开浏览器把他电脑上的文件传给我了,本文给大家介绍的非常详细,需要的朋友可以参考下
    2023-07-07
  • MySQL最常见的操作语句小结

    MySQL最常见的操作语句小结

    这篇文章主要介绍了MySQL最常见的操作语句小结,与表和库相关的这些语句是学习MySQL中最基础的知识,需要的朋友可以参考下
    2015-05-05
  • 深入解析Python中BeautifulSoup4的基础知识与实战应用

    深入解析Python中BeautifulSoup4的基础知识与实战应用

    BeautifulSoup4正是一款功能强大的解析器,能够轻松解析HTML和XML文档,本文将介绍BeautifulSoup4的基础知识,并通过实际代码示例进行演示,感兴趣的可以了解下
    2024-02-02
  • python创建n行m列数组示例

    python创建n行m列数组示例

    今天小编就为大家分享一篇python创建n行m列数组示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • python利用socketserver实现并发套接字功能

    python利用socketserver实现并发套接字功能

    这篇文章主要为大家详细介绍了python利用socketserver实现并发套接字功能,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-01-01
  • python的pdb调试命令的命令整理及实例

    python的pdb调试命令的命令整理及实例

    这篇文章主要介绍了python的pdb调试命令的命令整理及实例的相关资料,需要的朋友可以参考下
    2017-07-07
  • python3.x 生成3维随机数组实例

    python3.x 生成3维随机数组实例

    今天小编就为大家分享一篇python3.x 生成3维随机数组实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-11-11
  • python使用mailbox打印电子邮件的方法

    python使用mailbox打印电子邮件的方法

    这篇文章主要介绍了python使用mailbox打印电子邮件的方法,涉及Python打印电子邮件的相关技巧,需要的朋友可以参考下
    2015-04-04
  • Python生成不重复随机值的方法

    Python生成不重复随机值的方法

    这篇文章主要介绍了Python生成不重复随机值的方法,实例分析了Python算法实现与Python自带方法的实现技巧,非常简单实用,需要的朋友可以参考下
    2015-05-05
  • Python多维/嵌套字典数据无限遍历的实现

    Python多维/嵌套字典数据无限遍历的实现

    下面小编就为大家带来一篇Python多维/嵌套字典数据无限遍历的实现。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2016-11-11

最新评论