Python数据解析bs4库使用BeautifulSoup方法示例

 更新时间:2023年08月21日 09:59:25   作者:YiYa_咿呀  
这篇文章主要为大家介绍了Python数据解析bs4库使用BeautifulSoup方法示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

1. 安装bs4库

pip install bs4

2. 使用beautiful soup

用法如下:

find_all:find_all找到所有符合条件的节点

find:find指的是找第一个符合条件的节点

calss_:因为和python中的关键字class重合,因此在后面加个_加以区分

attrs={"":""}:attrs的对象存储条件,此时的class无需加_

import requests
from bs4 import BeautifulSoup
import re
url = "http://www.crazyant.net/"
r = requests.get(url)
if r.status_code != 200:
    raise Exception()
html_doc = r.text
# 创建beautiful soup,将爬取的内容通过BeautifulSoup解析,这里告诉BeautifulSoup这个是爬取到的html页面,默认也是这个,但是会发出警告
soup = BeautifulSoup(html_doc,"html.parser")
# find_all找到所有符合条件的节点,find指的是找第一个
h2_nodes = soup.find_all("h2",class_="entry-title")

3. 使用bs4爬取优美图库的图片

from bs4 import BeautifulSoup
import requests
import time
url = "https://www.umei.cc/weimeitupian/oumeitupian/nvsheng.htm"
resp = requests.get(url)
resp.encoding = 'utf-8'
page = resp.text
soup = BeautifulSoup(page,'html.parser')
oAs = soup.find("div",class_='pic-list').find_all('a')
aLinks = []
for a in oAs:
    aLinks.append("https://www.umei.cc"+str(a.get("href")))
print(aLinks)
for link in aLinks:
    content = requests.get(link)
    content.encoding = 'utf-8'
    img = BeautifulSoup(content.text,'html.parser').find("div",class_='big-pic').find('img')
    src = img.get("src")
    print(img)
    print(src)
    img_name = src.split('/')[-1]
    img_resp = requests.get(src)
    with open('img/'+img_name,mode = "wb") as f:
        f.write(img_resp.content)
    time.sleep(1)
f.close()
resp.close()
img_resp.close()

结果:

以上就是Python数据解析bs4库使用BeautifulSoup方法示例的详细内容,更多关于Python bs4 BeautifulSoup的资料请关注脚本之家其它相关文章!

相关文章

  • Windows自动执行python脚本操作步骤

    Windows自动执行python脚本操作步骤

    我们想在Windows中运行一个Python脚本,我们可以通过CMD,首先进入python文件所在的目录,之后运行。但是这样很麻烦,跟着本文操作就可以解决啦
    2021-09-09
  • python六种基本数据类型及常用函数展示

    python六种基本数据类型及常用函数展示

    这篇文章主要为大家介绍了python六种基本数据类型及常用函数,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2021-11-11
  • Python构建机器学习API服务的操作过程

    Python构建机器学习API服务的操作过程

    这篇文章主要介绍了Python构建机器学习API服务的操作过程,通过本文的指导,读者可以学习如何使用Python构建机器学习模型的API服务,并了解到在实际应用中需要考虑的一些关键问题和解决方案,从而为自己的项目提供更好的支持和服务,需要的朋友可以参考下
    2024-04-04
  • python实现简单的聊天小程序

    python实现简单的聊天小程序

    这篇文章主要为大家详细介绍了python实现简单的聊天小程序,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-07-07
  • python 共现矩阵的实现代码

    python 共现矩阵的实现代码

    这篇文章主要介绍了python 共现矩阵的实现代码,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-07-07
  • fastapi框架异步执行踩坑记录

    fastapi框架异步执行踩坑记录

    这篇文章主要介绍了fastapi框架异步执行踩坑记录,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-06-06
  • vscode和Anaconda安装以及相关环境配置指南

    vscode和Anaconda安装以及相关环境配置指南

    Anaconda是一个开源的python发行版本,是现在比较流行的python数据科学平台,可以对python的科学包做到有效管理,这篇文章主要给大家介绍了关于vscode和Anaconda安装以及相关环境配置指南的相关资料,需要的朋友可以参考下
    2023-11-11
  • python如何通过Json路径返回Json响应对应的值

    python如何通过Json路径返回Json响应对应的值

    这篇文章主要介绍了python如何通过Json路径返回Json响应对应的值问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-06-06
  • python自动化测试Data Driven Testing(DDT)用例解析

    python自动化测试Data Driven Testing(DDT)用例解析

    这篇文章主要为大家介绍了python自动化测试Data Driven Testing(DDT)用例解析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-09-09
  • python抓取京东价格分析京东商品价格走势

    python抓取京东价格分析京东商品价格走势

    本文介绍使用python抓取京东价格的代码,用于分析京东商品价格走势或者用于其它,大家参考使用吧
    2014-01-01

最新评论