用python爬取今日说法每期数据

 更新时间:2022年02月10日 16:37:58   作者:Aaron_Yang.  
大家好,本篇文章主要讲的是用python爬取今日说法每期数据,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下

实验目的

主要是获取2021年今日说法每期节目主要内容及时间
今日说法的网址为:http://tv.cctv.com/lm/jrsf/index.shtml
当时怎么写的思路有点不太记得了,先把代码贴上,后续有时间再补上。

代码

import xlwt
import re

import requests


# url = "https://tv.cctv.com/lm/jrsf/index.shtml"

def get_data(page):
    url = 'https://api.cntv.cn/NewVideo/getVideoListByColumn?id=TOPC145146466500891' \
          '4&n=1000&sort=desc&p={pageNo}&mode=0&serviceId=tvcctv&cb=Callback'.format(pageNo=page)
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
                      '(KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36'
    }
    response = requests.get(url=url, headers=headers)
    return response.text
    # print(response.text)


if __name__ == "__main__":

    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
                      '(KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36'
    }

    book = xlwt.Workbook(encoding='utf-8', style_compression=0)
    sheet = book.add_sheet('今日说法', cell_overwrite_ok=True)

    count = 0
    for page in range(1,5):
        page_content = get_data(page)
        obj = re.compile(r'url":"(.*?.shtml)"', re.S)
        imgUrl = re.findall(obj, page_content.replace('\\', ''))
        for i in range(len(imgUrl)):
            resp = requests.get(url=imgUrl[i], headers=headers)
            resp.encoding = 'utf-8'

            obj2 = re.compile(r'更新时间:</em>(.*?)</p>', re.S)
            time = re.findall(obj2, resp.text)
            obj3 = re.compile(r'视频简介:</em>(.*?)</p>', re.S)
            jianjie = re.findall(obj3, resp.text)
            content = []
            content.append(time)
            content.append(jianjie)
            for j in range(2):
                sheet.write(count, j, content[j])
                count+=1

    book.save("./data_5.xls")

实验结果

在这里插入图片描述

总结

到此这篇关于用python爬取今日说法每期数据的文章就介绍到这了,更多相关python爬取今日说法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Win10 安装PyCharm2019.1.1(图文教程)

    Win10 安装PyCharm2019.1.1(图文教程)

    这篇文章主要介绍了Win10 安装PyCharm2019.1.1(图文教程),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-09-09
  • Python字符串的常见操作实例小结

    Python字符串的常见操作实例小结

    这篇文章主要介绍了Python字符串的常见操作,结合实例形式总结分析了Python字符串的查询、转换、分割、计算等相关操作技巧,需要的朋友可以参考下
    2019-04-04
  • 解析Python的缩进规则的使用

    解析Python的缩进规则的使用

    这篇文章主要介绍了解析Python的缩进规则的使用,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-01-01
  • Pytorch转onnx、torchscript方式

    Pytorch转onnx、torchscript方式

    这篇文章主要介绍了Pytorch转onnx、torchscript方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05
  • Python 在OpenCV里实现仿射变换—坐标变换效果

    Python 在OpenCV里实现仿射变换—坐标变换效果

    这篇文章主要介绍了Python 在OpenCV里实现仿射变换—坐标变换效果,本文通过一个例子给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-08-08
  • Python3批量移动指定文件到指定文件夹方法示例

    Python3批量移动指定文件到指定文件夹方法示例

    这篇文章主要给大家介绍了关于Python3批量移动指定文件到指定文件夹的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Python3具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-09-09
  • 用Python实现写倒序输出(任意位数)

    用Python实现写倒序输出(任意位数)

    这篇文章主要介绍了用Python实现写倒序输出(任意位数),具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-05-05
  • Python编程中的文件读写及相关的文件对象方法讲解

    Python编程中的文件读写及相关的文件对象方法讲解

    这篇文章主要介绍了Python编程中的文件读写及相关的文件对象方法讲解,其中文件对象方法部分讲到了对文件内容的输入输出操作,需要的朋友可以参考下
    2016-01-01
  • Python下singleton模式的实现方法

    Python下singleton模式的实现方法

    这篇文章主要介绍了Python下singleton模式的实现方法,有一定的借鉴价值,需要的朋友可以参考下
    2014-07-07
  • python获取系统内存占用信息的实例方法

    python获取系统内存占用信息的实例方法

    在本篇文章里小编给大家整理的是关于python获取系统内存占用信息的实例方法,有需要的朋友们可以参考学习下。
    2020-07-07

最新评论