Python采集C站热榜数据实战示例

更新时间：2023年05月05日 11:39:36 作者：极客飞虎

这篇文章主要为大家介绍了Python采集C站热榜数据实战示例详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪

前言

大家好，我们今天来爬取c站的热搜榜，把其文章名称，链接和作者获取下来，我们保存到本地，我们通过测试，发现其实很简单，我们只要简单获取数据就可以。没有加密的东西。

功能实现

我们话不多说，我们先找到url，也就是请求地址。我们代码如下：

url = 'https://blog.csdn.net/phoenix/web/blog/hot-rank?page=0&pageSize=25&type=' 
headers = {  
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36'}  
res = requests.get(url, headers=headers)

我们这里首先定义了一个 url 变量，它表示要访问的 URL。然后，它定义了一个 headers 变量，其中包含了一些 HTTP 请求头信息，如 User-Agent 表示 HTTP 请求的 User-Agent。最后，它使用 requests.get() 函数发送 HTTP GET 请求，并将 headers 变量作为参数传递给该函数。

解析数据

我们获取到了内容，接下来就是解析数据，我们不难发现这个是一个json数据，我们直接取值就好了，我们来看看代码怎么写。

datas = res.json()['data']   
for data in datas:    
    period = data['period']  
    nickName = data['nickName']  
    articleTitle = data['articleTitle']  
    articleDetailUrl = data['articleDetailUrl']  
    viewCount = data['viewCount']  
    commentCount = data['commentCount']  
    favorCount = data['favorCount']  
    hotRankScore = data['hotRankScore']
    print(period,nickName,articleTitle,avatarUrl,viewCount,favorCount,commentCount,hotRankScore)

我们将从 res.json() 中获取 data 数据，并将其存储在 datas 变量中。res.json() 返回的是一个包含多个字典的对象，每个字典代表一个数据。

在这个例子中，res.json() 返回的字典中的 data 字段的值为 [{'period': '1', 'nickName': '', 'articleTitle': '', 'articleDetailUrl': '', 'viewCount': '', 'commentCount': '', 'favorCount': '', 'hotRankScore': '0.08536632385314886', 'avatarUrl': 'null', 'viewCount': '0', 'favorCount': '0', 'commentCount': '0', 'hotRankScore': '0.08536633735229816'}]，我们使用这个数据来遍历 datas 变量中的每个字典。

在每个字典中，我们使用 data 字段的值来获取期数、昵称、标题、详细URL、访问次数、评论次数、喜欢次数、热门排名分数。

保存数据

now_time =time.strftime('%Y-%m-%d-%H-%M',time.localtime(time.time()))  
f = open(f'{now_time}热榜数据.csv', mode='a', encoding='utf-8', newline='')  
csv_writer = csv.DictWriter(f, fieldnames=['日期', '姓名', '文章标题', '文章链接', '浏览量',  
'评论量', '收藏量', '热榜值'])  
csv_writer.writeheader()

我们首先打开一个名为 data.csv 的文件，并指定使用 a 模式打开文件。然后，使用 csv.DictWriter() 函数创建一个 CSV 写入器，并指定要写入的列名。在这个例子中，我们指定了 fieldnames 参数，它包含了我们要写入的列名。

接下来，我们使用 csv_writer.writeheader() 方法写入列名。这个方法会将列名写入文件的第一行。

最后，我们使用 csv_writer.writerow() 方法写入数据。

我们先写入字典。

dit = {'日期': period, '姓名': nickName, '文章标题': articleTitle, '文章链接': articleDetailUrl, '浏览量': viewCount,  
'评论量': commentCount, '收藏量': favorCount, '热榜值': hotRankScore}  
print(dit)  
csv_writer.writerow(dit)

这段代码创建了一个字典dit，其中包含了每个元素的值。然后，它使用csv_writer.writerow()方法将字典写入CSV文件中。

总结

以上就是Python采集C站热榜数据实战示例的详细内容，更多关于Python采集C站热榜数据的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

浅谈Pytorch中的自动求导函数backward()所需参数的含义
今天小编就为大家分享一篇浅谈Pytorch中的自动求导函数backward()所需参数的含义，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-02-02
python 不以科学计数法输出的方法
今天小编就为大家分享一篇python 不以科学计数法输出的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-07-07
基于python的docx模块处理word和WPS的docx格式文件方式
今天小编就为大家分享一篇基于python的docx模块处理word和WPS的docx格式文件方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-02-02
python 实现从高分辨图像上抠取图像块
今天小编就为大家分享一篇python 实现从高分辨图像上抠取图像块，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-01-01
Python连接Oracle数据库的操作指南
Oracle数据库是一种强大的企业级关系数据库管理系统（RDBMS）,而Python是一门流行的编程语言,两者的结合可以提供出色的数据管理和分析能力,本教程将详细介绍如何在Python中连接Oracle数据库,并演示常见的数据库任务,需要的朋友可以参考下
2023-11-11
python正则表达式re.search()的基本使用教程
正则表达式是我们日常开发中必然会遇到的，下面这篇文章主要介绍了python正则表达式re.search()的基本使用教程，需要的朋友可以参考下
2021-05-05
Pandas查询数据df.query的使用
本文主要介绍了Pandas查询数据df.query的使用，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2022-07-07
opencv-python图像处理安装与基本操作方法
OpenCV是一个C++库,目前流行的计算机视觉编程库,用于实时处理计算机视觉方面的问题,它涵盖了很多计算机视觉领域的模块。在Python中常使用OpenCV库实现图像处理。本文介绍opencv-python图像处理安装与基本操作，感兴趣的朋友一起看看吧
2022-01-01
python GUI库图形界面开发之PyQt5布局控件QGridLayout详细使用方法与实例
这篇文章主要介绍了python GUI库图形界面开发之PyQt5布局控件QGridLayout详细使用方法与实例,需要的朋友可以参考下
2020-03-03
Django 使用logging打印日志的实例
下面小编就为大家分享一篇Django 使用logging打印日志的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-04-04

Python采集C站热榜数据实战示例

目录

前言

功能实现

解析数据

保存数据

总结

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具