python模拟登录百度代码分享(获取百度贴吧等级)

 更新时间:2013年12月27日 10:28:24   作者:  
python模拟登录百度,实现了登录并读取百度关注贴吧列表,百度登录还是有点麻烦的,由于用的ssl,所以要先获取token,然后再登录,这个用finddle2分析下,还是比较好解决的

复制代码 代码如下:

# -*- coding: utf8 -*-
'''
Created on 2013-12-19

@author: good-temper
'''

import urllib2
import urllib
import cookielib
import re
import bs4

URL_BAIDU_INDEX = u'http://www.baidu.com/';
#https://passport.baidu.com/v2/api/?getapi&class=login&tpl=mn&tangram=true 也可以用这个
URL_BAIDU_TOKEN = 'https://passport.baidu.com/v2/api/?getapi&tpl=pp&apiver=v3&class=login';
URL_BAIDU_LOGIN = 'https://passport.baidu.com/v2/api/?login';

#设置用户名、密码
username = '';
password = '';

#设置cookie,这里cookiejar可自动管理,无需手动指定
cj = cookielib.CookieJar();
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj));
urllib2.install_opener(opener);
reqReturn = urllib2.urlopen(URL_BAIDU_INDEX);

#获取token,
tokenReturn = urllib2.urlopen(URL_BAIDU_TOKEN);
matchVal = re.search(u'"token" : "(?P<tokenVal>.*?)"',tokenReturn.read());
tokenVal = matchVal.group('tokenVal');

#构造登录请求参数,该请求数据是通过抓包获得,对应https://passport.baidu.com/v2/api/?login请求
postData = {
    'username' : username,
    'password' : password,
    'u' : 'https://passport.baidu.com/',
    'tpl' : 'pp',
    'token' : tokenVal,
    'staticpage' : 'https://passport.baidu.com/static/passpc-account/html/v3Jump.html',
    'isPhone' : 'false',
    'charset' : 'UTF-8',
    'callback' : 'parent.bd__pcbs__ra48vi'
    };
postData = urllib.urlencode(postData);

#发送登录请求
loginRequest = urllib2.Request(URL_BAIDU_LOGIN,postData);
loginRequest.add_header('Accept','text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8');
loginRequest.add_header('Accept-Encoding','gzip,deflate,sdch');
loginRequest.add_header('Accept-Language','zh-CN,zh;q=0.8');
loginRequest.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.72 Safari/537.36');
loginRequest.add_header('Content-Type','application/x-www-form-urlencoded');
sendPost = urllib2.urlopen(loginRequest);

#查看贴吧个人主页 ,测试是否登陆成功,由于cookie自动管理,这里处理起来方便很多
#http://tieba.baidu.com/home/main?un=XXXX&fr=index 这个是贴吧个人主页,各项信息都可以在此找到链接
teibaUrl = 'http://tieba.baidu.com/f/like/mylike?v=1387441831248'
content = urllib2.urlopen(teibaUrl).read();
content = content.decode('gbk').encode('utf8');
print content;

#解析数据,用的BeautifulSoup4,感觉没有jsoup用的爽
soup = bs4.BeautifulSoup(content);
list = soup.findAll('tr');
list = list[1:len(list)];
careTeibalist = [];
print '贴吧链接\t吧名\t等级';
for elem in list:
    soup1 = bs4.BeautifulSoup(str(elem));
    print 'http://tieba.baidu.com/'+soup1.find('a')['href']+'\t'+soup1.find('a')['title']+'\t'+soup1.find('a',{'class','like_badge'})['title'];

相关文章

  • 使用Python脚本在Linux下实现部分Bash Shell的教程

    使用Python脚本在Linux下实现部分Bash Shell的教程

    这篇文章主要介绍了使用Python脚本在Linux下实现部分Bash Shell的教程,包括一些简单的输入输出和邮件功能,需要的朋友可以参考下
    2015-04-04
  • 如何在Python 中使用 Luhn 算法验证数字

    如何在Python 中使用 Luhn 算法验证数字

    Luhn 算法验证器有助于检查合法数字并将其与不正确或拼写错误的输入分开,这篇文章主要介绍了在Python中使用Luhn算法验证数字,需要的朋友可以参考下
    2023-06-06
  • 利用Python产生加密表和解密表的实现方法

    利用Python产生加密表和解密表的实现方法

    这篇文章主要介绍了利用Python产生加密表和解密表的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-10-10
  • Python中元组的概念及应用小结

    Python中元组的概念及应用小结

    Python中的元组和列表很相似,元组也是Python语言提供的内置数据结构之一,可以在代码中直接使用,这篇文章主要介绍了Python中元组的概念以及应用,需要的朋友可以参考下
    2023-01-01
  • 在pycharm中设置显示行数的方法

    在pycharm中设置显示行数的方法

    今天小编就为大家分享一篇在pycharm中设置显示行数的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • python列表:开始、结束、步长值实例

    python列表:开始、结束、步长值实例

    这篇文章主要介绍了python列表:开始、结束、步长值实例,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-05-05
  • Python实现的ftp服务器功能详解【附源码下载】

    Python实现的ftp服务器功能详解【附源码下载】

    这篇文章主要介绍了Python实现的ftp服务器功能,结合实例形式分析了Python构建ftp服务器功能的相关设置、实现技巧与操作注意事项,并附带源码供读者下载参考,需要的朋友可以参考下
    2019-06-06
  • Python实现的RSS阅读器实例

    Python实现的RSS阅读器实例

    这篇文章主要介绍了Python实现的RSS阅读器,实例分析了XML解析实现RSS阅读的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-07-07
  • python将天数转换为日期字符串的方法实例

    python将天数转换为日期字符串的方法实例

    这篇文章主要给大家介绍了关于python将天数转换为日期字符串的相关资料,以及将将字符串的时间转换为时间戳的实例代码,需要的朋友可以参考下
    2022-01-01
  • Tensorflow tf.nn.depthwise_conv2d如何实现深度卷积的

    Tensorflow tf.nn.depthwise_conv2d如何实现深度卷积的

    这篇文章主要介绍了Tensorflow tf.nn.depthwise_conv2d如何实现深度卷积的,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-04-04

最新评论