Python实现抓取网页并且解析的实例

 更新时间:2014年09月20日 17:39:07   投稿:shichen2014  
这篇文章主要介绍了Python实现抓取网页并且解析的功能实例,主要以解析百度问答为例说明其原理与方法,需要的朋友可以参考下

本文以实例形式讲述了Python实现抓取网页并解析的功能。主要解析问答与百度的首页。分享给大家供大家参考之用。

主要功能代码如下:

#!/usr/bin/python
#coding=utf-8

import sys 
import re
import urllib2
from urllib import urlencode
from urllib import quote
import time
maxline = 2000

wenda = re.compile("href=\"http://wenda.so.com/q/.+\?src=(.+?)\"")
baidu = re.compile("<a href=\"http://www.baidu.com/link\?url=.+\".*?>更多知道相关问题.*?</a>")
f1 = open("baidupage.txt","w")
f2 = open("wendapage.txt","w")

for line in sys.stdin:
  if maxline == 0:
    break
  query = line.strip();
  time.sleep(1);
  recall_url = "http://www.so.com/s?&q=" + query;
  response = urllib2.urlopen(recall_url);
  html = response.read();                                                   
  f1.write(html)
  m = wenda.search(html);
  if m:
    if m.group(1) == "110":
      print query + "\twenda\t0";
    else:
      print query + "\twenda\t1";
  else:
    print query + "\twenda\t0";
  recall_url = "http://www.baidu.com/s?wd=" + query +"&ie=utf-8";
  response = urllib2.urlopen(recall_url);
  html = response.read();
  f2.write(html)
  m = baidu.search(html);
  if m:
    print query + "\tbaidu\t1";
  else:
    print query + "\tbaidu\t0";
  maxline = maxline - 1;
f1.close()
f2.close()

希望本文所述对大家Python程序设计的学习有所帮助。

相关文章

  • python装饰器中@property属性的使用解析

    python装饰器中@property属性的使用解析

    这篇文章主要介绍了python装饰器中@property属性的使用解析,property属性是一种用起来像是使用的实例属性一样的特殊属性,可以对应于某个方法,需要的朋友可以参考下
    2023-09-09
  • python爬虫 批量下载zabbix文档代码实例

    python爬虫 批量下载zabbix文档代码实例

    这篇文章主要介绍了python爬虫 批量下载zabbix文档代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • Python爬虫爬取、解析数据操作示例

    Python爬虫爬取、解析数据操作示例

    这篇文章主要介绍了Python爬虫爬取、解析数据操作,结合实例形式分析了Python爬虫爬取、解析、存储数据相关操作技巧与注意事项,需要的朋友可以参考下
    2020-03-03
  • python爬虫爬取监控教务系统的思路详解

    python爬虫爬取监控教务系统的思路详解

    这篇文章主要介绍了python爬虫监控教务系统,主要实现思路是对已有的成绩进行处理,变为list集合,本文通过实例代码给大家介绍的非常详细,需要的朋友可以参考下
    2020-01-01
  • Python 将RGB图像转换为Pytho灰度图像的实例

    Python 将RGB图像转换为Pytho灰度图像的实例

    下面小编就为大家带来一篇Python 将RGB图像转换为Pytho灰度图像的实例。具有很好的参考价值。希望对大家有所帮助。一起跟随小编过来看看吧
    2017-11-11
  • 教你使用pyqt实现桌面歌词功能

    教你使用pyqt实现桌面歌词功能

    最近无事看到了电脑桌面又想到了最近入门的pyqt5,所以下面这篇文章主要给大家介绍了关于如何使用pyqt实现桌面歌词功能的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
    2022-07-07
  • 聊聊Python pandas 中loc函数的使用,及跟iloc的区别说明

    聊聊Python pandas 中loc函数的使用,及跟iloc的区别说明

    这篇文章主要介绍了聊聊Python pandas 中loc函数的使用,及跟iloc的区别说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • Python实现把utf-8格式的文件转换成gbk格式的文件

    Python实现把utf-8格式的文件转换成gbk格式的文件

    这篇文章主要介绍了Python实现把utf-8格式的文件转换成gbk格式的文件,本文给出了实现代码并同时剖析了代码的作用,需要的朋友可以参考下
    2015-01-01
  • Python对象的生命周期源码学习

    Python对象的生命周期源码学习

    这篇文章主要为大家介绍了Python对象的生命周期源码学习,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • 教你安装python Django(图文)

    教你安装python Django(图文)

    web开发语言越来越多,本文是安装python Django,看完之后就可以使用PYTHON做开发了。
    2013-11-11

最新评论