Python采集代理ip并判断是否可用和定时更新的方法

 更新时间:2018年05月07日 11:05:16   作者:lilongsy  
今天小编就为大家分享一篇Python采集代理ip并判断是否可用和定时更新的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

网上有很多免费的ip地址,都是可以使用的,但是如果手动来获取太麻烦,这里通过Python自动抓取,可以批量获取。

代码如下:

# -*- coding: utf-8 -*-
import re
import urllib2
import json
import os
import time
import socket

class ProxyIp(object):
  def __init__(self):
    self.path = os.path.split(os.path.realpath(__file__))[0]
  # Get latest proxy ip and download to json
  def update_ip(self):
    print 'Update Ip'
    url = 'http://www.ip3366.net/free/'
    req = urllib2.Request(url)
    response = urllib2.urlopen(req)
    matches = re.findall(
      ur'(\d+.\d+.\d+.\d+)</td>\s+<td>(\d+)</td>\s+<td>.*?</td>\s+<td>(HTTPS?)</td>',
      response.read(),
      re.I
    )
    ls = []
    for match in matches:
      if self.is_open(match[0], match[1]):
        ls.append({'ip':match[0], 'port':match[1], 'protocol': match[2]})
    with open('%s/ip.json' % self.path, 'w') as f:
      json.dump(ls, f)
    return ls
  # whether the ips is last or old.
  def is_last(self):
    m_time = int(os.path.getmtime('%s/ip.json' % self.path))
    now_time = int(time.time())
    return (now_time - m_time) > 60*60*4 # 4 hours
  @staticmethod
  def is_open(ip, port):
    s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    try:
      s.connect(ip, int(port))
      return True
    except:
      print 'Faild IP: %s:%s' % (ip, port)
      return False
  def get_proxy_ips(self):
    if not self.is_last():
      return self.update_ip()
    else:
      with open('%s/ip.json' % self.path, 'r') as f:
        return json.load(f)

以上这篇Python采集代理ip并判断是否可用和定时更新的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python中replace方法实例分析

    Python中replace方法实例分析

    这篇文章主要介绍了Python中replace方法,有一定的实用价值,需要的朋友可以参考下
    2014-08-08
  • Python 中pandas索引切片读取数据缺失数据处理问题

    Python 中pandas索引切片读取数据缺失数据处理问题

    pandas是一个Python软件包,提供快速,灵活和富于表现力的数据结构,旨在使使用“关系”或“标记”数据既简单又直观。这篇文章主要介绍了pandas索引切片读取数据缺失数据处理,需要的朋友可以参考下
    2019-10-10
  • python中string模块各属性以及函数的用法介绍

    python中string模块各属性以及函数的用法介绍

    下面小编就为大家带来一篇python中string模块各属性以及函数的用法介绍。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2016-05-05
  • 使用tf.keras.MaxPooling1D出现错误问题及解决

    使用tf.keras.MaxPooling1D出现错误问题及解决

    这篇文章主要介绍了使用tf.keras.MaxPooling1D出现错误问题及解决方案,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-12-12
  • Python中使用封装类还是函数以及它们的区别

    Python中使用封装类还是函数以及它们的区别

    在Python编程中,类和函数都是重要的代码组织工具,但它们在封装性、状态保持、可重用性、继承与多态、设计模式、代码组织、执行流程、参数传递、返回值和上下文管理等方面存在明显区别
    2024-10-10
  • python画双y轴图像的示例代码

    python画双y轴图像的示例代码

    今天小编就为大家分享一篇python画双y轴图像的示例代码,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • 两个很实用的Python装饰器详解

    两个很实用的Python装饰器详解

    这篇文章主要为大家介绍了Python的装饰器,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助,希望能够给你带来帮助
    2021-11-11
  • 基于windows下pip安装python模块时报错总结

    基于windows下pip安装python模块时报错总结

    今天小编就为大家分享一篇基于windows下pip安装python模块时报错总结,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • python里glob模块知识点总结

    python里glob模块知识点总结

    在本篇文章里小编给大家整理的是一篇关于python里glob模块知识点总结,有需要的朋友们可以参考下。
    2021-01-01
  • 分享Python切分字符串的一个不错方法

    分享Python切分字符串的一个不错方法

    今天小编就为大家分享一篇Python切分字符串的一个不错方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12

最新评论