python中django框架通过正则搜索页面上email地址的方法

 更新时间:2015年03月21日 12:39:55   作者:niuniu  
这篇文章主要介绍了python中django框架通过正则搜索页面上email地址的方法,涉及django框架及正则表达式的使用技巧,需要的朋友可以参考下

本文实例讲述了python中django框架通过正则搜索页面上email地址的方法。分享给大家供大家参考。具体实现方法如下:

import re
from django.shortcuts import render
from pattern.web import URL, DOM, abs, find_urls
def index(request):
 """
 find email addresses in requested url or contact page
 """
 error = ''
 emails = set()
 url_string = request.GET.get('url', '')
 EMAIL_REGEX = re.compile(r'[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,6}', re.IGNORECASE)
 # use absolute url or domain name
 url = URL(url_string) if url_string.startswith('http') else URL(domain=url_string,protocol='http')
 if url_string:
 try:
  dom = DOM(url.download(cached=True))
 except Exception, e:
  error = e
 else:
  contact_urls = { url.string }
  # search links of contact page
  for link in dom('a'):
  if re.search(r'contact|about', link.source, re.IGNORECASE):
   contact_urls.add(
   abs(link.attributes.get('href',''), base=url.redirect or url.string))
  for contact_url in contact_urls:
  # download contact page
  dom = DOM(URL(contact_url).download(cached=True))
  # search emails in the body of the page
  for line in dom('body')[0].content.split('\n'):
   found = EMAIL_REGEX.search(line)
   if found:
   emails.add(found.group())
 data = {
 'url': url_string,
 'emails': emails,
 'error': error,
 }
 return render(request, 'index.html', data)

PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg

希望本文所述对大家的Python程序设计有所帮助。

相关文章

  • OpenCV半小时掌握基本操作之图像梯度

    OpenCV半小时掌握基本操作之图像梯度

    这篇文章主要介绍了OpenCV基本操作之图像梯度,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-09-09
  • pycharm中jupyter的使用图文教程

    pycharm中jupyter的使用图文教程

    这篇文章主要介绍了pycharm中jupyter的使用图文教程,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • python使用SimpleXMLRPCServer实现简单的rpc过程

    python使用SimpleXMLRPCServer实现简单的rpc过程

    这篇文章主要介绍了python使用SimpleXMLRPCServer实现简单的rpc过程,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-06-06
  • Matplotlib实现subplot和subplots简单对比

    Matplotlib实现subplot和subplots简单对比

    在画布创建子图会有很多方法,本文主要介绍了Matplotlib实现subplot和subplots简单对比,简单的介绍了这两种方法区别,感兴趣的可以了解一下
    2021-05-05
  • Python安装教程全过程(2022最新)

    Python安装教程全过程(2022最新)

    这篇文章主要介绍了Python安装教程全过程(2022最新版本),具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-12-12
  • python selenium 无界面浏览器的实现

    python selenium 无界面浏览器的实现

    有时我们不想让浏览器窗口跳出来,而是想在后台进行操作,这就需要用到无界面浏览器,本文主要介绍了python selenium 无界面浏览器的实现,具有一定的参考价值,感兴趣的可以了解一下
    2023-10-10
  • python3+PyQt5+Qt Designer实现堆叠窗口部件

    python3+PyQt5+Qt Designer实现堆叠窗口部件

    这篇文章主要为大家详细介绍了python3+PyQt5+Qt Designer实现堆叠窗口部件,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-04-04
  • 使用python实现正则匹配检索远端FTP目录下的文件

    使用python实现正则匹配检索远端FTP目录下的文件

    这篇文章主要介绍了使用python实现正则匹配检索远端FTP目录下的文件的方法,非常的简单实用,需要的小伙伴参考下
    2015-03-03
  • Python Log文件大小设置及备份的方法

    Python Log文件大小设置及备份的方法

    这篇文章主要介绍了Python Log文件大小设置及备份的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-11-11
  • python if三元表达式实例用法详解

    python if三元表达式实例用法详解

    在本篇文章里小编给大家整理的是一篇关于python if三元表达式实例用法详解内容,有兴趣的朋友们可以学习下。
    2021-04-04

最新评论