使用Python生成url短链接的方法

 更新时间:2015年05月04日 15:13:35   投稿:goldensun  
这篇文章主要介绍了使用Python生成url短链接的方法,短链接在如今在微博等社交网站中等是非常常见的功能,需要的朋友可以参考下

几乎所有的微薄都提供了缩短网址的服务,其原理就是将一个url地址按照一定的算法生成一段字符串,然后加在一个短域名后面边成了一个新的url地址,数据库中会存放这个短地址和原始的地址,当用户点击这个新的短地址后,短地址服务会根据短域名后面的几个字符串从数据库中读出原来的地址然后页面进行跳转 。

比如新浪微薄中的url 是 http://t.cn/xxxxxxx  t.cn是其域名 ,其后面跟着的是7位算出来的字符串。
方法一:使用哈希库自定义算法

因为文本中显示太长的url会比较乱,或者采用省略显示的方式,或者采用短url的方式.

为了同时方便统计点击数以及进行内容过滤.实现了一个生成短url值的方法.

为了防止你的hash值被破解,可以在生成md5值的时候加入你自己的salt.

这样即便直到你的code_map也不能破解到原始url了.

为了让结果更加随机,把每次循环没有使用的第二个bit保存到e里面.这样可以让结果冲突率更小.

#引入哈希库
import hashlib 
    
def get_md5(s): 
  s = s.encode('utf8') if isinstance(s, unicode) else s 
  m = hashlib.md5() 
  m.update(s) 
  return m.hexdigest() 
    
code_map = ( 
      'a' , 'b' , 'c' , 'd' , 'e' , 'f' , 'g' , 'h' , 
      'i' , 'j' , 'k' , 'l' , 'm' , 'n' , 'o' , 'p' , 
      'q' , 'r' , 's' , 't' , 'u' , 'v' , 'w' , 'x' , 
      'y' , 'z' , '0' , '1' , '2' , '3' , '4' , '5' , 
      '6' , '7' , '8' , '9' , 'A' , 'B' , 'C' , 'D' , 
      'E' , 'F' , 'G' , 'H' , 'I' , 'J' , 'K' , 'L' , 
      'M' , 'N' , 'O' , 'P' , 'Q' , 'R' , 'S' , 'T' , 
      'U' , 'V' , 'W' , 'X' , 'Y' , 'Z'
      ) 
    
    
def get_hash_key(long_url): 
  hkeys = [] 
  hex = get_md5(long_url) 
  for i in xrange(0, 4): 
    n = int(hex[i*8:(i+1)*8], 16) 
    v = [] 
    e = 0
    for j in xrange(0, 5): 
      x = 0x0000003D & n 
      e |= ((0x00000002 & n ) >> 1) << j 
      v.insert(0, code_map[x]) 
      n = n >> 6
    e |= n << 5
    v.insert(0, code_map[e & 0x0000003D]) 
    hkeys.append(''.join(v)) 
  return hkeys 
    
if __name__ == '__main__': 
  print get_hash_key('http://www.pythontab.com')

方法二:使用libsurl库

libsurl 是一个用来生成短URL的C和Python库,支持 bit.ly 和 tinyurl 等短url 服务网站。

相关文章

  • LyScript获取上一条与下一条汇编指令的方法详解

    LyScript获取上一条与下一条汇编指令的方法详解

    LyScript 插件默认并没有提供上一条与下一条汇编指令的获取功能,当然你可以使用LyScriptTools工具包直接调用内置命令得到,本文就为大家详细讲讲如何实现
    2022-07-07
  • Python如何将图像音视频等资源文件隐藏在代码中(小技巧)

    Python如何将图像音视频等资源文件隐藏在代码中(小技巧)

    有朋友问小编使用pyinstaller打包源码时,因为代码中使用了图像、音频、视频等资源文件,无法将程序打包成单一的可执行文件,怎么处理呢,下面小编通过代码给大家介绍Python如何将图像音视频等资源文件隐藏在代码中,感兴趣的朋友一起看看吧
    2020-02-02
  • PyTorch Tensor创建实现

    PyTorch Tensor创建实现

    本文主要介绍了PyTorch Tensor创建实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-06-06
  • python实现域名系统(DNS)正向查询的方法

    python实现域名系统(DNS)正向查询的方法

    这篇文章主要介绍了python实现域名系统(DNS)正向查询的方法,结合实例形式分析了Python使用socket模块下getaddrinfo方法进行域名查询的具体技巧,需要的朋友可以参考下
    2016-04-04
  • Django-xadmin+rule对象级权限的实现方式

    Django-xadmin+rule对象级权限的实现方式

    今天小编就为大家分享一篇Django-xadmin+rule对象级权限的实现方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • Python爬虫实战之爬取某宝男装信息

    Python爬虫实战之爬取某宝男装信息

    网络爬虫是一种按照一定的规则自动浏览、检索网页信息的程序或者脚本。网络爬虫能够自动请求网页,并将所需要的数据抓取下来。本文将为大家介绍如何利用爬虫获取某宝男装信息,感兴趣的小伙伴可以了解一下
    2021-12-12
  • python实现扫雷游戏

    python实现扫雷游戏

    这篇文章主要为大家详细介绍了python实现扫雷游戏,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-03-03
  • 详解Python常用标准库之时间模块time和datetime

    详解Python常用标准库之时间模块time和datetime

    time和datetime是Python中常用的两个时间模块,本文将通过示例详细为大家讲讲二者的使用方法,感兴趣的小伙伴可以跟随小编一起学习学习
    2022-05-05
  • Python报错no module named torch的几种原因及解决方案

    Python报错no module named torch的几种原因及解决方案

    这篇文章主要给大家介绍了关于Python报错no module named torch的几种原因及解决方案,这是小白时常犯的错,这个报错一般说明在你电脑当前环境下没有安装torch这个模块,但也有其他情况,需要的朋友可以参考下
    2023-10-10
  • Python生产者与消费者模型中的优势介绍

    Python生产者与消费者模型中的优势介绍

    这篇文章主要介绍了python多进程中的生产者和消费者模型优势,生产者是指生产数据的任务,消费者是指消费数据的任务。当生产者的生产能力远大于消费者的消费能力,生产者就需要等消费者消费完才能继续生产新的数据
    2023-03-03

最新评论