python实现mysql的读写分离及负载均衡

更新时间：2018年02月04日 09:33:58 作者：lc19861217

这篇文章主要介绍了python实现mysql的读写分离及负载均衡 ,需要的朋友可以参考下

Oracle数据库有其公司开发的配套rac来实现负载均衡，目前已知的最大节点数能到128个，但是其带来的维护成本无疑是很高的，并且rac的稳定性也并不是特别理想，尤其是节点很多的时候。

但是，相对mysql来说，rac的实用性要比mysql的配套集群软件mysql-cluster要高很多。因为从网上了解到情况来看，很少公司在使用mysql-cluster，大多数企业都会选择第三方代理软件，例如MySQL Proxy、Mycat、haproxy等，但是这会引起另外一个问题：单点故障(包括mysql-cluster：管理节点)。如果要解决这个问题，就需要给代理软件搭建集群，在访问量很大的情况下，代理软件的双机或三机集群会成为访问瓶颈，继续增加其节点数，无疑会带来各方面的成本。

那么，如何可以解决这个问题呢？

解决上述问题，最好的方式个人认为应该是在程序中实现。通过和其他mysql DBA的沟通，也证实了这个想法。但是由此带来的疑问也就产生了：会不会增加开发成本？对现有的应用系统做修改会不会改动很大？会不会增加后期版本升级的难度？等等。

对于一个架构设计良好的应用系统可以很肯定的回答：不会。

那么怎么算一个架构设计良好的应用系统呢？

简单来说，就是分层合理、功能模块之间耦合性底。以本人的经验来说，系统设计基本上可以划分为以下四层：

1. 实体层：主要定义一些实体类

2. 数据层：也可以叫SQL处理层。主要负责跟数据库交互取得数据

3. 业务处：主要是根据业务流程及功能区分模块(或者说定义不同的业务类)

4. 表现层：呈现最终结果给用户

实现上述功能(mysql的读写分离及负载均衡)，在这四个层次中，仅仅涉及到数据层。

严格来说，对于设计良好的系统，只涉及到一个类的一个函数：在数据层中，一般都会单独划分出一个连接类，并且这个连接类中会有一个连接函数，需要改动的就是这个函数：在读取连接字符串之前加一个功能函数返回需要的主机、ip、端口号等信息(没有开发经历的同学可能理解这段话有点费劲)。

流程图如下：

代码如下：

import mmap
import json
import random
import mysql.connector
import time
##公有变量
#dbinfos={
#   "db0":{'host':'192.168.42.60','user':'root','pwd':'Abcd1234','my_user':'root','my_pwd':'Abcd.1234',"port":3306,"database":"","role":"RW","weight":10,"status":1},
#   "db1":{'host':'192.168.42.61','user':'root','pwd':'Abcd1234','my_user':'root','my_pwd':'Abcd.1234',"port":3306,,"database":"":"R","weight":20,"status":1}
#   }
dbinfos={}
mmap_file = None
mmap_time=None
##这个函数返回json格式的字符串，也是实现初始化数据库信息的地方
##使用json格式是为了方便数据转换，从字符串---》二进制--》字符串---》字典
##如果采用其它方式共享dbinfos的方法，可以不用此方式
##配置库的地址
def get_json_str1():
 return json.dumps(dbinfos)
##读取配置库中的内容
def get_json_str():
 try:
  global dbinfos
  cnx = mysql.connector.connect(user='root', password='Abcd.1234',
        host='192.168.42.60',
        database='rwlb')
  cursor = cnx.cursor()
  cmdString="select * from rwlb"
  cnt=-1
  cursor.execute(cmdString)
  for (host,user,pwd,my_user,my_pwd,role,weight,status,port,db ) in cursor:
   cnt=cnt+1
   dict_db={'host':host,'user':user,'pwd':pwd,'my_user':my_user,'my_pwd':my_pwd,"port":port,"database":db,"role":role,"weight":weight,"status":status}
   dbinfos["db"+str(cnt)]=dict_db
  cursor.close()
  cnx.close()
  return json.dumps(dbinfos)
 except:
  cursor.close()
  cnx.close()
  return ""
##判断是否能正常连接到数据库
def check_conn_host():
 try:
  cnx = mysql.connector.connect(user='root', password='Abcd.1234',
        host='192.168.42.60',
        database='rwlb')
  cursor = cnx.cursor()
  cmdString="select user()"
  cnt=-1
  cursor.execute(cmdString)
  for user in cursor:
   cnt=len(user)
  cursor.close()
  cnx.close()
  return cnt
 except :
  return -1;
##select 属于读操作，其他属于写操作-----这里可以划分的更详细,比如执行存储过程等
def analyze_sql_state(sql):
 if "select" in sql:
  return "R"
 else:
  return "W"
##读取时间信息
def read_mmap_time():
 global mmap_time,mmap_file
 mmap_time.seek(0)
 ##初始时间
 inittime=int(mmap_time.read().translate(None, b'\x00').decode())
 ##当前时间
 endtime=int(time.time())
 ##时间差
 dis_time=endtime-inittime
 print("dis_time:"+str(dis_time))
 #重新读取数据
 if dis_time>10:
  ##当配置库正常的情况下才重新读取数据
  print(str(check_conn_host()))
  if check_conn_host()>0:   
   print("read data again")
   mmap_time.seek(0)
   mmap_file.seek(0)
   mmap_time.write(b'\x00')
   mmap_file.write(b'\x00')
   get_mmap_time()
   get_mmap_info()
  else:
   print("can not connect to host")   
 #不重新读取数据
 else:
  print("do not read data again")
##从内存中读取信息，
def read_mmap_info(sql):
 read_mmap_time()
 print("The data is in memory")
 global mmap_file,dict_db
 mmap_file.seek(0)
 ##把二进制转换为字符串
 info_str=mmap_file.read().translate(None, b'\x00').decode()
 #3把字符串转成json格式，方便后面转换为字典使用
 infos=json.loads(info_str) 
 host_count=len(infos)
 ##权重列表
 listw=[]
 ##总的权重数量
 wtotal=0
 ##数据库角色
 dbrole=analyze_sql_state(sql)
 ##根据权重初始化一个列表。这个是比较简单的算法，所以权重和控制在100以内比较好----这里可以选择其他比较好的算法
 for i in range(host_count):
  db="db"+str(i)
  if dbrole in infos[db]["role"]:
   if int(infos[db]["status"])==1:
    w=infos[db]["weight"]
    wtotal=wtotal+w
    for j in range(w):
     listw.append(i)
 if wtotal >0:
  ##产生一个随机数
  rad=random.randint(0,wtotal-1)
  ##读取随机数所在的列表位置的数据
  dbindex=listw[rad]
  ##确定选择的是哪个db
  db="db"+str(dbindex)
  ##为dict_db赋值，即选取的db的信息
  dict_db=infos[db]
  return dict_db
 else :
  return {}
##如果内存中没有时间信息，则向内存红写入时间信息
def get_mmap_time():
 global mmap_time
 ##第二个参数1024是设定的内存大小，单位：字节。如果内容较多，可以调大一点
 mmap_time = mmap.mmap(-1, 1024, access = mmap.ACCESS_WRITE, tagname = 'share_time')
 ##读取有效比特数，不包括空比特
 cnt=mmap_time.read_byte()
 if cnt==0:
  print("Load time to memory")
  mmap_time = mmap.mmap(0, 1024, access = mmap.ACCESS_WRITE, tagname = 'share_time')
  inittime=str(int(time.time()))
  mmap_time.write(inittime.encode())
##如果内存中没有对应信息，则向内存中写信息以供下次调用使用
def get_mmap_info():
 global mmap_file
 ##第二个参数1024是设定的内存大小，单位：字节。如果内容较多，可以调大一点
 mmap_file = mmap.mmap(-1, 1024, access = mmap.ACCESS_WRITE, tagname = 'share_mmap')
 ##读取有效比特数，不包括空比特
 cnt=mmap_file.read_byte()
 if cnt==0:
  print("Load data to memory")
  mmap_file = mmap.mmap(0, 1024, access = mmap.ACCESS_WRITE, tagname = 'share_mmap')
  mmap_file.write(get_json_str().encode())
##测试函数
def test1():
 get_mmap_time()
 get_mmap_info()
 for i in range(10):
  sql="select * from db"
  #sql="update t set col1=a where b=2"
  dbrole=analyze_sql_state(sql)
  dict_db=read_mmap_info(sql)
  print(dict_db["host"])
def test2():
 sql="select * from db"
 res=analyze_sql_state(sql)
 print("select:"+res)
 sql="update t set col1=a where b=2"
 res=analyze_sql_state(sql)
 print("update:"+res)
 sql="insert into t values(1,2)"
 res=analyze_sql_state(sql)
 print("insert:"+res)
 sql="delete from t where b=2"
 res=analyze_sql_state(sql)
 print("delete:"+res)
##类似主函数
if __name__=="__main__":
 test2()

测试结果：

从结果可以看出，只有第一次向内存加载数据，并且按照权重实现了负载均衡。

因为测试函数test1()写的是固定语句，所以读写分离的结果没有显示出来。

另外：测试使用的数据库表结构及数据：

 desc rwlb;
+---------+-------------+------+-----+---------+-------+
| Field | Type  | Null | Key | Default | Extra |
+---------+-------------+------+-----+---------+-------+
| host | varchar(50) | YES |  | NULL |  |
| user | varchar(50) | YES |  | NULL |  |
| pwd  | varchar(50) | YES |  | NULL |  |
| my_user | varchar(50) | YES |  | NULL |  |
| my_pwd | varchar(50) | YES |  | NULL |  |
| role | varchar(10) | YES |  | NULL |  |
| weight | int(11)  | YES |  | NULL |  |
| status | int(11)  | YES |  | NULL |  |
| port | int(11)  | YES |  | NULL |  |
| db  | varchar(50) | YES |  | NULL |  |
+---------+-------------+------+-----+---------+-------+
select * from rwlb;
+---------------+------+----------+---------+-----------+------+--------+--------+------+------+
| host   | user | pwd  | my_user | my_pwd | role | weight | status | port | db |
+---------------+------+----------+---------+-----------+------+--------+--------+------+------+
| 192.168.42.60 | root | Abcd1234 | root | Abcd.1234 | RW |  10 |  1 | NULL | NULL |
| 192.168.42.61 | root | Abcd1234 | root | Abcd.1234 | R |  20 |  1 | NULL | NULL |
+---------------+------+----------+---------+-----------+------+--------+--------+------+------+

总结

以上所述是小编给大家介绍的python实现mysql的读写分离及负载均衡，希望对大家有所帮助，如果大家有任何疑问欢迎给我留言，小编会及时回复大家的！

您可能感兴趣的文章:

Python出现segfault错误解决方法
这篇文章主要介绍了Python出现segfault错误解决方法,分析了系统日志提示segfault错误的原因与对应的解决方法,需要的朋友可以参考下
2016-04-04
Python备份目录及目录下的全部内容的实现方法
下面小编就为大家带来一篇Python备份目录及目录下的全部内容的实现方法。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2016-06-06
python获取局域网占带宽最大3个ip的方法
这篇文章主要介绍了python获取局域网占带宽最大3个ip的方法,涉及Python解析URL参数的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下
2015-07-07
Python数据可视化Pyecharts库实现桑葚图效果
这篇文章主要介绍了Python数据可视化如何使用Pyecharts库来实现桑葚图效果图，文中给出实现的示例代码，有需要的朋友可以借鉴参考想，希望能够有所帮助
2021-09-09
关于如何使用python的gradio库
这篇文章主要介绍了关于如何使用python的gradio库,Gradio是一个功能丰富的Python库，可以让您轻松创建和共享自己的交互式机器学习和深度学习模型,需要的朋友可以参考下
2023-04-04
使用Python Cupy模块加速大规模数值计算实例深究
Cupy是一个基于NumPy的库,专门设计用于在GPU上进行高性能计算,它提供了与NumPy相似的API,因此用户可以很容易地将现有的NumPy代码迁移到Cupy上,从而充分利用GPU的并行计算能力
2023-12-12
对Django外键关系的描述
今天小编就为大家分享一篇对Django外键关系的描述，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-07-07
python实现某考试系统生成word试卷
这篇文章主要为大家详细介绍了python实现某考试系统生成word试卷，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2021-05-05
python3.x实现发送邮件功能
这篇文章主要为大家详细介绍了python3.x实现发送邮件功能，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-05-05
pytorch中的nn.ZeroPad2d()零填充函数实例详解
这篇文章主要介绍了pytorch中的nn.ZeroPad2d()零填充函数实例详解,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2021-04-04

python实现mysql的读写分离及负载均衡

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具