linux下使用rsync同步目录

 更新时间:2016年11月14日 16:28:03   作者:Mike_Zhang  
本篇文章详细介绍了linux下使用rsync同步目录,使用rsync同步后可以保持目录的一致性,有需要的可以了解一下。

本文描述了linux下使用rsync单向同步两个机器目录的问题。 使用rsync同步后可以保持目录的一致性(含删除操作)。

数据同步方式

1、从主机拉数据

备机上启动的流程

同步命令:

rsync -avzP --delete root@{remoteHost}:{remoteDir} {localDir}

参数说明:

  • -a 参数,相当于-rlptgoD(-r 是递归 -l 是链接文件,意思是拷贝链接文件;-p 表示保持文件原有权限;-t 保持文件原有时间;-g 保持文件原有用户组;-o 保持文件原有属主;-D 相当于块设备文件);
  • -z 传输时压缩;
  • -P 传输进度;
  • -v 传输时的进度等信息;

示例:

rsync -avzP --delete root@192.168.1.100:/tmp/rtest1 /tmp/

2、向备机推数据

主机上启动的流程

同步命令:

rsync -avzP --delete {localDir} root@{remoteHost}:{remoteDir}

示例:

rsync -avzP --delete /tmp/rtest1 root@192.168.1.101:/tmp/

自动同步配置

描述同步时不输入密码的配置的方法。

1、使用ssh key

该方法可以直接使用rsync命令进行同步,同步过程中无需输入密码。

在主机上产生ssh key :

ssh-keygen -t rsa

在备机上加入pubkey

ssh-copy-id -i ~/.ssh/id_rsa.pub root@192.168.1.101

或者手动添加:

在主机上执行以下命令获取pubkey:

cat ~/.ssh/id_rsa.pub

在备机上加入key内容:

vi ~/.ssh/authorized_keys

使用pexpect自动输入密码

示例代码如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import pexpect
import time
import traceback

def doRsync(user,passwd,ip,srcDir,dstDir,timeout=3600):
  cmd = "rsync -azPq --delete {srcDir} {rUser}@{rHost}:{dstDir}".format(
    rUser = user,rHost=ip,srcDir=srcDir,dstDir=dstDir
  )
  try:
    ssh = pexpect.spawn(cmd,timeout=timeout)
    print cmd
    i = ssh.expect(['password:', 'continue connecting (yes/no)?'], timeout=5)
    if i == 0 :
      ssh.sendline(passwd)
    elif i == 1:
      ssh.sendline('yes')
      ssh.expect('password: ')
      ssh.sendline(passwd)
    ssh.read()
    ssh.close()
  except :
    #print traceback.format_exc()
    pass

if __name__ == '__main__':
  doRsync("root","123456","192.168.1.101","/tmp/rtest1","/tmp")

上面是使用python实现的代码,大家可根据情况用其它语言实现该功能。

其它

1、rsync在执行过程中被kill掉会怎么样;

It is safe to kill an rsync process and run the whole thing again; it will continue where it left off. It may be a little inefficient, particularly if you haven't passed --partial (included in -P), because rsync will check all files again and process the file it was interrupted on from scratch.

rsync被kill掉是安全的,下次启动时还可以正常工作。

2、rsync不能指定时间段;

1)该问题可以通过kill来解决

2)或者使用pexpect的timeout参数来控制

3)可以先通过find查找过滤出文件夹的名字,然后使用rsync进行同步 这个可以根据现有业务的特征进行,比如:

find /tmp -name '*' -newermt '2016-03-08' ! -newermt '2016-03-20'

3、rsync在写文件过程中同步(比如录音过程中执行rsync操作)

经测试,rsync会同步部分文件内容,文件写入完成后再执行rsync会保持文件的一致

4、当文件数量达到百万级以上时,rsync同步时扫描改变的文件非常耗时

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • Linux下的多线程编程(三)

    Linux下的多线程编程(三)

    学东西,往往实例才是最让人感兴趣的,老是学基础理论,不动手,感觉没有成就感,呵呵。
    2014-08-08
  • 如何在Linux下设置录音笔时间

    如何在Linux下设置录音笔时间

    这篇文章主要介绍了如何在Linux下设置录音笔时间的方法,有这方面需要的朋友跟着学习下吧。
    2017-12-12
  • Linux下apache日志分析与状态查看方法

    Linux下apache日志分析与状态查看方法

    使用apache服务器,有时候需要查看apache的日志与状态,那么就需要下面的命令了,特分享下方便需要的朋友
    2013-01-01
  • ubuntu20.04设置静态ip地址(包括不同版本)

    ubuntu20.04设置静态ip地址(包括不同版本)

    这篇文章主要介绍了ubuntu20.04设置静态ip地址,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-06-06
  • Centos6.5全自动安装 vsftpd+dhcp+nfs+tftp

    Centos6.5全自动安装 vsftpd+dhcp+nfs+tftp

    本文主要记述了在Centos6.5中,如何配置无人值守安装vsftpd+dhcp+nfs+tftp,非常实用,希望对大家能有所帮助。
    2014-09-09
  • CentOS 5.1下跑Mono和Asp.net的实现方法

    CentOS 5.1下跑Mono和Asp.net的实现方法

    由于想研究在linux下跑.net程序的可行性,于是尝试在CentOS5.1下搭建Mono环境和Asp.Net的服务器。Asp.Net的服务器是采用mod_mono和Apache的方式搭建(Nginx的搭建尚未研究)。
    2010-04-04
  • Linux文件系统之缓冲区详解

    Linux文件系统之缓冲区详解

    在 Linux 中,缓冲区通常指的是用于临时存储数据的内存区域,它可以用来提高系统性能,Linux 中有多种类型的缓冲区,包括文件系统缓冲区、网络缓冲区等,本文给大家详细介绍了Linux文件系统之缓冲区,感兴趣的朋友可以参考下
    2024-02-02
  • Linux CentOS 定时运行脚本配置的方法

    Linux CentOS 定时运行脚本配置的方法

    今天小编就为大家分享一篇Linux CentOS 定时运行脚本配置的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-06-06
  • CentOS7下如何配置ip forward(虚拟路由器)

    CentOS7下如何配置ip forward(虚拟路由器)

    本篇文章主要介绍了CentOS7下如何配置ip forward(虚拟路由器),非常具有实用价值,需要的朋友可以参考下
    2017-09-09
  • Linux基础学习之文件查找find的常见用法

    Linux基础学习之文件查找find的常见用法

    这篇文章主要给大家介绍了关于Linux基础学习之文件查找find的常见用法的相关资料,例如:根据文件名查找、根据正则表达式查找、根据路径查找、根据文件类型查找以及根据文件大小等等,文中给出了详细的示例代码,需要的朋友可以参考借鉴。
    2017-12-12

最新评论