FedAvg联邦学习FedProx异质网络优化实验总结

更新时间：2022年05月11日 14:30:12 作者：Cyril_KI

这篇文章主要为大家介绍了FedAvg联邦学习FedProx异质网络优化的实验总结，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪

前言

题目： Federated Optimization for Heterogeneous Networks

会议： Conference on Machine Learning and Systems 2020

论文地址：Federated Optimization for Heterogeneous Networks

FedAvg对设备异质性和数据异质性没有太好的解决办法，FedProx在FedAvg的基础上做出了一些改进来尝试缓解这两个问题。

在Online Learning中，为了防止模型根据新到来的数据进行更新后偏离原来的模型太远，也就是为了防止过调节，通常会加入一个余项来限制更新前后模型参数的差异。FedProx中同样引入了一个余项，作用类似。

I. FedAvg

Google的团队首次提出了联邦学习，并引入了联邦学习的基本算法FedAvg。问题的一般形式：

FedAvg：

简单来说，在FedAvg的框架下：每一轮通信中，服务器分发全局参数到各个客户端，各个客户端利用本地数据训练相同的epoch，然后再将梯度上传到服务器进行聚合形成更新后的参数。

FedAvg存在着两个缺陷：

设备异质性：不同的设备间的通信和计算能力是有差异的。在FedAvg中，被选中的客户端在本地都训练相同的epoch，虽然作者指出提升epoch可以有效减小通信成本，但较大的epoch下，可能会有很多设备无法按时完成训练。无论是直接drop掉这部分客户端的模型还是直接利用这部分未完成的模型来进行聚合，都将对最终模型的收敛造成不好的影响。
数据异质性：不同设备中数据可能是非独立同分布的。如果数据是独立同分布的，那么本地模型训练较多的epoch会加快全局模型的收敛；如果不是独立同分布的，不同设备在利用非IID的本地数据进行训练并且训练轮数较大时，本地模型将会偏离初始的全局模型。

II. FedProx

为了缓解上述两个问题，本文作者提出了一个新的联邦学习框架FedProx。FedProx能够很好地处理异质性。

定义一：

简单来说，每个客户端都是优化所有样本的损失和，这个是正常的思路，让全局模型在本地数据集上表现更好。

但如果设备间的数据是异质的，每个客户端优化之后得到的模型就与初始时服务器分配的全局模型相差过大，本地模型将会偏离初始的全局模型，这将减缓全局模型的收敛。

为了有效限制这种偏差，本文作者提出，设备 k k k在本地进行训练时，需要最小化以下目标函数：

作者在FedAvg损失函数的基础上，引入了一个proximal term，我们可以称之为近端项。引入近端项后，客户端在本地训练后得到的模型参数 w将不会与初始时的服务器参数 wt偏离太多。

观察上式可以发现，当 μ=0时，FedProx客户端的优化目标就与FedAvg一致。

这个思路其实还是很常见的，在机器学习中，为了防止过调节，亦或者为了限制参数变化，通常都会在原有损失函数的基础上加上这样一个类似的项。比如在在线学习中，我们就可以添加此项来限制更新前后模型参数的差异。

FedProx的算法伪代码：

通过观察这个步骤可以发现，FedProx在FedAvg上做了两点改进：

引入了近端项，限制了因为数据异质性导致的模型偏离。引入了不精确解，各个客户端不再需要训练相同的轮数，只需要得到一个不精确解，这有效缓解了某些设备的计算压力。

III. 实验

图1给出了数据异质性对模型收敛的影响：

上图给出了损失随着通信轮数增加的变化情况，数据的异质性从左到右依次增加，其中 μ = 0 表示FedAvg。可以发现，数据间异质性越强，收敛越慢，但如果我们让 μ>0，将有效缓解这一情况，也就是模型将更快收敛。

图2：

左图：E增加后对μ=0情况的影响。可以发现，太多的本地训练将导致本地模型偏离全局模型，全局模型收敛变缓。

中图：同一数据集，增加μ后，收敛将加快，因为这有效缓解了模型的偏移，从而使FedProx的性能较少依赖于 E。

作者给出了一个trick：在实践中，μ可以根据模型当前的性能自适应地选择。比较简单的做法是当损失增加时增加 μ，当损失减少时减少μ。

但是对于 γ，作者貌似没有具体说明怎么选择，只能去GitHub上研究一下源码再给出解释了。

IV. 总结

数据和设备的异质性对传统的FedAvg算法提出了挑战，本文作者在FedAvg的基础上提出了FedProx，FedProx相比于FedAvg主要有以下两点不同：

考虑了不同设备通信和计算能力的差异，并引入了不精确解，不同设备不需要训练相同的轮数，只需要得到一个不精确解即可。引入了近端项，在数据异质的情况下，限制了本地训练时模型对全局模型的偏离。

以上就是FedProx异质网络的联邦优化经验总结的详细内容，更多关于FedProx异质网络联邦优化的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

有效的提高编程技能的12个方法
以下是提高编程技能的12个方法，主要是不停学习，努力成全才，跟聪明人或有想法的一起
2012-05-05
在IDEA2020.2中配置使用Git的详细教程
这篇文章主要介绍了在IDEA2020.2中配置使用Git的详细教程,本文通过图文并茂的形式给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2020-11-11
微信小程序下载工具及调试详解
这篇文章主要介绍了微信小程序下载工具及调试详解的相关资料,需要的朋友可以参考下
2016-09-09
使用Git工具实现上传本地项目到GitHub的方法
这篇文章主要介绍了使用Git工具实现上传本地项目到GitHub的方法,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2020-10-10
Chrome 调试技巧(小结)
这篇文章主要介绍了Chrome 调试技巧(小结)，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2018-09-09
IDEA导入Git项目的方法
这篇文章主要介绍了IDEA导入Git项目的方法,本文通过图文并茂的形式给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2020-09-09
git分支的创建、切换、合并及删除操作小结
这篇文章给大家详细的介绍了关于git分支的操作，其中包括查看现存分支、创建分支、切换分支、提交分支、分支合并以及删除分支，文中给出了详细示例代码，相信对大家的学习和理解很有帮助，有需要的朋友们下面来一起学习学习吧。
2016-11-11
回车和换行有什么区别？我们平时按下的Enter键是回车还是换行
如果用过机械打字机，就知道回车和换行的区别了。换行就是把滚筒卷一格，不改变水平位置。回车就是把水平位置复位，不卷动滚筒
2011-03-03
Git 常用命令清单(整理且详细)
git我每天几乎都在使用，但是很多命令还是记不住，下面小编给大家分享了Git 常用命令清单，感兴趣的朋友一起看看吧
2017-10-10
详解IDEA Git Reset 选项说明
这篇文章主要介绍了详解IDEA Git Reset 选项说明，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-08-08

FedAvg联邦学习FedProx异质网络优化实验总结

目录

前言

I. FedAvg

II. FedProx

III. 实验

IV. 总结

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具