联合学习_全球百科

1 简介
2 联合学习的定义

3 集中式联合学习
4 去中心化的联合学习

5 异质联合学习
6 主要特点

▪ 迭代学习

简介

编辑

联合学习（也称为协作学习）是一种机器学习技术，它在多个分散的边缘设备或持有本地数据样本的服务器上训练算法，而不交换这些数据。

这种方法与传统的集中式机器学习技术形成对比，在这种技术中，所有的本地数据集都被上传到一个服务器上，也与更经典的分散式方法形成对比，后者通常假设本地数据样本是相同分布的。

联合学习使多个行为者能够在不共享数据的情况下建立一个共同的、强大的机器学习模型，从而能够解决关键问题，如数据隐私、数据安全、数据访问权和异质数据的访问。

它的应用遍布多个行业，包括电信、物联网和制药业。目前，一个主要的开放性问题是，通过联合数据学习的模型相对于数据被汇集的模型来说，有多大的劣势。另一个开放的问题是边缘设备的可信度以及恶意行为者对所学模型的影响。

联合学习的定义

编辑

联合学习的目的是在本地节点中包含的多个本地数据集上训练机器学习算法，例如深度神经网络，而不明确交换数据样本。一般的原理是在本地数据样本上训练本地模型，并在这些本地节点之间以一定的频率交换参数（例如深度神经网络的权重和偏差），以生成一个所有节点共享的全局模型。

联合学习和分布式学习的主要区别在于对本地数据集属性的假设，因为分布式学习最初的目的是并行计算能力，而联合学习最初的目的是在异质数据集上训练。虽然分布式学习的目的也是在多个服务器上训练一个模型，但一个共同的基本假设是，本地数据集是独立和相同分布的（i.i.d.），并且大致上有相同的大小。

这些假设对联合学习来说都不成立；相反，数据集通常是异质的，其大小可能跨越几个数量级。此外，参与联合学习的客户端可能是不可靠的，因为它们会受到更多的故障或退出，因为它们通常依赖于不太强大的通信媒体（即Wi-Fi）和电池供电的系统（即智能手机和物联网设备），而分布式学习的节点通常是具有强大计算能力的数据中心，并通过快速网络相互连接。