基于区块链和动态信誉的自适应联邦学习方法及系统与流程

专利查询2月前  25


本发明涉及信誉度模型及联邦学习,尤其涉及一种基于区块链和动态信誉的自适应联邦学习方法及系统。


背景技术:

1、本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。

2、基于算力网络数据的特殊性,每个算力边缘服务器(下文简称为服务器)由海量边缘设备组成,且包含了大量的隐私信息。在算力网络的数据共享过程中,一旦设备的敏感数据被泄露,将会影响整个算力网络的安全信誉度,降低各服务器中心共享本地数据的积极性。为了解决数据孤岛问题并保护数据隐私,近些年来联邦学习(federated learning,fl)被提出。联邦学习作为一种分布式机器学习方法,可以实现在不共享敏感数据的情况下进行模型训练,大大提高了数据隐私的保护程度,避免了敏感数据被黑客入侵攻击的风险,非常适用于算力网络中的数据共享情景。联邦学习与传统的分布式学习不同,传统的分布式学习通常将客户端数据集中在一个位置,然后以iid(独立同分布,independentlyidentically dis-tributed)形式分发给代理。而iid数据的假设并不适用于真实的算力网络环境。一般来说,每个服务器之间都存在一定的数据异质性,其数据分布不同,生成的数据数量也极不平衡。虽然目前流行的联邦学习算法fedavg在多种情况下都表现出了优异的性能,然而,fedavg无法处理不同服务器之间的non-iid(非独立同分布,non-independently identically distributed)数据,因为它直接对参与训练的客户端模型参数进行平均。因此,数据分布的统计异质性会极大地降低模型的准确率和泛化性能。另外,由于算力网络中接入了海量的边缘服务器,其可信度和数据质量存在波动,不同服务器训练的局部模型准确率差异较大,这些因素都可能造成模型质量的下降。


技术实现思路

1、为了解决上述背景技术中存在的技术问题,本发明提供一种基于区块链和动态信誉的自适应联邦学习方法及系统,本发明主要包括信誉度评估和自适应权重聚合两个过程。其中,信誉度评估:为了评估不同边缘服务器的训练质量,通过智能合约计算各自的信誉度,并将信誉值存储到区块链上,防止服务器在遭受恶意攻击时篡改信誉值,影响联邦学习效果。同时,利用区块链上存储的信誉值,对模型的聚合权重进行自适应加权,以减轻由数据质量差异导致的模型性能和稳定性下降。最后,结合区块链技术建立了一套全生命周期的隐私保护和安全保障机制。本发明可有效防止算力网络环境下的投毒攻击,同时提高模型准确率,加快模型收敛速度。

2、为了实现上述目的,本发明采用如下技术方案:

3、本发明的第一个方面提供一种基于区块链和动态信誉的自适应联邦学习方法。

4、一种基于区块链和动态信誉的自适应联邦学习方法,包括:

5、某个边缘服务器初始化局部模型,并将该模型上传到任务发布服务器,任务发布服务器通过区块链网络发布联邦学习任务;

6、区块链网络授权可信的服务器作为聚合服务器,聚合服务器下发初始化的局部模型到若干边缘服务器;

7、每个边缘服务器基于本地数据训练局部模型,得到局部模型集合;每个边缘服务器对局部模型进行加密,得到密文局部模型集合;每个边缘服务器对密文局部模型进行哈希操作,得到第一哈希值集合,并将第一哈希值集合上传到区块链网络;边缘服务器将密文局部模型集合发送到聚合服务器;聚合服务器对密文局部模型集合中加密的局部模型进行哈希操作,得到第二哈希值集合,查询区块链网络存储的第一哈希值集合是否与第二哈希值集合相等,若相等,解密密文局部模型集合得到训练好的局部模型集合,若不相等,则舍弃对应的局部模型;

8、聚合服务器引入衰减系数,计算边缘服务器在某一轮训练过程的信誉等级,将边缘服务器训练好的局部模型进行聚合,计算聚合过程中的响应比;根据信誉等级与响应比的乘积,计算信誉分;根据局部模型和信誉分,计算信誉值;调用智能合约,将信誉值保存到区块链网络中;调用sigmoid函数将各边缘服务器的信誉值进行归一化处理,得到当前轮次各边缘服务器的聚合权重;对每个边缘服务器进行自适应权重聚合,判断是否满足预设的模型要求,若满足则输出最终模型,否则,继续下一轮迭代。

9、进一步地,每个边缘服务器对局部模型进行加密,得到密文局部模型集合,方法包括:每个边缘服务器采用对称密钥加密算法加密局部模型,并生成密文局部模型集合。

10、进一步地,每个边缘服务器训练局部模型的局部目标函数为:

11、

12、其中,i表示客户端,w表示局部模型参数,l是损失函数,f(xi,j,w)表示分类模型的输出向量,xi,j表示数据属性的向量,yi,j表示对应的类别标签,m为样本数量。

13、进一步地,聚合服务器引入衰减系数,计算边缘服务器在某一轮训练过程的信誉等级,过程包括:根据聚合服务器的历史信誉、数据集大小和模型稳定性,计算初始信誉;引入衰减系数,根据初始信誉,计算边缘服务器在某一轮训练过程的信誉等级。

14、更进一步地,计算边缘服务器在某一轮训练过程的信誉等级,采用以下公式表示:

15、

16、其中,iri(t')为边缘服务器i在第t'轮训练的初始信誉,表示衰减系数,σ表示衰减速率,t表示迭代轮数。

17、更进一步地,所述初始信誉采用以下公式表示:

18、ir=ω1·rephis+ω2·dssize+ω3·mstab

19、其中,rephis表示历史信誉,dssize表示数据集大小,mstab表示模型稳定性,ω1、ω2和ω3分别表示rephis、dssize和mstab在初始信誉ir中的比重,d表示数据集。

20、进一步地,所述响应比为:边缘服务器对聚合服务器的响应次数与聚合服务器在时间间隔内向聚合服务器发送聚合请求的总次数之间的比值。

21、进一步地,所述信誉值通过以下公式计算:

22、rvaluei(t)=γt·acci(t)+βt·rscorei(t)

23、

24、其中,rvaluei(t)表示信誉值,acci表示准确率,rscorei(t)表示信誉分,a和b是rvaluei(t)的敏感系数,γt、βt表示参数。

25、进一步地,所述对每个边缘服务器进行自适应权重聚合的聚合权重,采用以下公式表示:

26、

27、其中,αit表示第i个边缘服务器第t轮的聚合权重,表示信誉值。

28、本发明的第二个方面提供一种基于区块链和动态信誉的自适应联邦学习系统。

29、一种基于区块链和动态信誉的自适应联邦学习系统,包括:若干边缘服务器、任务发布服务器、区块链网络以及聚合服务器;

30、边缘服务器,用于初始化局部模型,并将该模型上传到任务发布服务器;

31、任务发布服务器,用于在区块链网络上发布联邦学习任务;

32、聚合服务器,用于下发初始化的局部模型到若干边缘服务器;

33、边缘服务器,用于基于本地数据训练机器学习模型,得到局部模型集合;对局部模型进行加密,得到密文局部模型集合;对密文局部模型进行哈希操作,得到第一哈希值集合,并将第一哈希值集合上传到区块链网络;将密文局部模型集合发送到聚合服务器;以使聚合服务器对密文局部模型集合中加密的局部模型进行哈希操作,得到第二哈希值集合,查询区块链网络存储的第一哈希值集合是否与第二哈希值集合相等,若相等,解密密文局部模型集合得到训练好的局部模型集合,若不相等,则舍弃对应的局部模型;

34、聚合服务器,用于引入衰减系数,计算边缘服务器在某一轮训练过程的信誉等级,将边缘服务器训练好的局部模型进行聚合,计算聚合过程中的响应比;根据信誉等级与响应比的乘积,计算信誉分;根据局部模型和信誉分,计算信誉值;调用智能合约,将信誉值保存到区块链网络中;调用sigmoid函数将各边缘服务器的信誉值进行归一化处理,得到当前轮次各边缘服务器的聚合权重;对每个边缘服务器进行自适应权重聚合,判断是否满足预设的模型要求,若满足则输出最终模型,否则,继续下一轮迭代。

35、与现有技术相比,本发明的有益效果是:

36、本发明提出的信誉度评估模型结合了历史信誉rephis、数据集大小dssize、模型稳定性mstab、模型准确率acc多个影响模型质量的因素,综合计算信誉值,能够更加客观的评估各客户端的训练质量,并在模型聚合时将其得到的信誉值作为自适应权重聚合的主要依据,从而加速模型收敛,缓解了算力网络环境下联邦学习中数据分布的不一致性和数据质量差异带来的性能下降问题。

37、与未使用区块链的现有技术相比,本发明中使用区块链技术作为联邦学习过程的数据存储介质,并通过智能合约查询和存储各客户端训练的局部模型哈希值及相应信誉值,利用区块链的去中心化和不可篡改特性,对计算过程进行保护,防止恶意节点干扰模型的训练过程。有效防止了投毒攻击与推理攻击,保护了局部模型的隐私和安全性,保证了全局模型和信誉值的链上安全存储。

38、与使用区块链的现有技术相比,本发明在聚合模型阶段之前,对训练阶段存储到区块链上的局部模型哈希值进行对比,有效防止了恶意服务器上传错误的局部模型干扰联邦学习过程。此外,本发明仅对模型哈希值进行存储,不暴露客户端任何的模型信息,并且可以有效地减轻区块链的存储压力,大大降低了区块链的通信和存储负担,从而提高了系统的效率。


技术特征:

1.基于区块链和动态信誉的自适应联邦学习方法,其特征在于,包括:

2.根据权利要求1所述的基于区块链和动态信誉的自适应联邦学习方法,其特征在于,每个边缘服务器对局部模型进行加密,得到密文局部模型集合,方法包括:每个边缘服务器采用对称密钥加密算法加密局部模型,并生成密文局部模型集合。

3.根据权利要求1所述的基于区块链和动态信誉的自适应联邦学习方法,其特征在于,每个边缘服务器训练局部模型的局部目标函数为:

4.根据权利要求1所述的基于区块链和动态信誉的自适应联邦学习方法,其特征在于,聚合服务器引入衰减系数,计算边缘服务器在某一轮训练过程的信誉等级,过程包括:根据聚合服务器的历史信誉、数据集大小和模型稳定性,计算初始信誉;引入衰减系数,根据初始信誉,计算边缘服务器在某一轮训练过程的信誉等级。

5.根据权利要求4所述的基于区块链和动态信誉的自适应联邦学习方法,其特征在于,计算边缘服务器在某一轮训练过程的信誉等级,采用以下公式表示:

6.根据权利要求4所述的基于区块链和动态信誉的自适应联邦学习方法,其特征在于,所述初始信誉采用以下公式表示:

7.根据权利要求1所述的基于区块链和动态信誉的自适应联邦学习方法,其特征在于,所述响应比为:边缘服务器对聚合服务器的响应次数与聚合服务器在时间间隔内向聚合服务器发送聚合请求的总次数之间的比值。

8.根据权利要求1所述的基于区块链和动态信誉的自适应联邦学习方法,其特征在于,所述信誉值通过以下公式计算:

9.根据权利要求1所述的基于区块链和动态信誉的自适应联邦学习方法,其特征在于,所述对每个边缘服务器进行自适应权重聚合的聚合权重,采用以下公式表示:

10.基于区块链和动态信誉的自适应联邦学习系统,其特征在于,包括:若干边缘服务器、任务发布服务器、区块链网络以及聚合服务器;


技术总结
本发明涉及信誉度模型及联邦学习技术领域,提供了一种基于区块链和动态信誉的自适应联邦学习方法及系统。该方法包括,利用智能合约计算各客户端的信誉度,并将信誉值存储到区块链上,防止服务器在遭受恶意攻击时篡改信誉值,影响联邦学习效果;设计了一种自适应权重聚合算法,以减轻由数据质量差异导致的模型性能和稳定性下降,从而提升模型的准确率,加速模型收敛;将模型和准确率上链安全存储,保证数据的真实性和可追溯;结合区块链技术建立了一套全生命周期的隐私保护和安全保障机制,可有效防止投毒攻击与推理攻击。

技术研发人员:王连海,刘天瑞,徐淑奖,张淑慧,王英晓春,王欣蕾,李琪
受保护的技术使用者:山东省计算中心(国家超级计算济南中心)
技术研发日:
技术公布日:2024/12/5

最新回复(0)