一种基于扩散模型的无线通信信号对抗样本生成方法

本发明属于无线通信信号对抗样本领域，尤其涉及一种基于扩散模型的无线通信信号对抗样本生成方法。

背景技术：

1、无线通信信号自动调制识别(automatic modulation recognition，amr)技术可收集并提取信号特征，如信号频谱、瞬时幅度和瞬时相位，为完成高效的信号处理提供支撑，对于网络安全、频谱管理以及无线电监测和情报收集等应用场景都具有重要的作用，能够增强系统的安全性、优化频谱资源利用效率，提高监测的准确性，为决策者提供更好的决策依据。

2、随着通信技术以及人工智能、软件无线电等技术的快速发展，无线通信信号种类多样、数量繁多，无线电磁环境复杂程度日益提升，传统基于似然和基于统计的感知与识别方法效果不佳，致使amr技术面临着较大挑战，在此背景下，基于深度学习的amr技术成为了无线通信领域发展的主流方向之一。

3、基于深度学习的amr技术相比传统方法，能够利用大量通信数据显著提高调制识别精度，同时自动化提取特征避免了专业知识和人工经验的限制，且能够不断受益于深度学习工具的快速迭代和演进，具有解决复杂调制识别问题的潜力。然而，随着对深度学习技术研究的不断深入，研究者发现现有深度学习算法存在着严重的安全隐患：攻击者可以通过给良性样本添加特定噪声而轻易地欺骗深度学习模型，在不被发现的情况下使正常训练的模型输出置信度很高的错误预测，研究者将这种现象叫做对抗攻击。

4、对抗攻击已经在计算机视觉和自然语言处理等领域得到了广泛的研究应用，一个典型的例子就是当对一张熊猫图像加入精心设计的扰动后，深度学习分类器将其误分类为一张长臂猿图像。在amr领域，已有研究表明，如需构造出信号领域中的对抗样本，只需在干净信号样本上添加精心设计的微弱扰动。如对原始二进制相移键控(binary phase shiftkeying，bpsk)、正交相移键控(quadrature phase shift keying，qpsk)等调制方式的信号添加一个小的对抗扰动，形成对抗样本，将对抗样本输入到分类器，就可能导致预先训练好的分类器将信号误分类为相正交振幅调制(quadrature amplitude modulation，64qam)或者其他调制方式的信号。在通信任务中，如果调制识别任务出错，就会严重威胁智能无线通信系统、认知无线电网络、电磁侦察和卫星导航等应用。

5、对抗样本生成方法于2019年被引入电磁信号领域；目前，传统的针对amr模型对抗样本的生成方法一般分为两大类：基于梯度的方法和基于优化的方法。基于梯度的方法利用神经网络的反向传播，通过最小化输入样本和目标样本之间的差异来生成对抗样本，把扰动加在梯度增加的方向使得模型误判，但是添加对抗扰动时缺乏特异性；而基于优化的方法则通过寻找使得目标函数最大或最小的输入样本，用各种变化方法使得优化问题好求解，以达到生成对抗样本的目的，但是生成过程耗时较长且容易陷入局部极值。另外，对抗样本攻击的目的是使模型决策错误，而使模型将样本识别为指定类别的有目标攻击方法却鲜有涉及，因此，针对电磁信号对抗样本生成工作的研究具有现实意义。

6、生成式ai技术在产业界与学术界均受到了广泛关注，其中扩散模型是图像生成领域的代表模型。扩散模型是一种基于概率的生成模型，能够通过学习给定训练样本的数据潜在分布来生成新的数据样本，在图片生成任务中超越了原sota：gan模型，并且在诸多应用领域都有出色的表现。受图像生成任务启发，将扩散模型生成过程引入电磁领域，开展无线通信信号对抗样本生成研究。

技术实现思路

1、本发明针对上述问题，提供了一种基于扩散模型的无线通信信号对抗样本生成方法，通过对模型训练数据集的关键样本进行扩散生成，得到能够显著降低模型识别准确率的对抗样本。相比于传统对抗样本生成方法，本发明能够较大程度提高样本生成的多样性，并且能够将样本生成为指定的类别进行有目标攻击。

2、所述基于扩散模型的无线通信信号对抗样本生成方法，包括以下步骤：

3、s1：选取公开无线通信信号数据集d，并根据特征属性类别分为若干层，从每一层中随机抽取信号样本；以分层抽样的形式将数据集d划分为训练集dtrain和验证集dvalid。

4、初始化数据集d中元素表示为：xi(k),k＝1,2,…,k，k为单个信号的采样点数，i＝1,2,…,n，n表示信号样本个数。

5、针对r个调制类型，每个信号样本各自对应一种调制类型，第i个信号样本的调制类型标签用表示，r∈{1,2,…,r}；

6、s2：将训练集输入到设置了网络参数的amr模型中进行训练，并对验证集中每个样本进行验证，依次计算每个样本分别在每个调制类型下的置信度，选择置信度最大值所对应的类型作为各样本对应的预测结果，记录此时amr模型的识别准确率paccuracy；

7、第i个信号样本在r个调制类型下对应的置信度为pxi＝{pr1,pr2,…,prr}；

8、s3：针对分层抽样的每个信号样本，分别计算各样本的预测结果与每个调制类型之间置信度的方差数组，当方差数组中存在至少一个方差值小于设定的阈值τ，将该方差数组对应的信号样本保存到边界样本中；

9、当前第i个信号样本的预测结果a和各个调制类型之间的置信度的方差，用数组表示如下：

10、

11、表示预测结果a和第r个调制类型下的置信度的方差；

12、当方差小于阈值τ，则将第i个信号样本保存到边界样本中，记作xj(k)；

13、s4：对每个边界样本的调制类型标签进行修改，构成关键样本集；

14、针对边界样本xj(k)，从对应的第i个信号样本的方差数组中，选择最小方差对应的调制类型，作为边界样本xj(k)的边界标签

15、将边界样本xj(k)和其对应的边界标签作为一组数据，保存到关键样本集dkey_d中；

16、s5：基于马尔可夫链，搭建无线通信信号对抗样本生成的扩散模型，并利用关键样本集进行训练；

17、扩散模型训练包括正向过程和反向过程：

18、正向过程是指：从关键样本集数据dkey_d中加载无线通信信号x0，经过了t步正向迭代，逐步向无线通信信号x0添加高斯噪声，直至得到一个完全满足高斯分布的样本xt；

19、首先，对原始信号x0加噪变换，得到信号xt的表达式：

20、

21、可知，当前时刻的信号xt为上一时刻信号xt-1与高斯噪声ε的加权。其中，βt为预先设定的超参，满足0＜β1＜β2＜…<βt＜1，t为扩散步数，ε～ν(0,i)服从标准正态分布。

22、然后，设置中间变量1-βt＝αt，对信号xt的表达式进行变换，得到马尔科夫递归函数：

23、

24、记对递归函数进行改写，得到：

25、

26、最后，依据上式向无线通信信号x0中逐步添加高斯噪声，通过马尔可夫前向过程将无线通信信号x0的数据分布逐渐添加高斯噪声，直至得到一个完全符合高斯分布的样本数据xt。

27、反向过程是指：基于正态分布的采样进行生成，通过训练u-net网络对高斯噪声数据进行去噪，将加噪完成后的样本数据xt从一个纯高斯数据逐步去噪恢复为原始数据x0；

28、具体为：

29、首先，根据贝叶斯公式得到正向过程的后验概率分布，即反向过程q(xt-1|xt,x0)：

30、

31、然后，结合改写的递归函数式(3)，得出：

32、

33、进一步化简，得到反向过程q(xt-1|xt,x0)的均值和方差；分别为：

34、

35、

36、接着，使用具有参数θ的u-net网络计算条件采样pθ(xt-1|xt)，使其方差和后验分布与反向过程q(xt-1|xt)的方差保持一致：

37、pθ(xt-1|xt)＝n(xt-1；μθ(xt,t),εθ(xt,t)) (8)

38、其中，θ为高斯分布的均值函数μθ(xt,t)和标准差函数εθ(xt,t)中的可学习参数向量。

39、最后，设计隐式分类器将边界标签合并到反向过程的训练中，即用替换条件采样p(xt-1|xt)，得到：

40、

41、通过反向求解，得到：

42、

43、其中，为隐式分类器的梯度用条件生成概率；ω是权重，当ω越大时，边界标签牵引的强度越大，即生成的样本和边界标签的置信度越高。

44、训练过程为：

45、当给定u-net神经网络的输入为(xt,t)，利用学习到的参数θ和所得到的均值函数μθ(xt,t)和标准差函数εθ(xt,t)，预测每一步的噪声εθ，噪声εθ蕴含了边界标签的指引，能够引导噪声向着边界标签的方向去噪，缩小分布和反向过程q(xt-1|xt,x0)之间的差距，经t次迭代后，逐步将噪声εθ从样本中去除直到恢复原始信号数据，最终形成无线通信信号对抗样本的扩散模型。

46、s6：在训练好的扩散模型中输入随机样本xt～n(0,i)、迭代次数及关键样本的边界标签，直接输出具有边界标签的对抗样本数据，构成对抗样本数据集dadv。

47、s7：将生成的对抗样本数据集dadv输入到训练好的amr模型中进行分类预测，得到amr模型在对抗样本数据集dadv的识别准确率p′accuracy；对比paccuracy与p′accuracy验证对抗样本生成效果。

48、本发明的优点在于：

49、本发明一种基于扩散模型的无线通信信号对抗样本生成方法，相比于传统对抗样本生成方法，本发明能够较大程度提高样本生成的多样性，并且在不需要分类器的情况下提供与分类器引导相同的效果，能够将样本生成为指定的类别，进行有目标攻击。

技术特征：

1.一种基于扩散模型的无线通信信号对抗样本生成方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种基于扩散模型的无线通信信号对抗样本生成方法，其特征在于，所述s1中，初始化数据集d中元素表示为：xi(k),k＝1,2,…,k，k为单个信号的采样点数，i＝1,2,…,n，n表示信号样本个数；

3.如权利要求1所述的一种基于扩散模型的无线通信信号对抗样本生成方法，其特征在于，所述s3中，当前第i个信号样本的预测结果a和各个调制类型之间的置信度的方差，用数组表示如下：

4.如权利要求1所述的一种基于扩散模型的无线通信信号对抗样本生成方法，其特征在于，所述s4具体为：针对边界样本xj(k)，从对应的第i个信号样本的方差数组中，选择最小方差对应的调制类型，作为边界样本xj(k)的边界标签

5.如权利要求1所述的一种基于扩散模型的无线通信信号对抗样本生成方法，其特征在于，所述s5中训练过程为：

技术总结
本发明公开了一种基于扩散模型的无线通信信号对抗样本生成方法，属于无线通信信号对抗样本领域；具体为：首先，将现有数据集分层抽样，训练AMR模型，并计算每个样本分别在每个调制类型下的置信度，选择置信度最大值所对应的类型作为各样本对应的预测结果；并获取分类边界的样本；根据获取的分类边界样本结果选择关键样本，通过修改关键样本的标签，作为新的训练集逐步添加高斯噪声至样本分布完全满足高斯分布；利用样本特征属性作为梯度引导，训练U‑Net网络预测每一步添加的噪声，逐步将高斯噪声从样本中去除直到恢复原信号，得到无线通信信号对抗样本生成模型。本发明对抗样本对模型表现出较强的攻击性，使模型分类准确率下降。

技术研发人员：丁文锐,张航,陈柏赫,王玉峰
受保护的技术使用者：北京航空航天大学
技术研发日：
技术公布日：2024/12/5

专利

最新回复(0)