模型训练方法、图像生成方法、装置、设备及存储介质与流程

本申请涉及数据处理，尤其涉及一种模型训练方法、图像生成方法、装置、设备及存储介质。

背景技术：

1、随着计算机技术的发展，文本图像的生成越来越依赖计算机技术进行。目前，通常可以基于规则生成文本图像：采集各式各样的字体和图像背景素材，通过文本图像中文本的排布规则渲染合成文本图像。例如，在银行或者保险业务中，业务员与客户进行交谈时，通过将产品文件合成为对应的产品图片和产品场景，能够具象化地介绍产品，进而提高产品的销售量和提高客户的购买体验。

2、目前图像生成方式一般是由扩散模型进行生成，但目前扩散模型的训练过程存在样本数据少、模式匮乏和缺乏多样性的问题，导致生成的图像存在质量明显受损，细节特征无法被生成，使得图像的可读性较差，严重影响了用户的观感。

3、因此，如何训练出一个生成效率和生成质量较高的图像生成模型是目前亟待解决的问题。

技术实现思路

1、本申请的主要目的在于提供一种模型训练方法、图像生成方法、装置、设备及存储介质，旨在训练出一种生成效率和生成质量较高的图像生成模型，以提高图像质量。

2、第一方面，本申请提供一种模型训练方法，所述模型训练方法包括以下步骤：

3、获取样本数据集，并从所述样本数据集中选取一个样本数据作为目标样本数据，所述目标样本数据包括特征图；

4、对所述目标样本数据的特征图进行扩散处理，得到所述目标样本数据对应的高斯噪声数据；

5、根据所述特征图对所述高斯噪声数据进行上下文语义关联重建，得到目标高斯噪声数据；

6、将所述目标高斯噪声数据输入至预设的扩散生成模型中去噪，得到预测特征图；

7、根据所述预测特征图和所述特征图，确定所述预设的扩散生成模型是否收敛；

8、在所述预设的扩散生成模型未收敛的情况下，调整所述预设的扩散生成模型的模型参数，并继续执行所述从所述样本数据集中选取一个样本数据作为目标样本数据的步骤，直至所述预设的扩散生成模型，得到扩散生成模型。

9、第二方面，本申请还提供一种图像生成方法，所述方法包括：

10、获取待去噪的噪声数据；

11、将所述噪声数据输入至扩散生成模型，得到所述噪声数据对应的目标图像，其中，所述扩散生成模型为基于本申请实施例所述的模型训练方法训练得到的。

12、第三方面，本申请还提供一种模型训练装置，所述模型训练装置包括获取模块、生成模块、确定模块和参数调整模块，其中：

13、所述获取模块，用于获取样本数据集，并从所述样本数据集中选取一个样本数据作为目标样本数据，所述目标样本数据包括特征图；

14、所述生成模块，用于对所述目标样本数据的特征图进行扩散处理，得到所述目标样本数据对应的高斯噪声数据；

15、所述生成模块，还用于根据所述特征图对所述高斯噪声数据进行上下文语义关联重建，得到目标高斯噪声数据；

16、所述生成模块，还用于将所述目标高斯噪声数据输入至预设的扩散生成模型中去噪，得到预测特征图；

17、所述确定模块，用于根据所述预测特征图和所述特征图，确定所述预设的扩散生成模型是否收敛；

18、所述参数调整模块，用于在所述预设的扩散生成模型未收敛的情况下，调整所述预设的扩散生成模型的模型参数；

19、所述生成模块，还用于继续执行所述从所述样本数据集中选取一个样本数据作为目标样本数据的步骤，直至所述预设的扩散生成模型，得到扩散生成模型。

20、第四方面，本申请还提供一种计算机设备，所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序，其中所述计算机程序被所述处理器执行时，实现如上述的模型训练方法的步骤和/或，实现上述的图像生成方法的步骤。

21、第五方面，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其中所述计算机程序被处理器执行时，实现如上述的模型训练方法的步骤和/或，实现上述的图像生成方法的步骤。

22、本申请提供一种模型训练方法、图像生成方法、装置、设备及存储介质，本申请通过获取样本数据集，并从样本数据集中选取一个样本数据作为目标样本数据，该目标样本数据包括特征图；对目标样本数据的特征图进行扩散处理，得到目标样本数据对应的高斯噪声数据；根据特征图对所述高斯噪声数据进行上下文语义关联重建，得到目标高斯噪声数据；将目标高斯噪声数据输入至预设的扩散生成模型中去噪，得到预测特征图；根据预测特征图和所述特征图，确定预设的扩散生成模型是否收敛；在预设的扩散生成模型未收敛的情况下，调整预设的扩散生成模型的模型参数，并继续执行从所述样本数据集中选取一个样本数据作为目标样本数据的步骤，直至预设的扩散生成模型，得到扩散生成模型。本申请基于样本数据的特征图进行扩散处理，能够准确地生成特征图对应的高斯噪声数据，对高斯噪声数据进行上下文语义关联重建，可以保留特征图中特征值上下文的语义联系，并基于存在语义联系的高斯噪声数据进行扩散模型训练，使得训练出来的扩散模型生成的图像的连贯性更强和更加真实，极大地提高用户进行图像扩散的使用体验。

技术特征：

1.一种模型训练方法，其特征在于，包括：

2.如权利要求1所述的模型训练方法，其特征在于，所述根据所述特征图对所述高斯噪声数据进行上下文语义关联重建，得到目标高斯噪声数据，包括：

3.如权利要求2所述的模型训练方法，其特征在于，所述根据所述每个特征点的特征值，确定每个所述特征点的上下文语义关系，包括：

4.如权利要求2所述的模型训练方法，其特征在于，所述根据各所述特征点的上下文语义关系对所述高斯噪声数据进行特征重建，得到目标高斯噪声数据，包括：

5.如权利要求1所述的模型训练方法，其特征在于，所述根据所述预测特征图和所述特征图，确定所述预设的扩散生成模型是否收敛，包括：

6.如权利要求5所述的模型训练方法，其特征在于，所述根据所述预测特征图和所述特征图，确定所述预设的扩散生成模型的损失值，包括：

7.一种图像生成方法，其特征在于，包括：

8.一种模型训练装置，其特征在于，所述模型训练装置包括获取模块、生成模块、确定模块和参数调整模块，其中：

9.一种计算机设备，其特征在于，所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序，其中所述计算机程序被所述处理器执行时，实现如权利要求1至6中任一项所述的模型训练方法的步骤和/或，实现如权利要求7所述的图像生成方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，其中所述计算机程序被处理器执行时，实现如权利要求1至6中任一项所述的模型训练方法的步骤和/或，实现如权利要求7所述的图像生成方法的步骤。

技术总结
本申请提供一种模型训练方法、图像生成方法、装置、设备及存储介质，属于数据处理领域，该方法包括：获取样本数据集，并从样本数据集中选取一个样本数据作为目标样本数据，目标样本数据包括特征图；对目标样本数据的特征图进行扩散处理，得到目标样本数据对应的高斯噪声数据；根据特征图对高斯噪声数据进行上下文语义关联重建，得到目标高斯噪声数据；根据目标高斯噪声数据和样本数据集对预设的扩散生成模型训练直至收敛，得到扩散生成模型。基于样本数据的特征图进行扩散处理，能够生成特征图对应的高斯噪声数据，在基于高斯噪声数据进行扩散生成模型训练，能够得到扩散生成模型。本申请还涉及区块链技术，该扩散生成模型可以存储于区块链中。

技术研发人员：郑喜民,郑钰昕,舒畅,陈又新
受保护的技术使用者：平安科技（深圳）有限公司
技术研发日：
技术公布日：2024/12/5

专利

最新回复(0)