识别目标对象的方法及装置与流程

专利查询10天前  6


本发明实施例涉及人工智能领域,具体而言,涉及一种识别目标对象的方法及装置。


背景技术:

1、随着硬件算力的提高和相关技术的发展,机器学习已经深入到生活的方方面面,例如,通过机器学习训练得到的神经网络模型识别人物、车辆等目标对象。机器学习得到的神经网络模型的效果都是由训练数据驱动的,使用什么样的训练数据,就能获得什么样的神经网络模型,而且神经网络模型一旦训练完成,参数固定,效果基本也固化了。

2、可能实验室测试效果很好的神经网络模型,部署到某些实际环境里面,效果就大打折扣,这是由于神经网络模型没有被实际环境中的数据训练过,而现实环境千千万万,实验室训练的数据难以全面覆盖。由此导致训练好的神经网络模型应用到实际环境中的识别目标对象准确率较低的问题。

3、针对上述问题,目前尚未存在有效的解决方案。


技术实现思路

1、本发明实施例提供了一种识别目标对象的方法及装置,以至少解决相关技术中的训练好的神经网络模型应用到实际环境中的识别目标对象准确率较低的问题。

2、根据本发明的一个实施例,提供了一种识别目标对象的方法,包括:获取第一神经网络模型和第二神经网络模型,其中,所述第一神经网络模型和所述第二神经网络模型是使用第一样本图像集合训练得到的同一个神经网络模型;通过所述第一神经网络对第二样本图像集合中的目标对象进行识别,得到识别结果,其中,所述第二样本图像集合是对目标区域中的目标对象进行拍摄得到的图像集合;使用所述识别结果和第二样本图像集合对所述第二神经网络模型进行训练,得到目标神经网络模型;使用所述目标神经网络图像对所述目标区域中的所述目标对象进行识别。

3、在一个示例性实施例中,使用所述识别结果和第二样本图像集合对所述第二神经网络模型进行训练,得到目标神经网络模型,包括:通过所述第二神经网络模型的检测模块,确定所述第二神经网络模型的冻结参数和蒸馏参数;在对所述第二神经网络模型进行训练的过程中,更新所述蒸馏参数,不更新所述冻结参数。

4、在一个示例性实施例中,所述方法还包括:在所述第二神经网络模型的训练过程中所述第一神经网络模型的模型参数保持不变。

5、在一个示例性实施例中,所述第一样本图像集合中样本图像的数量大于所述第二样本图像集合中样本图像的数量。

6、在一个示例性实施例中,使用所述识别结果和第二样本图像集合对所述第二神经网络模型进行训练,得到目标神经网络模型,包括:在对所述第二神经网络模型进行第i轮训练得到的神经网络模型满足目标损失条件的情况下,结束训练得到所述目标神经网络模型,其中,所述i是大于或等于1的整数;其中,所述目标损失条件包括:目标损失值小于或等于预设阈值,所述目标损失值包括以下至少之一:所述第i轮训练得到的神经网络模型的输出结果与所述第一神经网络模型的识别结果之间的第一损失值、所述第一神经网络模型的模型参数与所述第i轮训练得到的神经网络模型的模型参数之间的第二损失值、输入所述第i轮训练得到的神经网络模型的样本图像的标注信息与所述输出结果与之间的第三损失值。

7、在一个示例性实施例中,所述方法还包括:确定所述识别结果与所述输出结果之间的所述第一损失值;在所述第一损失值小于或等于所述预设阈值的情况下,将所述第i轮训练得到的神经网络模型确定为所述目标神经网络模型。

8、在一个示例性实施例中,所述方法还包括:确定所述识别结果与所述输出结果之间的所述第一损失值;确定所述第一神经网络模型的模型参数与所述第i轮训练得到的神经网络模型的模型参数之间的第二损失值;确定所述目标输出结果与所述目标样本图像的标注信息之间的第三损失值;通过所述第一损失值、所述第二损失值和/或所述第三损失值得到所述目标损失值。

9、在一个示例性实施例中,通过所述第一损失值、所述第二损失值和/或所述第三损失值得到所述目标损失值,包括:将所述第一损失值和所述第二损失值的加权和确定为所述目标损失值;或者,将所述第一损失值和所述第三损失值的加权和确定为所述目标损失值;或者,将所述第一损失值、所述第二损失值和所述第三损失之的加权和确定为所述目标损失值。

10、根据本发明的另一个实施例,提供了一种识别目标对象的装置,包括:获取模块,用于获取第一神经网络模型和第二神经网络模型,其中,所述第一神经网络模型和所述第二神经网络模型是使用第一样本图像集合训练得到的同一个神经网络模型;第一识别模块,用于通过所述第一神经网络对第二样本图像集合中的目标对象进行识别,得到识别结果,其中,所述第二样本图像集合是对目标区域中的目标对象进行拍摄得到的图像集合;训练模块,用于使用所述识别结果和第二样本图像集合对所述第二神经网络模型进行训练,得到目标神经网络模型;第二识别模块,用于使用所述目标神经网络图像对所述目标区域中的所述目标对象进行识别。

11、根据本发明的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述任一项中所述的方法的步骤。

12、根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

13、根据本发明的又一个实施例,还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任一项中所述的方法的步骤。

14、通过本发明,第一神经网络模型和所述第二神经网络模型是使用第一样本图像集合训练得到的同一个神经网络模型。通过第一神经网络对第二样本图像集合中的目标对象进行识别,得到识别结果,第二样本图像集合是对目标区域中的目标对象进行拍摄得到的图像集合;使用识别结果和第二样本图像集合对第二神经网络模型进行训练,得到目标神经网络模型。

15、由于目标神经网络模型是使用对目标区域中的目标对象进行拍摄得到的第二样本图像集合训练得到的,这样可达到提高目标神经网络模型对目标区域中的目标对象识别的准确率的效果。

16、此外,在目标神经网络模型的训练过程中,还使用了第一神经网络对第二样本图像集合中的目标对象的识别结果,这样可以避免训练得到的神经网络模型遗忘使用第一样本图像集合训练时的数据分布,达到抗遗忘的效果。



技术特征:

1.一种识别目标对象的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,使用所述识别结果和第二样本图像集合对所述第二神经网络模型进行训练,得到目标神经网络模型,包括:

3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1或2所述的方法,其特征在于,所述第一样本图像集合中样本图像的数量大于所述第二样本图像集合中样本图像的数量。

5.根据权利要求1所述的方法,其特征在于,使用所述识别结果和第二样本图像集合对所述第二神经网络模型进行训练,得到目标神经网络模型,包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7.根据权利要求5所述的方法,其特征在于,所述方法还包括:

8.根据权利要求6所述的方法,其特征在于,通过所述第一损失值、所述第二损失值和/或所述第三损失值得到所述目标损失值,包括:

9.一种识别目标对象的装置,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至8任一项中所述的方法的步骤。

11.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至8任一项中所述的方法。

12.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8任一项中所述的方法的步骤。


技术总结
本发明实施例提供了一种识别目标对象的方法及装置,包括:获取第一神经网络模型和第二神经网络模型,第一神经网络模型和第二神经网络模型是使用第一样本图像集合训练得到的同一个神经网络模型;通过第一神经网络对第二样本图像集合中的目标对象进行识别,得到识别结果,第二样本图像集合是对目标区域中的目标对象进行拍摄得到的图像集合;使用识别结果和第二样本图像集合对第二神经网络模型进行训练,得到目标神经网络模型;使用目标神经网络图像对目标区域中的目标对象进行识别。通过本发明,解决了相关技术中的训练好的神经网络模型应用到实际环境中的识别目标对象准确率较低的问题。

技术研发人员:张学涵,王仁根,王建辉,游鹏,李志涵,刘宇奇,汪志强,张朋,周祥明
受保护的技术使用者:浙江大华技术股份有限公司
技术研发日:
技术公布日:2024/12/5

最新回复(0)