【专利下载】【专利代理】【商标和版权申请】Tel：18215660330

一种标注类型自适应的主动学习图像目标检测方法及装置与流程

【专利下载】【专利代理】【商标和版权申请】Tel：18215660330

1.本发明涉及自适应主动学习技术领域，尤其涉及一种标注类型自适应的主动学习图像目标检测方法及装置。

背景技术：

2.在相关技术中，基于卷积神经网络的目标检测方法主要依赖大规模的数据集和全监督训练，主要包括基于候选框的两阶段检测器、基于锚框的单阶段检测器和基于特征点的免框检测器。
3.通常情况下，两阶段检测先借助选择性搜索或区域提取网络提取候选框，再提取候选框图像特征，做出类别和位置预测。girshick等人首次用卷积神经网络提取候选框特征，分类和定位分别由支持向量机和回归模型实现；空间金字塔池化模型将候选框映射到特征图上，全图仅需一次前向计算，并将池化层插入网络最后一个全连接层之前，无需缩放候选框即可得到固定长度的图像表示。以及，在相关技术中，单阶段检测方法的准确率已经达到两阶段方法的水平，但是大量背景锚框限制了网络的性能。
4.但是，这些算法仍然依赖于规模大、模式多样化、标注详尽的数据集，人工标注成本变得更加耗时和复杂，而仅选择一部分有代表性的数据进行标注是可行的。如果随机采样图像数据进行标注，只有采样规模足够大时才能保证获取足够丰富的信息，否则模型的泛化能力会受到严重影响。

技术实现要素：

5.本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
6.为此，本发明的第一个目的在于提出一种标注类型自适应的主动学习图像目标检测方法，实现单张图像中多个目标的解耦以及分类和定位任务的解耦，并利用全监督和弱监督数据的联合训练，以最大化节约标注成本。
7.本发明的第二个目的在于提出一种标注类型自适应的主动学习图像目标检测装置。
8.本发明的第三个目的在于提出一种非临时性计算机可读存储介质。
9.本发明的第四个目的在于提出一种计算机程序产品。
10.为达上述目的，本发明第一方面实施例提出了一种方法，包括：
11.用所述检测模型对所述目标检测对象进行检测，得到所述目标对象对应的定位信息和分类信息
12.对所述分类信息满足第一预设条件的目标对象，根据量化指标定额选择最有价值的对象进行标注，以获得所述目标检测对象对应的类别标签，对所述定位信息满足第二预设条件的目标检测对象，根据量化指标定额选择最有价值的检测对象进行标注，以获得所述检测目标对象对应的补充包围框标签；
13.根据所述类别标签和所述补充包围框标签生成所述目标对象的第一标注数据，将
所述第一标注数据加入至标注数据集，其中，所述标注数据集中预存有第二标注数据；
14.根据标注数据集对半监督检测模型重新训练，得到迭代更新后的目标半监督检测模型，直到模型达到预期性能或标注数量达到预算。
15.可选地，在本技术的一个实施例中，通过下述方式设计初始半监督检测模型：
16.提取图像的多尺度特征图，将中心点估计作为第一分支，弱监督全局平均池化作为第二分支，第一分支和第二分支共享部分多尺度特征图的参数；
17.在所述第一分支中，对所述多尺度特征图进行卷积得到预测位置信息；
18.在所述第二分支中，对所述多尺度特征图进行卷积得到可受图像级标签监督的响应图。可选地，在本技术的一个实施例中，对目标图像进行检测，得到目标对象对应的定位信息和分类信息，包括：
19.经过所述初始半监督检测模型对所述目标图像进行预测，得到所述目标对象对应的定位信息和分类信息。
20.可选地，在本技术的一个实施例中，第一预设条件包括分类信息量高于第一特定阈值的目标对象，第二预设条件包括定位信息量高于第二特定阈值的目标对象。
21.可选地，在本技术的一个实施例中，对分类信息满足第一预设条件的目标对象进行标注以获得目标对象对应的类别标签，对定位信息满足第二预设条件的目标对象进行标注以获得目标对象对应的补充包围框标签，包括：
22.用熵衡量目标的类别信息量：
[0023][0024]
其中，为用熵衡量目标的类别信息量，表示中心点坐标处的类别预测概率，c为候选类别总数。
[0025]
为计算点中心点坐标处的定位信息量，首先计算尺度补偿矩阵的局部概率分布期望：
[0026][0027]
其中，r定义了局部邻域半径。
[0028]
其次，用局部平均预测值的熵和预测值熵的均值之间的差异衡量数据分布和模型预测分布的互信息，以作为定位信息量的估计：
[0029][0030]
其中，计算信息熵，此处定义为：
[0031][0032]
类似地，获得中心点坐标处的尺寸信息量用表示总的定位信息量：
[0033][0034]
为分类和定位分别设置阈值∈c,∈
l
，当目标的一类信息量超过对应阈值时，自适应地提供对应类型的标注。
[0035]
为达上述目的，本发明第二方面实施例提出了一种标注类型自适应的主动学习图
像目标检测装置，包括：
[0036]
检测模块，用于用检测模型对目标检测对象进行检测，得到目标对象对应的定位信息和分类信息；
[0037]
评估模块，对分类信息满足第一预设条件的目标对象，根据量化指标定额选择最有价值的对象进行标注，以获得目标检测对象对应的类别标签，对定位信息满足第二预设条件的目标检测对象，根据量化指标定额选择最有价值的检测对象进行标注，以获得检测目标对象对应的补充包围框标签；
[0038]
标注模块，用于根据类别标签和补充包围框标签生成所述目标对象的第一标注数据，将第一标注数据加入至标注数据集，其中，标注数据集中预存有第二标注数据；
[0039]
训练模块，用于根据标注数据集对半监督检测模型重新训练，得到迭代更新后的目标半监督检测模型，直到模型达到预期性能或标注数量达到预算。
[0040]
可选地，在本技术的一个实施例中，通过下述方式设计所述初始半监督检测模型：
[0041]
提取图像的多尺度特征图，将中心点估计作为第一分支，弱监督全局平均池化作为第二分支，所述第一分支和所述第二分支共享部分所述多尺度特征图的参数；
[0042]
在所述第一分支中，对所述多尺度特征图进行卷积得到预测位置信息；
[0043]
在所述第二分支中，对所述多尺度特征图进行卷积得到可受图像级标签监督的响应图。
[0044]
可选地，在本技术的一个实施例中，检测模块还用于：
[0045]
经过所述初始半监督检测模型对所述目标图像进行预测，得到所述目标对象对应的定位信息和分类信息。
[0046]
可选地，在本技术的一个实施例中，第一预设条件包括分类信息量高于第一特定阈值的目标对象，第二预设条件包括定位信息量高于第二特定阈值的目标对象。
[0047]
为达上述目的，本技术第三方面实施例提出了一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现本技术第一方面实施例所述的标注类型自适应的主动学习图像目标检测方法。
[0048]
为达上述目的，本技术第四方面实施例提出了一种非临时性计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现本技术第一方面实施例所述的标注类型自适应的主动学习图像目标检测方法。
[0049]
综上所述，本发明实施例的标注类型自适应的主动学习图像目标检测的方法、装置、计算机设备和非临时性计算机可读存储介质，提出了主动检测迭代流程包含五个步骤：模型推理、目标检索、信息量评估、自适应标注和半监督训练。该方法可以分别估计图像中各个目标的分类信息量和定位信息量，选择有价值的目标自适应地添加类别标签或包围框标注，同时设计了能对全监督和弱监督数据联合训练的检测模型。本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。
附图说明
[0050]
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得
明显和容易理解，其中：
[0051]
图1为本发明实施例所提供的一种标注类型自适应的主动学习图像目标检测方法的流程图。
[0052]
图2为本发明实施例所提供的一种标注类型自适应的主动学习图像目标检测方法的装置结构图。
[0053]
图3为本发明实施例所提供的全监督弱监督联合训练的目标检测模型结构图。
具体实施方式
[0054]
下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。
[0055]
下面参考附图描述本发明实施例的标注类型自适应的主动学习图像目标检测方法和装置。
[0056]
图1为本发明实施例所提供的一种标注类型自适应的主动学习图像目标检测方法的流程示意图。
[0057]
如图1所示，该标注类型自适应的主动学习图像目标检测方法包括以下步骤：
[0058]
步骤s1，用检测模型对目标检测对象进行检测，得到目标对象对应的定位信息和分类信息。
[0059]
在本技术的一个实施例之中，在步骤s1之前，首先需要设计半监督检测模型，包括：
[0060]
提取图象的多尺度特征图，将中心点估计作为第一分支，弱监督全局平均池化作为第二分支，第一分支和第二分支共享部分多尺度特征图的参数；
[0061]
在第一分支中，对所述多尺度特征图进行卷积得到预测位置信息；
[0062]
在第二分支中，对所述多尺度特征图进行卷积得到可受图像级标签监督的响应图。
[0063]
具体而言，在本技术的一个实施例之中，提取图象的多尺度特征图，将中心点估计作为第一分支，弱监督全局均值平均池化作为第二分支，第一分支和第二分支共享部分多尺度特征图的参数，包括：
[0064]
首先使用一个特征金字塔网络提取图像的多尺度特征图fi，尺寸为wi×hi
×di
，其中i∈{1,2,3}表示三个顺序递增的特征图分辨率，w,h,d分别表示特征图的宽度、高度和深度。中心点估计和弱监督分支共享部分参数，在这个分支中，特征图被3
×
3卷积压缩为其中c是检测类别。响应图受到像素级监督，经全局平均池化后得到长度为c的类别预测可以受图像级标签监督。另一个分支负责预测位置信息，特征图被3
×
3卷积压缩为表示中心点在两个维度上的位置补偿，类似地，表示包围框长和宽的尺寸估计。
[0065]
步骤s2，对分类信息满足第一预设条件的目标对象，根据量化指标定额选择最有价值的对象进行标注，以获得目标检测对象对应的类别标签，对定位信息满足第二预设条件的目标检测对象，根据量化指标定额选择最有价值的检测对象进行标注，以获得检测目
标对象对应的补充包围框标签。
[0066]
在本技术的一个实施例之中，对目标图像进行检测，得到目标对象对应的定位信息和分类信息，包括：
[0067]
经过初始半监督检测模型对目标对象进行预测，得到目标对象对应的定位信息和分类信息。
[0068]
以及，在本技术的一个实施例之中，第一预设条件包括分类信息量高于第一特定阈值的目标对象，第二预设条件包括定位信息量高于第二特定阈值的目标对象。
[0069]
具体而言，用当前已有的带标注数据集训练上述模型。若是初次训练，则随机选择一部分图像(如voc07常用2,000张作为初始训练集)进行完全的目标标注，构成初始训练集以训练上述检测模型。
[0070]
模型预测表示特征图上(x,y)处关键点代表的目标属于c类的概率。将每个人工标注的目标中心点记作p∈r2，在下采样比例为r的低分辨率特征图上预测并计算损失，则用以下高斯核将真值映射到热力图y∈[0,1]w×h×c上：
[0071][0072]
其中，σ
p
是自适应目标尺寸的标准差。
[0073]
目标中心点估计的损失函数是像素级逻辑回归，记作lk：
[0074][0075]
其中，α和β为超参数，n为图像中目标的数量。
[0076]
为恢复离散化误差，为每个中心点预测了局部坐标补偿，用l1损失监督模型的训练，损失函数记作l
off
：
[0077][0078]
将每个人工标注的目标尺寸记为其中k表示一张图中对象目标的编号。对每个目标对象尺寸做回归，用l1损失作为损失函数监督尺寸的回归，损失函数记作l
size
：
[0079][0080]
用one-hot向量g表示样本的图像级标签，当样本中存在至少一个属于第c类的目标时，对应位置记为1：
[0081][0082]
其中是示性函数，c
(k)
为第k个目标的类别，gc为属于第c类目标的真值标签。该分支用多标签交叉熵损失函数监督，记作l
cls
：
[0083][0084]
基于上述，模型总的训练目标为：
[0085]
l＝lk+λ
off
l
off
+λ
size
l
size
+λ
cls
l
cls
.
[0086]
其中，λ
off
、λ
size
、λ
cls
为超参数，控制各个分支在训练中的权重。
[0087]
步骤s3，根据类别标签和补充包围框标签生成目标对象的第一标注数据，将第一标注数据加入至标注数据集，其中，标注数据集中预存有第二标注数据。
[0088]
在本技术的一个实施例之中，对分类信息满足第一预设条件的目标对象进行标注以获得目标对象对应的类别标签，对定位信息满足第二预设条件的目标对象进行标注以获得所述目标对象对应的补充包围框标签，包括：
[0089]
用熵衡量目标的类别信息量：
[0090][0091]
其中，为用熵衡量目标的类别信息量，表示中心点坐标处的类别预测概率，c为候选类别总数。
[0092]
为计算点中心点坐标处的定位信息量，首先尺度补偿矩阵的局部概率分布期望：
[0093][0094]
其中，r定义了局部邻域半径。
[0095]
其次，用局部平均预测值的熵和预测值熵的均值之间的差异衡量数据分布和模型预测分布的互信息，以作为定位信息量的估计：
[0096][0097]
其中，计算信息熵，此处定义为：
[0098][0099]
类似地，获得中心点坐标处的尺寸信息量用表示总的定位信息量：
[0100][0101]
为分类和定位分别设置阈值∈c,∈
l
，当目标的一类信息量超过对应阈值时，自适应地提供对应类型的标注。
[0102]
步骤s4，根据标注数据集对半监督检测模型重新训练，得到迭代更新后的目标半监督检测模型，直到模型达到预期性能或标注数量达到预算。
[0103]
本技术的技术效果：充分利用了检测任务中分类、定位可解耦、多目标可分离的特点，分别估计图像中各个目标的分类信息量和定位信息量，选择有价值的目标自适应地添加类别标签或包围框标注，同时设计了能对全监督和弱监督数据联合训练的检测模型，既能显著节约标注成本，又能针对性地提高检测算法对目标类别、位置的判断。
[0104]
为了实现上述实施例，本发明还提出一种标注类型自适应的主动学习图像目标检
测装置。
[0105]
图2为本发明实施例提供的一种标注类型自适应的主动学习图像目标检测装置的结构示意图。
[0106]
如图2所示，该标注类型自适应的主动学习图像目标检测装置包括：
[0107]
检测模块，用于用检测模型对目标检测对象进行检测，得到目标对象对应的定位信息和分类信息；
[0108]
评估模块，用于对分类信息满足第一预设条件的目标对象，根据量化指标定额选择最有价值的对象进行标注，以获得目标检测对象对应的类别标签，对定位信息满足第二预设条件的目标检测对象，根据量化指标定额选择最有价值的检测对象进行标注，以获得检测目标对象对应的补充包围框标签；
[0109]
标注模块，用于根据类别标签和补充包围框标签生成目标对象的第一标注数据，将第一标注数据加入至标注数据集，其中，所述标注数据集中预存有第二标注数据；
[0110]
训练模块，用于根据标注数据集对半监督检测模型重新训练，得到迭代更新后的目标半监督检测模型，直到模型达到预期性能或标注数量达到预算。
[0111]
在本技术的一个实施例中，进一步而言，还包括：
[0112]
通过下述方式设计初始半监督检测模型：
[0113]
提取图像的多尺度特征图，将中心点估计作为第一分支，弱监督全局平均池化作为第二分支，第一分支和第二分支共享部分所述多尺度特征图的参数；
[0114]
在第一分支中，对多尺度特征图进行卷积得到预测位置信息；
[0115]
在第二分支中，对多尺度特征图进行卷积得到可受图像级标签监督的响应图。
[0116]
在本技术的一个实施例中，进一步而言，还包括：
[0117]
检测模块，经过初始半监督检测模型对目标对象进行预测，得到目标对象对应的定位信息和分类信息。
[0118]
在本技术的一个实施例中，进一步而言，还包括：
[0119]
预设条件包括分类信息量高于第一特定阈值的目标对象，第二预设条件包括定位信息量高于第二特定阈值的目标对象。
[0120]
在本技术的一个实施例中，整体的检测模型结构如图3所示。
[0121]
本技术的技术效果：充分利用了检测任务中分类、定位可解耦、多目标可分离的特点，分别估计图像中各个目标的分类信息量和定位信息量，选择有价值的目标自适应地添加类别标签或包围框标注，同时设计了能对全监督和弱监督数据联合训练的检测模型，既能显著节约标注成本，又能针对性地提高检测算法对目标类别、位置的判断。
[0122]
为达上述目的，本技术第三方面实施例提出了一种计算机设备，其上存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被处理器执行时实现本技术第一方面实施例所述的一种标注类型自适应的主动学习图像目标检测的方法。
[0123]
为达上述目的，本技术第四方面实施例提出了一种非临时性计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现本技术第一方面实施例所述的一种标注类型自适应的主动学习图像目标检测的方法。
[0124]
尽管参考附图详地公开了本技术，但应理解的是，这些描述仅仅是示例性的，并非
用来限制本技术的应用。本技术的保护范围由附加权利要求限定，并可包括在不脱离本技术保护范围和精神的情况下针对发明所作的各种变型、改型及等效方案。
[0125]
在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0126]
此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。
[0127]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。
[0128]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(ram)，只读存储器(rom)，可擦除可编辑只读存储器(eprom或闪速存储器)，光纤装置，以及便携式光盘只读存储器(cdrom)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。
[0129]
应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。
[0130]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。
[0131]
此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。
[0132]
上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

技术特征：
1.一种标注类型自适应的主动学习图像目标检测方法，其特征在于，包括以下步骤：用所述检测模型对所述目标检测对象进行检测，得到所述目标对象对应的定位信息和分类信息；对所述分类信息满足第一预设条件的目标对象，根据量化指标定额选择最有价值的对象进行标注，以获得所述目标检测对象对应的类别标签，对所述定位信息满足第二预设条件的目标检测对象，根据量化指标定额选择最有价值的检测对象进行标注，以获得所述检测目标对象对应的补充包围框标签；根据所述类别标签和所述补充包围框标签生成所述目标对象的第一标注数据，将所述第一标注数据加入至标注数据集，其中，所述标注数据集中预存有第二标注数据；根据所述标注数据集对半监督检测模型重新训练，得到迭代更新后的目标半监督检测模型，直到模型达到预期性能或标注数量达到预算。2.根据权利要求1所述的方法，其特征在于，通过下述方式设计所述半监督检测模型：提取图象的多尺度特征图，将中心点估计作为第一分支，弱监督全局平均池化作为第二分支，所述第一分支和所述第二分支共享部分所述多尺度特征图的参数；在所述第一分支中，对所述多尺度特征图进行卷积得到预测位置信息；在所述第二分支中，对所述多尺度特征图进行卷积得到可受图像级标签监督的响应图。3.根据权利要求1或2所述的方法，其特征在于，对所述目标图像进行检测，得到应的定位信息和分类信息，包括：经过所述初始半监督检测模型对所述目标图像进行预测，得到所述目标对象对应的定位信息和分类信息。4.根据权利要求3所述的方法，其特征在于，所述第一预设条件包括分类信息量高于第一特定阈值的目标对象，所述第二预设条件包括定位信息量高于第二特定阈值的目标对象。5.根据权利要求4所述的方法，其特征在于，对所述分类信息满足第一预设条件的目标对象进行标注以获得所述目标对象对应的类别标签，对所述定位信息满足第二预设条件的目标对象进行标注以获得所述目标对象对应的补充包围框标签，包括：用熵衡量目标的类别信息量：其中，为用熵衡量目标的类别信息量，表示中心点坐标处的类别预测概率，c为候选类别总数。为计算点中心点坐标处的定位信息量，首先计算尺度补偿矩阵的局部概率分布期望：其中，r定义了局部邻域半径。其次，用局部平均预测值的熵和预测值熵的均值之间的差异衡量数据分布和模型预测分布的互信息，以作为定位信息量的估计：
其中，计算信息熵，此处定义为：类似地，获得中心点坐标处的尺寸信息量用表示总的定位信息量：为分类和定位分别设置阈值∈
c
,∈
l
，分别筛选出信息量超过对应阈值的目标，定量选择信息量最大的目标，提供对应类型的标注。6.一种标注类型自适应的主动学习图像目标检测装置，其特征在于，包括：检测模块，用于用所述检测模型对所述目标检测对象进行检测，得到所述目标对象对应的定位信息和分类信息；评估模块，用于对所述分类信息满足第一预设条件的目标对象，根据量化指标定额选择最有价值的对象进行标注，以获得所述目标检测对象对应的类别标签，对所述定位信息满足第二预设条件的目标检测对象，根据量化指标定额选择最有价值的检测对象进行标注，以获得所述检测目标对象对应的补充包围框标签；标注模块，用于根据所述类别标签和所述补充包围框标签生成所述目标对象的第一标注数据，将所述第一标注数据加入至标注数据集，其中，所述标注数据集中预存有第二标注数据；训练模块，用于根据所述标注数据集对半监督检测模型重新训练，得到迭代更新后的目标半监督检测模型，直到模型达到预期性能或标注数量达到预算。7.根据权利要求6所述的装置，其特征在于，通过下述方式设计所述初始半监督检测模型：提取图像的多尺度特征图，将中心点估计作为第一分支，弱监督全局平均池化作为第二分支，所述第一分支和所述第二分支共享部分所述多尺度特征图的参数；在所述第一分支中，对所述多尺度特征图进行卷积得到预测位置信息；在所述第二分支中，对所述多尺度特征图进行卷积得到可受图像级标签监督的响应图。8.根据权利要求6或7所述的装置，其特征在于，所述检测模块还用于：经过所述初始半监督检测模型对所述目标图像进行预测，得到所述目标对象对应的定位信息和分类信息。9.根据权利要求8所述的装置，其特征在于，所述第一预设条件包括分类信息量高于第一特定阈值的目标对象，所述第二预设条件包括定位信息量高于第二特定阈值的目标对象。10.一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-5中任一所述的标注类型自适应的主动学习图像目标检测方法。

技术总结
本发明提出一种标注类型自适应的主动学习图像目标检测方法及装置，其中，该方法包括：获取目标图像，对其进行检测，得到目标对象对应的定位信息和分类信息，并对分类信息满足第一预设条件的进行标注以获得对应的类别标签，对定位信息满足第二预设条件的进行标注以获得对应的补充包围框标签，根据两种标签生成第一标注数据，将第一标注数据加入至标注数据集，其中，标注数据集中预存有第二标注数据；根据标注数据集对半监督检测模型重新训练，得到迭代更新后的目标半监督检测模型，直到模型达到预期性能或标注数量达到预算。该方法既能显著节约标注成本，又能提高检测算法对目标类别、位置的判断。位置的判断。位置的判断。

技术研发人员：吕梦遥陈辉张希雅
受保护的技术使用者：杭州涿溪脑与智能研究所
技术研发日：2021.11.29
技术公布日：2022/3/8

专利

最新回复(0)