1.本公开涉及人工智能领域 ,尤其涉及一种异常寄递行为检测方法、系统、电子设备和存储介质。
背景技术:
2.我国的快递业务量近年来持续高速增长,快递在人们生活中已变成不可或缺的一部分。与此同时,寄递业在迅猛发展的同时,其存在的风险隐患问题也越来越凸显,越来越多的违法犯罪分子利用寄递业企业数量多、营业网点多、从业人员多、业务环节多等快递企业管理漏洞以及行业人货分离、隐蔽性强、安全监管难度大等特点,非法寄运禁运物品案件频发,严重危害国家安全、公共安全和社会稳定。
3.目前,基于针对上述案件,已有的研究大多是人工针对某一类案件进行特点分析与方法应对。在发明人实施本公开实施例的过程中发现现有技术存在效率较低,实用性有待提升的问题。
技术实现要素:
4.有鉴于此,本公开实施例提供了一种异常寄递行为检测方法、系统、电子设备和存储介质,至少部分的解决现有技术中存在的效率较低,实用性有待提升的问题。
5.第一方面,本公开实施例提供了一种异常寄递行为检测方法,所述异常寄递行为检测方法包括:建立寄递重点地区库,所述寄递重点地区库中存储有至少一种案件类型的至少一个地址类型的地址数据;根据待检测案件类型,从所述寄递重点地区库中获取目标地址数据;根据所述目标地址数据,筛选出对应的寄递面单数据;确定所述寄递面单数据中的寄递地址的至少一种地理特征数据;通过聚类算法分别识别所述地理特征数据的异常特征值;根据所述异常特征值的识别结果,确定是否存在异常寄递行为。
6.可选地,所述案件类型包括涉危险品、涉烟、电信诈骗、销赃和其他,所述地址类型包括生产地、中转地和消费地。
7.可选地,所述地址数据包括区域地址和详细地址,所述异常寄递行为检测方法还包括:在获取所述目标地址数据之后,判断所述目标地址数据的详细地址是否为空白;所述根据所述目标地址数据,筛选出对应的寄递面单数据包括:在所述详细地址为空白时,根据所述目标地址数据中的区域地址,筛选出对应的寄递面单数据。
8.可选地,所述异常寄递行为检测方法还包括:在所述详细地址不为空白时,根据所述目标地址数据中的详细地址,筛选出对应的寄递面单数据,直接对所述寄递面单数据进行复核。
9.可选地,所述地理特征数据包括:寄件发出地地址数、收件详细地址填写不正确数
量、一人多址情况数量和寄件发往地地址数量。
10.可选地, 所述通过聚类算法分别识别所述地理特征数据的异常特征值包括:使用不含异常特征值的数据作为训练集,通过k-means算法,得到第一k均值聚类算法结果;使用所述地理特征数据作为测试集,通过k-means算法,得到第二k均值聚类算法结果;判断所述第二k均值聚类算法结果中,是否存在异常点,所述异常点与最近的聚类中心之间的距离超过所述第一k均值聚类算法结果中的最大距离;若存在异常点,将所述异常点对应的地理特征数据作为所述异常特征值。
11.可选地,在确定所述寄递面单数据中的寄递地址的多种地理特征数据,通过聚类算法分别识别每种所述地理特征数据的异常特征值时,所述根据所述异常特征值的识别结果,确定是否存在异常寄递行为包括:若任一种所述地理特征数据存在异常特征值,确定存在异常寄递行为,若每种所述地理特征数据均不存在异常特征值,确定不存在异常寄递行为。
12.第二方面,本公开实施例还提供了一种异常寄递行为检测系统,所述异常寄递行为检测系统包括:地区库建立模块,用于建立寄递重点地区库,所述寄递重点地区库中存储有至少一种案件类型的至少一个地址类型的地址数据;地址数据获取模块,用于根据待检测案件类型,从所述寄递重点地区库中获取目标地址数据;面单数据筛选模块,用于根据所述目标地址数据,筛选出对应的寄递面单数据;地理特征数据确定模块,确定所述寄递面单数据中的寄递地址的至少一种地理特征数据;识别模块,通过聚类算法分别识别所述地理特征数据的异常特征值;异常寄递行为确定模块,用于根据所述异常特征值的识别结果,确定是否存在异常寄递行为。
13.第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行以上任一所述的异常寄递行为检测方法。
14.第四方面,本公开实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行以上任一所述的异常寄递行为检测方法。
15.本公开实施例提供的异常寄递行为检测方法、系统、电子设备和存储介质,该异常寄递行为检测方法中,先建立寄递重点地区库,再根据待检测案件类型,从寄递重点地区库中获取目标地址数据,再根据目标地址数据,筛选出对应的寄递面单数据,再确定寄递面单数据中的寄递地址的至少一种地理特征数据,再通过聚类算法分别识别地理特征数据的异
常特征值,最后根据异常特征值的识别结果,确定是否存在异常寄递行为。在以上过程中,以案件类型频繁发生的重点地区为基础,结合对寄递面单数据中的地理特征数据的数据分析,利用无监督学习中的聚类算法,检测地理特征数据中的异常特征值,从而分析异常寄递行为。因此,以上异常寄递行为检测方法具有高效性、实用性,不仅能十分有效地帮助警方缩小排查范围,减少人员消耗,还有助于掌握重点地区、重点人员的变化等,更好地为侦察办案和情报信息工作服务,使得预防犯罪成为可能。
16.上述说明仅是本公开技术方案的概述,为了能更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为让本公开的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
17.为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
18.图1为本公开实施例提供的异常寄递行为检测方法的流程图一;图2为本公开实施例提供的步骤s3的具体流程图;图3为本公开实施例提供的步骤s5的具体流程图;图4为本公开实施例提供的异常寄递行为检测方法的流程图二;图5为本公开实施例提供的异常寄递行为检测系统的原理框图一;图6为本公开实施例提供的异常寄递行为检测系统的原理框图二;图7为本公开实施例提供的一种电子设备的原理框图。
具体实施方式
19.下面结合附图对本公开实施例进行详细描述。
20.应当明确,以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
21.需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/ 或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/ 或功能性实施此设备及/ 或实践此方法。
22.还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构
想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
23.另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
24.为了便于理解,如图1所示,图1为本公开实施例提供的异常寄递行为检测方法的流程图一,本公开实施例提供了一种异常寄递行为检测方法,该异常寄递行为检测方法包括:步骤s1、建立寄递重点地区库,寄递重点地区库中存储有至少一种案件类型的至少一个地址类型的地址数据。
25.示例性地,以上案件类型可包括涉危险品、涉烟、电信诈骗、销赃和其他,“其他”指除“涉危险品、涉烟、电信诈骗、销赃”以外的案件类型。当有新类型的案件需要增加时,若案件数量较大可单独增加对应的案件类型,若案件数量较小,可将其纳入“其他”案件类型中。
26.示例性地,根据案件的不同场景,地址类型包括生产地、中转地和消费地。每种案件类型的生产地和消费地都应存在地址数据,依次对应寄件地和收件地,中转地则是个别案件类型会有地址数据。结合到寄递特征上,生产地寄多收少,中转地寄收持平,消费地寄少收多。例如,案件类型为涉危险品案件,根据不同的犯罪人员(制造危险品人员、贩卖危险品人员和购买危险品人员),对应的地址类型为生产地(危险品生产地区)、中转地(危险品中转地区)和消费地(危险品消费地区)。
27.寄递重点地区库中的地址数据是根据以往案件经验总结而来,地址数据必然包括区域地址,该区域地址细化到区县级(或乡镇级)地址,进而可以通过行政区划代码将地址数据进行划分。可选地,地址数据还可以包括详细地址,即地址数据的最细颗粒度可到详细地址,若以往案件有详细地址,则对应写入地址数据的详细地址,若没有,则保持空白即可。具体地,可以通过对案件涉及的地址通过文本分析+关键词的方式,将详细地址进行拆分,以填写到寄递重点地区库中的地址数据的对应位置。
28.寄递重点地区库示例如下:
以上xx省、xx市/xx州、xx区/xx县构成区域地址、xx街道xx门牌号为详细地址。
29.步骤s2、根据待检测案件类型,从寄递重点地区库中获取目标地址数据。
30.示例性地,待检测案件类型为涉危险品案件,从以上述寄递重点地区库中筛选出以下目标地址数据:步骤s3、根据目标地址数据,筛选出对应的寄递面单数据。
31.可选地,在地址数据包括区域地址和详细地址时,可以采取不同的方法来筛选寄递面单数据,并对不同的筛选结果有不同的处理方式。在一种情况下,无论详细地址是否空白,均根据目标地址数据中的区域地址,筛选出对应的寄递面单数据,以使获得更全面的寄递面单数据。在另一种情况下,先判断目标地址数据的详细地址是否为空白,并针对不同的结果进行相应的筛选和后续处理,例如,在详细地址为空白时,根据目标地址数据中的区域地址,筛选出对应的寄递面单数据,并对该寄递面单数据进行后续步骤s4~步骤s6的处理,又例如,在详细地址不为空白时,根据目标地址数据中的详细地址,筛选出对应的寄递面单数据,直接对寄递面单数据进行复核,以判断是否为异常寄递行为,无需再对此部分寄递面单数据执行后续步骤。
32.可选地,如图2所示,图2为本公开实施例提供的步骤s3的具体流程图,根据目标地址数据,筛选出对应的寄递面单数据包括:子步骤s31、获取原始寄递面单数据。
33.子步骤s32、对原始寄递面单数据进行预处理,得到预处理的寄递面单数据。
34.示例性地,对原始寄递面单数据中的寄递面单进行如下预处理:判断各寄递面单中是否存在手机号码脱敏或缺失的情况,若不存在手机号码脱敏或缺失的情况,直接从原始寄递面单中获取用户的手机号码,将手机号码作为识别该寄递面单对应用户的唯一标识,若存在手机号码脱敏或缺失的情况,对手机号码脱敏或缺失的寄递面单进行技术还原,删除无法还原的寄递面单,从成功还原的寄递面单中获取手机号码,将手机号码作为识别该寄递面单对应用户的唯一标识。考虑到公民隐私,本公开实施例中可以选择,对获取的用户的手机号码进行哈希处理,将哈希处理后的手机号码作为识别寄递面单对应用户的唯一标识。
35.子步骤s33、从预处理的寄递面单数据中,根据目标地址数据,筛选出对应的寄递面单数据。
36.步骤s4、确定寄递面单数据中的寄递地址的至少一种地理特征数据。
37.地理特征可以反映出用户的活动轨迹,并且在快递完成签收时能有效进行提前布控。可选地,地理特征数据包括:寄件发出地地址数、收件详细地址填写不正确数量、一人多址情况数量和寄件发往地地址数量。上述各地理特征对应的特征描述(或称为分析目的)如下:步骤s5、通过聚类算法分别识别地理特征数据的异常特征值。
38.可选地,如图3所示,图3为本公开实施例提供的步骤s5的具体流程图,通过聚类算法分别识别地理特征数据的异常特征值包括:子步骤s51、使用不含异常特征值的数据作为训练集,通过k-means算法,得到第一k均值聚类算法结果。
39.子步骤s52、使用地理特征数据作为测试集,通过k-means算法,得到第二k均值聚类算法结果。
40.子步骤s53、判断第二k均值聚类算法结果中,是否存在异常点,异常点与最近的聚类中心之间的距离超过第一k均值聚类算法结果中的最大距离。
41.子步骤s54、若存在异常点,将异常点对应的地理特征数据作为异常特征值。
42.若不存在异常点,则结束即可。
43.可选地,上述k-means算法包括:步骤a、确定聚类的个数k;步骤b、选择k个样本作为初始聚类中心;步骤c、确定每个样本的初始聚类中心;步骤d、计算每个样本的新聚类中心;重复以上步骤c和步骤d,直到满足收敛要求。
44.可选地,选择k个样本作为初始聚类中心的方式可以有多种,例如,第一种,任意产生k个聚类,然后确定聚类中心;第二种,直接生成k个聚类中心;第三种通过以下方式选择k个样本作为初始聚类中心:步骤a’,从训练集或测试集中,随机选取一个样本作为初始聚类中心;步骤b’,计算每个样本与初始聚类中心之间的最短距离;步骤c’,根据最短距离,计算每个样本被选为下一个初始聚类中心的概率;步骤d’,按照轮盘法选择出下一个初始聚类中心;重复以上步骤b’、 c’和d’,直到选出k个初始聚类中心。
45.步骤s6、根据异常特征值的识别结果,确定是否存在异常寄递行为。
46.可选地,在确定寄递面单数据中的寄递地址的多种地理特征数据,通过聚类算法分别识别每种地理特征数据的异常特征值时,根据异常特征值的识别结果,确定是否存在异常寄递行为包括:若任一种地理特征数据存在异常特征值,确定存在异常寄递行为,若每种地理特征数据均不存在异常特征值,确定不存在异常寄递行为。
47.可选地,如图4所示,图4为本公开实施例提供的异常寄递行为检测方法的流程图二,该异常寄递行为检测方法还包括:步骤s7、对异常寄递行为进行二次研判,根据二次研判结果可以生成预警信息,协助办案,还可以进一步优化以上异常寄递行为检测方法。
48.该异常寄递行为检测方法中,先建立寄递重点地区库,再根据待检测案件类型,从寄递重点地区库中获取目标地址数据,再根据目标地址数据,筛选出对应的寄递面单数据,再确定寄递面单数据中的寄递地址的至少一种地理特征数据,再通过聚类算法分别识别地理特征数据的异常特征值,最后根据异常特征值的识别结果,确定是否存在异常寄递行为。在以上过程中,以案件类型频繁发生的重点地区为基础,结合对寄递面单数据中的地理特征数据的数据分析,利用无监督学习中的聚类算法,检测地理特征数据中的异常特征值,从而分析异常寄递行为。因此,以上异常寄递行为检测方法具有高效性、实用性,不仅能十分有效地帮助警方缩小排查范围,减少人员消耗,还有助于掌握重点地区、重点人员的变化等,更好地为侦察办案和情报信息工作服务,使得预防犯罪成为可能。
49.此外,本公开实施例还提供了一种异常寄递行为检测系统,具体地,如图5所示,图5为本公开实施例提供的异常寄递行为检测系统的原理框图一,该异常寄递行为检测系统包括:地区库建立模块10,用于建立寄递重点地区库,寄递重点地区库中存储有至少一种案件类型的至少一个地址类型的地址数据;地址数据获取模块20,用于根据待检测案件类型,从寄递重点地区库中获取目标地址数据;面单数据筛选模块30,用于根据目标地址数据,筛选出对应的寄递面单数据;
地理特征数据确定模块40,确定寄递面单数据中的寄递地址的至少一种地理特征数据;识别模块50,通过聚类算法分别识别地理特征数据的异常特征值;异常寄递行为确定模块60,用于根据异常特征值的识别结果,确定是否存在异常寄递行为。
50.可选地,在地址数据包括区域地址和详细地址时,该异常寄递行为检测系统还包括:判断模块,用于在获取目标地址数据之后,判断目标地址数据的详细地址是否为空白。在详细地址为空白时,面单数据筛选模块30具体用于根据目标地址数据中的区域地址,筛选出对应的寄递面单数据。该异常寄递行为检测系统还包括:复核模块,用于在详细地址不为空白时,根据目标地址数据中的详细地址,筛选出对应的寄递面单数据,直接对寄递面单数据进行复核。
51.可选地,如图6所示,图6为本公开实施例提供的异常寄递行为检测系统的原理框图二,该异常寄递行为检测系统还包括:二次研判模块70,用于对异常寄递行为进行二次研判。
52.需要说明的是,本公开实施例中异常寄递行为检测方法的相关内容均适用于异常寄递行为检测系统中对应的各模块,此处不再进行赘述。
53.此外,本公开实施例还提供了一种电子设备,电子设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行以上任一的异常寄递行为检测方法。
54.根据本公开实施例的电子设备包括存储器和处理器。该存储器用于存储非暂时性计算机可读指令。具体地,存储器可以包括一个或多个计算机程序产品,该计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。该易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。该非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。
55.该处理器可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制电子设备中的其它组件以执行期望的功能。在本公开的一个实施例中,该处理器用于运行该存储器中存储的该计算机可读指令,使得该电子设备执行前述的本公开各实施例的异常寄递行为检测方法的全部或部分步骤。
56.本领域技术人员应能理解,为了解决如何获得良好用户体验效果的技术问题,本实施例中也可以包括诸如通信总线、接口等公知的结构,这些公知的结构也应包含在本公开的保护范围之内。
57.如图7所示,图7为本公开实施例提供的一种电子设备的结构示意图。图7示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
58.如图7所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等),其可以根据存储在只读存储器(rom)中的程序或者从存储装置加载到随机访问存储器(ram)中的程序而执行各种适当的动作和处理。在ram中,还存储有电子设备操作所需的各种程序和数据。处理装置、rom以及ram通过总线彼此相连。输入/输出(i/o)接口也连接至总线。
59.通常,以下装置可以连接至i/o接口:包括例如传感器或者视觉信息采集设备等的输入装置;包括例如显示屏等的输出装置;包括例如磁带、硬盘等的存储装置;以及通信装置。通信装置可以允许电子设备与其他设备(比如边缘计算设备)进行无线或有线通信以交换数据。虽然图7示出了具有各种装置的电子设备,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
60.本公开实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行以上任一的异常寄递行为检测方法。
61.特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置被安装,或者从rom被安装。在该计算机程序被处理装置执行时,执行本公开实施例的异常寄递行为检测方法的全部或部分步骤。
62.有关本实施例的详细说明可以参考前述各实施例中的相应说明,在此不再赘述。
63.根据本公开实施例的计算机可读存储介质,其上存储有非暂时性计算机可读指令。当该非暂时性计算机可读指令由处理器运行时,执行前述的本公开各实施例的异常寄递行为检测方法的全部或部分步骤。
64.上述计算机可读存储介质包括但不限于:光存储介质(例如:cd-rom和dvd)、磁光存储介质(例如:mo)、磁存储介质(例如:磁带或移动硬盘)、具有内置的可重写非易失性存储器的媒体(例如:存储卡)和具有内置rom的媒体(例如:rom盒)。
65.有关本实施例的详细说明可以参考前述各实施例中的相应说明,在此不再赘述。
66.以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
67.在本公开中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序,本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
68.另外,如在此使用的,在以“至少一个”开始的项的列举中使用的“或”指示分离的列举,以便例如“a、b或c的至少一个”的列举意味着a或b或c,或ab或ac或bc,或abc(即a和b和c)。此外,措辞“示例的”不意味着描述的例子是优选的或者比其他例子更好。
69.还需要指出的是,在本公开的系统和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
70.可以不脱离由所附权利要求定义的教导的技术而进行对在此所述的技术的各种
改变、替换和更改。此外,本公开的权利要求的范围不限于以上所述的处理、机器、制造、事件的组成、手段、方法和动作的具体方面。可以利用与在此所述的相应方面进行基本相同的功能或者实现基本相同的结果的当前存在的或者稍后要开发的处理、机器、制造、事件的组成、手段、方法或动作。因而,所附权利要求包括在其范围内的这样的处理、机器、制造、事件的组成、手段、方法或动作。
71.提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
72.为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
技术特征:
1.一种异常寄递行为检测方法,其特征在于,包括:建立寄递重点地区库,所述寄递重点地区库中存储有至少一种案件类型的至少一个地址类型的地址数据;根据待检测案件类型,从所述寄递重点地区库中获取目标地址数据;根据所述目标地址数据,筛选出对应的寄递面单数据;确定所述寄递面单数据中的寄递地址的至少一种地理特征数据;通过聚类算法分别识别所述地理特征数据的异常特征值;根据所述异常特征值的识别结果,确定是否存在异常寄递行为。2.根据权利要求1所述的异常寄递行为检测方法,其特征在于,所述案件类型包括涉危险品、涉烟、电信诈骗、销赃和其他,所述地址类型包括生产地和消费地,或者,生产地、中转地和消费地。3.根据权利要求1所述的异常寄递行为检测方法,其特征在于,所述地址数据包括区域地址和详细地址,所述异常寄递行为检测方法还包括:在获取所述目标地址数据之后,判断所述目标地址数据的详细地址是否为空白;所述根据所述目标地址数据,筛选出对应的寄递面单数据包括:在所述详细地址为空白时,根据所述目标地址数据中的区域地址,筛选出对应的寄递面单数据。4.根据权利要求3所述的异常寄递行为检测方法,其特征在于,还包括:在所述详细地址不为空白时,根据所述目标地址数据中的详细地址,筛选出对应的寄递面单数据,直接对所述寄递面单数据进行复核。5.根据权利要求1所述的异常寄递行为检测方法,其特征在于,所述地理特征数据包括:寄件发出地地址数、收件详细地址填写不正确数量、一人多址情况数量和寄件发往地地址数量。6.根据权利要求1所述的异常寄递行为检测方法,其特征在于, 所述通过聚类算法分别识别所述地理特征数据的异常特征值包括:使用不含异常特征值的数据作为训练集,通过k-means算法,得到第一k均值聚类算法结果;使用所述地理特征数据作为测试集,通过k-means算法,得到第二k均值聚类算法结果;判断所述第二k均值聚类算法结果中,是否存在异常点,所述异常点与最近的聚类中心之间的距离超过所述第一k均值聚类算法结果中的最大距离;若存在异常点,将所述异常点对应的地理特征数据作为所述异常特征值。7.根据权利要求1所述的异常寄递行为检测方法,其特征在于,在确定所述寄递面单数据中的寄递地址的多种地理特征数据,通过聚类算法分别识别每种所述地理特征数据的异常特征值时,所述根据所述异常特征值的识别结果,确定是否存在异常寄递行为包括:若任一种所述地理特征数据存在异常特征值,确定存在异常寄递行为,若每种所述地理特征数据均不存在异常特征值,确定不存在异常寄递行为。8.一种异常寄递行为检测系统,其特征在于,包括:地区库建立模块,用于建立寄递重点地区库,所述寄递重点地区库中存储有至少一种案件类型的至少一个地址类型的地址数据;地址数据获取模块,用于根据待检测案件类型,从所述寄递重点地区库中获取目标地
址数据;面单数据筛选模块,用于根据所述目标地址数据,筛选出对应的寄递面单数据;地理特征数据确定模块,确定所述寄递面单数据中的寄递地址的至少一种地理特征数据;识别模块,通过聚类算法分别识别所述地理特征数据的异常特征值;异常寄递行为确定模块,用于根据所述异常特征值的识别结果,确定是否存在异常寄递行为。9.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7任一所述的异常寄递行为检测方法。10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行权利要求1-7任一所述的异常寄递行为检测方法。
技术总结
本公开实施例公开了一种异常寄递行为检测方法、系统、电子设备和存储介质。其中,所述异常寄递行为检测方法包括:建立寄递重点地区库,所述寄递重点地区库中存储有至少一种案件类型的至少一个地址类型的地址数据;根据待检测案件类型,从所述寄递重点地区库中获取目标地址数据;根据所述目标地址数据,筛选出对应的寄递面单数据;确定所述寄递面单数据中的寄递地址的至少一种地理特征数据;通过聚类算法分别识别所述地理特征数据的异常特征值;根据所述异常特征值的识别结果,确定是否存在异常寄递行为。寄递行为。寄递行为。
技术研发人员:许良锋 王丰 李惟聪 任仰奇 张彬 杨睿 闻克宇 王云龙
受保护的技术使用者:国家邮政局邮政业安全中心
技术研发日:2022.02.07
技术公布日:2022/3/8