1.本发明涉及用电数据分析技术领域,尤其涉及一种受疫情影响用户识别方法。
背景技术:
2.受到新冠疫情不间断的冲击,各行各业遭受了不同程度的影响。在特殊时期做好供电、用电工作,前提是对用电数据进行必要的预测。而如何将疫情影响从用户、影响程度、对用电习惯方面从整体中剥离出来是一项艰巨且复杂的过程。
3.在大数据技术快速发展的背景下,客户标签技术在电商、互联网领域得到广泛应用。随着电力信息化应用的深度和广度不断增强,将大量的数据信息转化为便于理解、使用的日常生产知识,实现信息系统建设与日常生产实践相互促进的良性互动格局愈发重要,构建大用户的用电标签体系则是实现上述目标的重要途径。
4.建立用户标签首先通过业务需求调研,了解业务目标和工作流程,分析和识别业务需求,设计应用场景,然后收集和整理企业内外部数据源,预处理后汇聚融合成可供分析的熟数据,定义出标签的分析维度和颗粒度。
5.而由于生产生活与用电息息相关,通过电力数据,则可以从另一个角度对受到疫情影响的用户进行准确识别。
6.电力大用户涉及数据种类繁多,一方面数据信息碎片化分布于多个信息化系统中,营销业务人员需要从庞杂的业务系统中筛选有效信息,工作量大,对业务人员的业务水平要求高;另一方面每个用户具有多个维度的特征,且数据专业性强,针对不同的业务场景需要的用户特性有所差异。因此,为适应多变的市场分析需求,需要快速、准确的筛选出符合一定条件的用户,并对该群体进行分析、跟踪、研究。
技术实现要素:
7.本发明实施方式提供了一种受疫情影响用户识别方法,用于解决现有技术中如何识别受疫情影响用户,从而做好非正常时期供电的问题。
8.第一方面,本发明实施方式提供了一种受疫情影响用户识别方法,包括:
9.获取疫情用电分类模型、多个用户的标签以及多个用户的用电数据,其中,所述用电数据包括疫情前后的用电负荷,所述标签与所述用电数据相对应;
10.根据所述用电数据获得疫情前后的观测负荷变动比;
11.根据所述用户的标签对所述观测负荷变动比进行分类,获得多个负荷变动比数据集;
12.将每个所述负荷变动比数据集输入至所述疫情用电分类模型,确定疫情影响分类标准;
13.根据所述疫情影响分类标准确定受疫情影响的用户。
14.在一种可能实现的方式中,所述疫情用电分类模型:
[0015][0016]
式中,y'为数据集的预测总负荷变动,y为数据集的观测总负荷变动,e为数据集的总残差,k为数据集的疫情用电类分类数量,ni为第i疫情用电类的用户的数量,x
ij
为第i疫情用电类第j个用户疫情前的用电负荷,ci为第i疫情用电类的预测变动比。
[0017]
在一种可能实现的方式中,所述将每个所述负荷变动比数据集输入至所述疫情用电分类模型,确定疫情影响分类标准,包括:
[0018]
针对每个所述负荷变动数据集,执行步骤:
[0019]
获取所述负荷变动数据集的观测总负荷变动、多个疫情用电类的分类标准以及多个预测变动比,其中,所述预测变动比与所述疫情用电类的分类标准相对应;
[0020]
分类步骤:根据所述多个疫情用电类的分类标准,对所述负荷变动数据集中的各个负荷变动比进行分类,获得多个疫情用电类;
[0021]
根据所述多个疫情用电类,获得多个疫情用电类的残差,其中,所述多个疫情用电类的残差与所述多个疫情用电类相对应;
[0022]
获取疫情用电类的残差超过阈值的疫情用电类,作为改进类;
[0023]
针对所述改进类调整对应的分类标准,并跳转至所述分类步骤。
[0024]
在一种可能实现的方式中,所述根据所述多个疫情用电类,获得多个疫情类的残差,包括:
[0025]
对于每个所述疫情用电类,根据第一公式确定疫情类的残差,所述第一公式:
[0026][0027]
式中,ei为第i疫情用电类的残差,yi为第i疫情用电类的总负荷变动,x
ij
为第i疫情用电类第j个用户疫情前的用电负荷,ci为第i疫情用电类的预测变动比。
[0028]
在一种可能实现的方式中,所述疫情用电类的总负荷变动,根据第二公式确定,所述第二公式:
[0029][0030]
式中,yi为第i疫情用电类的总负荷变动,x
ij
为第i疫情用电类第j个用户疫情前的用电负荷,x
′
ij
为第i疫情用电类第j个用户疫情后的用电负荷。
[0031]
在一种可能实现的方式中,所述标签包括以下至少之一:行业分类标签、地区分类标签、用户容量分类标签。
[0032]
在一种可能实现的方式中,在所述根据所述分类标准确定受疫情影响的用户,之后,还包括:
[0033]
根据所述标签,确定与所述标签相对应的受疫情影响用户占比。
[0034]
第二方面,本发明实施方式提供了一种受疫情影响用户识别装置,包括:
[0035]
数据获取模块,用于获取疫情用电分类模型、多个用户的标签以及多个用户的用
电数据,其中,所述用电数据包括疫情前后的用电负荷,所述标签与所述用电数据相对应;
[0036]
变动比计算模块,用于根据所述用电数据获得疫情前后的观测负荷变动比;
[0037]
标签分类模块,用于根据所述用户的标签对所述观测负荷变动比进行分类,获得多个负荷变动比数据集;
[0038]
疫情影响分类标准确定模块,用于将每个所述负荷变动比数据集输入至所述疫情用电分类模型,确定疫情影响分类标准;
[0039]
以及,
[0040]
用户识别模块,用于根据所述疫情影响分类标准确定受疫情影响的用户。
[0041]
第三方面,本发明实施方式提供了一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面或第一方面的任一种可能的实现方式所述方法的步骤。
[0042]
第四方面,本发明实施方式提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上第一方面或第一方面的任一种可能的实现方式所述方法的步骤。
[0043]
本发明实施方式与现有技术相比存在的有益效果是:
[0044]
本发明实施方式公开了的一种受疫情影响用户识别方法,通过获取疫情用电分类模型、用户标签以及用电数据,通过用户标签对用户群体进行分类,将分类后的用户群体送入到分类模型中,确定分类标准,完成对用户群体的分类。该分类方法,根据标签分类,可以实现将大数据分为相对较小的数据进行处理,因此,降低了每次进行分类处理数据运算的复杂程度,且通过先根据标签分类,后对疫情影响分类,可以对不同的群体分别获取疫情影响数据,为后续的有针对性的供电工作提供了必要的数据支撑。
[0045]
本发明受疫情影响用户识别方法,其通过带有残差的分类模型,通过迭代方式对分类标准进行修正,因此保证了受疫情影响用户群体的群体影响程度的准确性,且计算量相对传统的排序计算方式要小很多。
附图说明
[0046]
为了更清楚地说明本发明实施方式中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0047]
图1是本发明实施方式提供的受疫情影响用户识别方法的流程图;
[0048]
图2是本发明实施方式提供的分地区的受影响用户占比图;
[0049]
图3是本发明实施方式提供的受疫情影响用户识别装置功能框图;
[0050]
图4是本发明实施方式提供的终端功能框图。
具体实施方式
[0051]
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施方式。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施方式中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置
以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
[0052]
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图通过具体实施方式来进行说明。
[0053]
下面对本发明的实施例作详细说明,本实例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
[0054]
图1为本发明实施方式提供的受疫情影响用户识别方法的流程图。
[0055]
如图1所示,其示出了本发明实施方式提供的受疫情影响用户识别方法的实现流程图,详述如下:
[0056]
在步骤101中,获取疫情用电分类模型、多个用户的标签以及多个用户的用电数据,其中,所述用电数据包括疫情前后的用电负荷,所述标签与所述用电数据相对应。
[0057]
在一些实施方式中,所述疫情用电分类模型:
[0058][0059]
式中,y'为数据集的预测总负荷变动,y为数据集的观测总负荷变动,e为数据集的总残差,k为数据集的疫情用电类分类数量,ni为第i疫情用电类的用户的数量,x
ij
为第i疫情用电类第j个用户疫情前的用电负荷,ci为第i疫情用电类的预测变动比。
[0060]
在一些实施方式中,所述标签包括以下至少之一:行业分类标签、地区分类标签、用户容量分类标签。
[0061]
示例性地,用户标签用于标识用户的用电基本属性,如用户所属行业、所在地区、设备状态等设置用户基本属性标签。用户标签主要目的在于通过业务需求调研,了解业务目标和工作流程,分析和识别业务需求,设计应用场景,然后收集和整理企业内外部数据源,预处理后汇聚融合成可供分析的熟数据,定义出标签的分析维度和颗粒度。
[0062]
行业分类标签,用户的行业分类依据来源于国家能源局发布的《中华人民共和国能源行业标准-国民经济行业用电分类》,将全社会用电总计分为全行业用电合计与城乡居民生活用电。将全行业用电合计进一步分为第一产业、第二产业与第三产业;进一步向下钻取则分为农、林、牧、渔业、工业、建筑业、交通运输、仓储和邮政业、信息传输、软件和信息技术服务业、批发和零售业、住宿和餐饮业、金融业、房地产业、租赁和商务服务业与公共服务及管理组织。
[0063]
地区分类标签,地区分类则主要依据电网公司的供电区域划分来进行标签设置,与行政区域可能有细微出入。本发明以和某电网为例,可将地区标签分为a市、b市、c市、d市、e市、f市、g新区与直辖地区。
[0064]
用户容量分类标签,用户的容量为离散型数据,以划分区间的方式对其进行标签化定义。
[0065]
将样本所有用户中最大容量标记为为c
max
,最小容量标记为为c
min
,在一种应用场景中,设置容量分类区间如下表所示。
[0066][0067]
应用上述几个标签后,可以将用户分为若干类,通过这若干类再进行数据分析,就可以获得与各类相对应的数据分析,从而针对不同类的用户采取差异化的、有针对性供电方案。
[0068]
本发明实施方式提供了一种分类模型,在分类模型基础上,调整分类标准,最终使得,分类后的用户疫情影响程度与分类标准一致,该分类模型:
[0069][0070]
式中,y'为数据集的预测总负荷变动,y为数据集的观测总负荷变动,e为数据集的总残差,k为数据集的疫情用电类分类数量,ni为第i疫情用电类的用户的数量,x
ij
为第i疫情用电类第j个用户疫情前的用电负荷,ci为第i疫情用电类的预测变动比。
[0071]
在步骤102中,根据所述用电数据获得疫情前后的观测负荷变动比。
[0072]
示例性地,负荷变动比是表征用户受疫情影响程度的比值,在一种实施方式中,在获取到多个用户的用电数据后,针对每个用户获取疫情前后的负荷变动比。
[0073]
一般而言,疫情爆发后,通常有个时间节点,以某地为例,当地疫情爆发后,采取措施的日期为1月6日,措施结束日期为1月29日,措施期间为23天。那么,对于任一用户,计算疫情前后的负荷变动比,就可以采用如下公式获得:
[0074][0075]
式中,c为疫情前后的负荷变动比,x为疫情前的负荷,本实施方式取1月6日前23天的平均负荷,x’为疫情后的负荷,本实施方式取1月6日至1月29日之间的平均负荷。
[0076]
负荷变动比是进行疫情影响用户的识别的必要条件。
[0077]
在步骤103中,根据所述用户的标签对所述观测负荷变动比进行分类,获得多个负荷变动比数据集。
[0078]
示例性地,如前所述,根据标签进行分类,可以获得与各类相对应的数据分析,从而针对不同类的用户采取差异化的、有针对性供电方案,就一种具体的实施方式而言,其根据标签可以就地区、行业以及容量大小,分为多个类别,如典型的几个类别:地区1工业行业的容量极大用户、地区1工业行业容量小用户、
……
地区8建筑业容量小用户。
[0079]
在步骤104中,将每个所述负荷变动比数据集输入至所述疫情用电分类模型,确定疫情影响分类标准。
[0080]
在一些实施方式中,步骤104包括:
[0081]
针对每个所述负荷变动数据集,执行步骤:
[0082]
获取所述负荷变动数据集的观测总负荷变动、多个疫情用电类的分类标准以及多个预测变动比,其中,所述预测变动比与所述疫情用电类的分类标准相对应。
[0083]
分类步骤:根据所述多个疫情用电类的分类标准,对所述负荷变动数据集中的各个负荷变动比进行分类,获得多个疫情用电类。
[0084]
根据所述多个疫情用电类,获得多个疫情用电类的残差,其中,所述多个疫情用电类的残差与所述多个疫情用电类相对应。
[0085]
获取疫情用电类的残差超过阈值的疫情用电类,作为改进类。
[0086]
针对所述改进类调整对应的分类标准,并跳转至所述分类步骤。
[0087]
在一些实施方式中,所述根据所述多个疫情用电类,获得多个疫情类的残差,包括:
[0088]
对于每个所述疫情用电类,根据第一公式确定疫情类的残差,所述第一公式:
[0089][0090]
式中,ei为第i疫情用电类的残差,yi为第i疫情用电类的总负荷变动,x
ij
为第i疫情用电类第j个用户疫情前的用电负荷,ci为第i疫情用电类的预测变动比。
[0091]
在一些实施方式中,所述疫情用电类的总负荷变动,根据第二公式确定,所述第二公式:
[0092][0093]
式中,yi为第i疫情用电类的总负荷变动,x
ij
为第i疫情用电类第j个用户疫情前的用电负荷,x
′
ij
为第i疫情用电类第j个用户疫情后的用电负荷。
[0094]
示例性地,对于受疫情影响的用户的识别,应当划分分类标准,而分类标准,应当统一,且损失程度与分类标准一致,具体的来讲,如果一种实施方式中,受疫情影响程度75%(用户群体负荷变动比75%)的用户定为极其显著影响的用户群体,显然我们不能要求每个用户的影响程度均为75%,但是,在确定用户群体时,应当做到整个极其显著影响的用户群体受疫情影响程度为75%。在群体标准的前提下,确定群体用户的数量以及群体用户的标准。
[0095]
本发明实施方式采用了一种迭代式计算方法,确定群体用户的数量,以及群体用户的标准。
[0096]
首先,应当明确分为几类,就本实施方式而言,总共将群体分为了三类,分别是极其显著、显著以及不显著,对于极其显著的用户群体,用户群体受影响程度为75%(即用户群体观测负荷变动比为75%,极其现显著类预测变动比),对于显著的用户群体,其受影响程度为45%(即用户群体观测负荷变动比为45%,显著类预测变动比),对于不显著的用户群体,其受影响程度为15%(用户群体观测负荷变动比15%,不显著类预测变动比)。
[0097]
然后,预估一个分类标准,如极其显著分类标准为60%,就意味着,如果某个用户观测负荷变动为60%以上,则这个用户被划分到极其显著群体类;显著分类标准为30%,就意味着,如果某个用户观测负荷变动为30%-60%之间,则这个用户被划分到显著群体类,
而对于观测负荷变动为30%以下的用户,划分为不显著群体类。根据这个预估的分类标准对用户进行划分,得到三个疫情用电类(分别是极其显著群体类、显著群体类、不显著群体类)。
[0098]
很显然,这个预估的分类标准得到的三个用户群体的观测负荷变动不会与用户群体的预测负荷变动相同,如,观测负荷比60%以上的用户作为一个极其显著用户群体,该群体的观测负荷变动比为70%,那么就会存在一个残差,残差对应的百分比为70%-75%=-5%。所以,应当对整个群体分类标准进行改进,而改进方式与残差有关,因残差为负数,因此,应当将分类标准提高,如将极其显著分类标准提高到63%。
[0099]
最后,在提高了分类标准后,再次进行上述的分类以及残差计算步骤,直至残差低于阈值,比如一种应用场景中,阈值为
±
1%,即极其显著的用户群体的负荷变动比在74%-76%这个区间,就可以固定分类标准。
[0100]
上述过程是针对极其显著用户群体进行开展的迭代运算过程,对于显著用户群体以及不显著用户群体,迭代方式相同。
[0101]
对于上述计算残差的方式,可以用公式表示:
[0102][0103]
式中,ei为第i疫情用电类的残差,yi为第i疫情用电类的总负荷变动,x
ij
为第i疫情用电类第j个用户疫情前的用电负荷,ci为第i疫情用电类的预测变动比。
[0104]
对于用户群体总负荷变动,可以用公示表示:
[0105][0106]
式中,yi为第i疫情用电类的总负荷变动,x
ij
为第i疫情用电类第j个用户疫情前的用电负荷,x
′
ij
为第i疫情用电类第j个用户疫情后的用电负荷。
[0107]
在步骤105中,根据所述疫情影响分类标准确定受疫情影响的用户。
[0108]
示例性地,在确定了受疫情分类标准后,就可以按照分类标准,对受疫情影响的用户进行分类。
[0109]
在一些实施方式中,还包括步骤106,在步骤106中,根据所述标签,确定与所述标签相对应的受疫情影响用户占比。
[0110]
示例性地,在对用户进行分类后,就可以绘制图表,如根据标签分地区、或者分行业说明受疫情影响用户的占比。
[0111]
图2即绘制出了分地区的受影响用户占比图。
[0112]
本发明受疫情影响用户识别方法,通过获取疫情用电分类模型、用户标签以及用电数据,通过用户标签对用户群体进行分类,将分类后的用户群体送入到分类模型中,确定分类标准,完成对用户群体的分类。该分类方法,根据标签分类,可以实现将大数据分为相对较小的数据进行处理,因此,降低了每次进行分类处理数据运算的复杂程度,且通过先根据标签分类,后对疫情影响分类,可以对不同的群体分别获取疫情影响数据,为后续的有针对性的供电工作提供了必要的数据支撑。
[0113]
本发明受疫情影响用户识别方法,其通过带有残差的分类模型,通过迭代方式对
分类标准进行修正,因此保证了受疫情影响用户群体的群体影响程度的准确性,且计算量相对传统的排序计算方式要小很多。
[0114]
应理解,上述实施方式中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施方式的实施过程构成任何限定。
[0115]
以下为本发明的装置实施方式,对于其中未详尽描述的细节,可以参考上述对应的方法实施方式。
[0116]
图3是本发明实施方式提供的受疫情影响用户识别装置功能框图,参照图3,受疫情影响用户识别装置3包括:数据获取模块301、变动比计算模块302、标签分类模块303、疫情影响分类标准确定模块304以及用户识别模块305
[0117]
数据获取模块301,用于获取疫情用电分类模型、多个用户的标签以及多个用户的用电数据,其中,所述用电数据包括疫情前后的用电负荷,所述标签与所述用电数据相对应;
[0118]
变动比计算模块302,用于根据所述用电数据获得疫情前后的观测负荷变动比;
[0119]
标签分类模块303,用于根据所述用户的标签对所述观测负荷变动比进行分类,获得多个负荷变动比数据集;
[0120]
疫情影响分类标准确定模块304,用于将每个所述负荷变动比数据集输入至所述疫情用电分类模型,确定疫情影响分类标准;
[0121]
用户识别模块305,用于根据所述疫情影响分类标准确定受疫情影响的用户。
[0122]
图4是本发明实施方式提供的终端的功能框图。如图4所示,该实施方式的终端4包括:处理器400、存储器401以及存储在所述存储器401中并可在所述处理器400上运行的计算机程序402。所述处理器400执行所述计算机程序402时实现上述各个受疫情影响用户识别方法及实施方式中的步骤,例如图1所示的步骤101至步骤105。
[0123]
示例性的,所述计算机程序402可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器401中,并由所述处理器400执行,以完成本发明。
[0124]
所述终端4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端4可包括,但不仅限于,处理器400、存储器401。本领域技术人员可以理解,图4仅仅是终端4的示例,并不构成对终端4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。
[0125]
所称处理器400可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0126]
所述存储器401可以是所述终端4的内部存储单元,例如终端4的硬盘或内存。所述存储器401也可以是所述终端4的外部存储设备,例如所述终端4上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述存储器401还可以既包括所述终端4的内部存储单元也包括外部存储设
备。所述存储器401用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器401还可以用于暂时地存储已经输出或者将要输出的数据。
[0127]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施方式中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施方式中的对应过程,在此不再赘述。
[0128]
在上述实施方式中,对各个实施方式的描述都各有侧重,某个实施方式中没有详述或记载的部分,可以参见其它实施方式的相关描述。
[0129]
本领域普通技术人员可以意识到,结合本文中所公开的实施方式描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0130]
在本发明所提供的实施方式中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施方式仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0131]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
[0132]
另外,在本发明各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0133]
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施方式方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个受疫情影响用户识别方法及受疫情影响用户识别装置实施方式的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、电载波信号、
电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
[0134]
以上所述实施方式仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施方式对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施方式技术方案的精神和范围,均应包含在本发明的保护范围之内。
技术特征:
1.一种受疫情影响用户识别方法,其特征在于,包括:获取疫情用电分类模型、多个用户的标签以及多个用户的用电数据,其中,所述用电数据包括疫情前后的用电负荷,所述标签与所述用电数据相对应;根据所述用电数据获得疫情前后的观测负荷变动比;根据所述用户的标签对所述观测负荷变动比进行分类,获得多个负荷变动比数据集;将每个所述负荷变动比数据集输入至所述疫情用电分类模型,确定疫情影响分类标准;根据所述疫情影响分类标准确定受疫情影响的用户。2.根据权利要求1所述的受疫情影响用户识别方法,其特征在于,所述疫情用电分类模型为:式中,y'为数据集的预测总负荷变动,y为数据集的观测总负荷变动,e为数据集的总残差,k为数据集的疫情用电类分类数量,ni为第i疫情用电类的用户的数量,x
ij
为第i疫情用电类第j个用户疫情前的用电负荷,c
i
为第i疫情用电类的预测变动比。3.根据权利要求2所述的受疫情影响用户识别方法,其特征在于,所述将每个所述负荷变动比数据集输入至所述疫情用电分类模型,确定疫情影响分类标准,包括:针对每个所述负荷变动数据集,执行以下步骤:获取所述负荷变动数据集的观测总负荷变动、多个疫情用电类的分类标准以及多个预测变动比,其中,所述预测变动比与所述疫情用电类的分类标准相对应;分类步骤:根据所述多个疫情用电类的分类标准,对所述负荷变动数据集中的各个负荷变动比进行分类,获得多个疫情用电类;根据所述多个疫情用电类,获得多个疫情用电类的残差,其中,所述多个疫情用电类的残差与所述多个疫情用电类相对应;获取疫情用电类的残差超过阈值的疫情用电类,作为改进类;针对所述改进类调整对应的分类标准,并跳转至所述分类步骤。4.根据权利要求3所述的受疫情影响用户识别方法,其特征在于,所述根据所述多个疫情用电类,获得多个疫情类的残差,包括:对于每个所述疫情用电类,根据第一公式确定疫情类的残差,所述第一公式:式中,e
i
为第i疫情用电类的残差,y
i
为第i疫情用电类的总负荷变动,x
ij
为第i疫情用电类第j个用户疫情前的用电负荷,c
i
为第i疫情用电类的预测变动比。5.根据权利要求4所述的受疫情影响用户识别方法,其特征在于,所述疫情用电类的总负荷变动,根据第二公式确定,所述第二公式:
式中,y
i
为第i疫情用电类的总负荷变动,x
ij
为第i疫情用电类第j个用户疫情前的用电负荷,x
′
ij
为第i疫情用电类第j个用户疫情后的用电负荷。6.根据权利要求1-5任一项所述的受疫情影响用户识别方法,其特征在于,所述标签包括以下至少之一:行业分类标签、地区分类标签、用户容量分类标签。7.根据权利要求6所述的受疫情影响用户识别方法,其特征在于,在所述根据所述分类标准确定受疫情影响的用户,之后,还包括:根据所述标签,确定与所述标签相对应的受疫情影响用户占比。8.一种受疫情影响用户识别装置,其特征在于,包括:数据获取模块,用于获取疫情用电分类模型、多个用户的标签以及多个用户的用电数据,其中,所述用电数据包括疫情前后的用电负荷,所述标签与所述用电数据相对应;变动比计算模块,用于根据所述用电数据获得疫情前后的观测负荷变动比;标签分类模块,用于根据所述用户的标签对所述观测负荷变动比进行分类,获得多个负荷变动比数据集;疫情影响分类标准确定模块,用于将每个所述负荷变动比数据集输入至所述疫情用电分类模型,确定疫情影响分类标准;以及,用户识别模块,用于根据所述疫情影响分类标准确定受疫情影响的用户。9.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上的权利要求1至7中任一项所述方法的步骤。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上的权利要求1至7中任一项所述方法的步骤。
技术总结
本发明涉及用电数据分析技术领域,尤其涉及一种受疫情影响用户识别方法,本发明方法通过获取疫情用电分类模型、用户标签以及用电数据,通过用户标签对用户群体进行分类,将分类后的用户群体送入到分类模型中,确定分类标准,完成对用户群体的分类。该分类方法,根据标签分类,可以实现将大数据分为相对较小的数据进行处理,因此,降低了每次进行分类处理数据运算的复杂程度,且通过先根据标签分类,后对疫情影响分类,可以对不同的群体分别获取疫情影响数据,为后续的有针对性的供电工作提供了必要的数据支撑。必要的数据支撑。必要的数据支撑。
技术研发人员:郭威 张凯 何胜 张然 刘梅 周辉
受保护的技术使用者:国家电网有限公司 国网河北省电力有限公司 北京清软创新科技股份有限公司
技术研发日:2021.12.09
技术公布日:2022/3/8