1.本发明涉及电力行业能耗预测技术领域,尤其涉及一种基于图神经网络的企业能耗预测方法及装置。
背景技术:
2.电力行业是我国能源消耗和污染排放的主要行业之一。在工业化的快速发展过程中,我国的电力需求规模也随之扩大,此过程带来的能源消耗和环境污染等问题也日益突出。当前的企业能耗监督、管理过程中,由于企业能耗信息上报存在一定的滞后,无法及时获取当月的企业能耗总体情况,为了应对这一问题,需要进行企业能耗的阶段性预测方法研究。在当前节能减排的政策下,及时准确的企业能耗预测有利于优化电力行业结构和资源配置,对能耗监管方面有重要意义。
3.目前主要的能耗预测方法有三类,第一类是融合了专家知识和物理规律的经济学模型,但此类方法需要的输入数据类型较多,成本高昂且建模过程较为繁琐。第二类是依据电力数据可实时获取,时间上没有滞后,并假设电力消耗与不同类型的能耗之间具有相关性,使用历史的电力数据与能耗数据建立多项式进行最小二乘拟合,然后使用拟合后的模型进行能耗预测。但这种方法具有较大的局限性,第一,不是所有能耗类型都与电力有显著的相关性;第二,不同行业的能耗与电力相关性也不同,因此需要分别建模;第三,此方法只能从总体上进行预测,无法预测单个企业的能耗情况。第三类是基于时间序列的预测方法,该方法基于历史的企业能耗时间序列数据,使用传统的统计方法如自回归移动平均,或机器学习方法如随机森林、支持向量机、循环神经网络等,进行时序预测,但这依赖于能耗数据的平稳性,如果不同月份之间波动较大,则预测效果会变差。同时上述方法均未考虑企业能耗类型以及所属行业之间的关联性,因此预测精度仍有待提升。
技术实现要素:
4.基于现有技术的上述情况,本发明的目的在于提供一种基于图神经网络的企业能耗预测方法及装置,基于现有技术的缺点,不仅考虑历史能耗数据与未来预测结果的时序变化关系,同时考虑到企业能耗类型和行业信息,提高预测精度,通过提供一个更加灵活的预测框架,既可以从更细的尺度预测单个企业的能耗情况,也可以得到不同行业或不同区域的能耗预测结果。
5.为达到上述目的,根据本发明的一个方面,提供了一种基于图神经网络的企业能耗预测方法,包括:
6.s1、从数据源中获取预定历史周期内多个企业的企业数据,所述企业数据划分为待预测变量和历史输入变量;
7.s2、利用所述企业数据,构建样本数据集,将所述样本数据集划分为训练数据集、验证数据集和测试数据集;
8.s3、获取待预测月份前t个月各企业的历史输入变量,利用每个企业的所属行业和
用能类型计算邻接矩阵m和权重矩阵w;
9.s4、构建基于图卷积神经网络的预测模型,并将所述邻接矩阵m和权重矩阵w输入所述图卷积神经网络的预测模型中;
10.s5、采用所述训练数据集中的样本对所述预测模型进行训练,并采用所述验证数据集验证所述预测模型的精度,直至采用测试数据集测试输出的预测结果满足精度要求;
11.s6、采用所述预测模型进行企业能耗预测。
12.进一步的,所述步骤s1还包括:
13.将各变量转换为近似正态分布,并计算各个变量对数转换后的均值μ和标准差σ。
14.进一步的,所述构建样本数据集,包括:
15.s21、获取待预测月份前t个月各企业的历史输入变量,所述历史输入变量包括16种产值能耗信息,并对每个企业的所属行业和用能类型进行编码;根据所得到的编码,计算邻接矩阵m和权重矩阵w;
16.s22、获取待预测月份前预定月数各企业的历史输入变量,以得到单个样本的输入特征x,该输入特征x的维度为n
×
t
×ci
;其中,n为企业数量,t为历史月数,ci为输入特征数量;
17.s23、获取待预测月份的待预测变量,得到单个样本的标签y,该标签y的维度为n
×co
,co为输出特征数量;
18.s24、对所述输入特征x和标签y进行标准化处理;
19.s25、遍历所述预定历史周期中所有的历史月份,重复所述步骤s21-s24,得到所述样本数据集的所有样本,所述样本的数据结构包括邻接矩阵m、权重矩阵w、输入特征x和标签y。
20.进一步的,所述步骤s24中,对所述输入特征x和标签y进行标准化处理,包括:
[0021][0022]
其中,v为标准化前的值,v
′
为标准化后的值。
[0023]
进一步的,所述利用所述历史输入变量计算邻接矩阵m和权重矩阵w,包括:
[0024]
所述历史输入变量包括所属行业和用能类型,对每个企业的所属行业和用能类型进行编码,根据所得到的编码,计算邻接矩阵m和权重矩阵w。
[0025]
进一步的,所述计算邻接矩阵m,包括:
[0026]
s311、计算两个企业间的jaccard距离dj(i,j):
[0027][0028]
其中,ai和aj为企业i和企业j的编码;
[0029]
s312、遍历所有企业,计算两两之间的jaccard距离,得到距离矩阵d,该距离矩阵d的维度为n
×
n,n为企业数量;
[0030]
s313、针对距离矩阵d中的元素d
ij
,i≤n,j≤n;
[0031]
若d
ij
>d
th
,则m
ij
=0;
[0032]
若d
ij
≤d
th
,则m
ij
=1;
[0033]
从而得到邻接矩阵m,其中,d
th
为预设距离阈值,m
ij
为邻接矩阵m中的元素。
[0034]
进一步的,所述计算权重矩阵w,包括:
[0035]
针对所述邻接矩阵m中的元素m
ij
,
[0036]
若m
ij
=1,则采用高斯核函数计算权重值w
ij
:
[0037][0038]
若m
ij
=0,则w
ij
=0;
[0039]
从而得到权重矩阵w,其中,w
ij
为权重矩阵w中的元素。
[0040]
进一步的,所述图卷积神经网络的预测模型包括输入层、隐藏层和输出层;
[0041]
所述输入层的节点为企业,边连接包括所述邻接矩阵m,边权重包括所述权重矩阵w。
[0042]
进一步的,所述预测结果满足精度要求,包括:
[0043]
采用决定系数r2、求和百分比误差error作为精度评价指标:
[0044][0045][0046]
其中,m为样本数量,yi为真实值,为预测值,为真实值的均值。
[0047]
根据本发明的另一个方面,提供了一种基于图神经网络的企业能耗预测装置,包括数据获取模块、样本数据集构建模块、矩阵计算模块、预测模型构建模块、模型训练模块、以及预测模块;其中,
[0048]
所述数据获取模块用于从数据源中获取预定历史周期内多个企业的企业数据,所述企业数据划分为待预测变量和历史输入变量;
[0049]
所述样本数据集构建模块用于利用所述企业数据,构建样本数据集,将所述样本数据集划分为训练数据集、验证数据集和测试数据集;
[0050]
所述矩阵计算模块用于获取待预测月份前t个月各企业的历史输入变量,所述历史输入变量包括16种产值能耗信息,并对每个企业的所属行业和用能类型进行编码,根据所得到的编码,计算邻接矩阵m和权重矩阵w;
[0051]
所述预测模型构建模块用于构建基于图卷积神经网络的预测模型,并将所述邻接矩阵m和权重矩阵w输入所述图卷积神经网络的预测模型中;
[0052]
所述模型训练模块用于采用所述训练数据集中的样本对所述预测模型进行训练,并采用所述验证数据集验证所述预测模型的精度,直至采用测试数据集测试输出的预测结果满足精度要求;
[0053]
所述预测模块用于采用所述预测模型进行企业能耗预测。
[0054]
进一步的,所述图卷积神经网络的预测模型包括输入层、隐藏层和输出层;
[0055]
所述输入层的节点为企业,边连接包括所述邻接矩阵m,边权重包括所述权重矩阵w。
[0056]
综上所述,本发明提供了一种基于图神经网络的企业能耗预测方法及装置,通过
获取历史数据构建样本数据集,并根据每个企业的所属行业和用能类型计算邻接矩阵m和权重矩阵w,以构建基于图神经网络的预测模块。本发明提供的技术方案,针对现有技术的缺点,不仅考虑历史能耗数据与未来预测结果的时序变化关系,同时考虑到企业能耗类型和行业信息,以此计算邻接矩阵m和权重矩阵w来构建图神经网络,从而提高了预测精度,通过提供一个更加灵活的预测框架,既可以从更细的尺度预测单个企业的能耗情况,也可以得到不同行业或不同区域的能耗预测结果。
附图说明
[0057]
图1是本发明实施例基于图神经网络的企业能耗预测方法的原理示意图;
[0058]
图2是本发明实施例基于图神经网络的企业能耗预测方法的流程图;
[0059]
图3是本发明实施例提供的图卷积神经网络的能耗预测模型的结构示意图;
[0060]
图4是本发明实施例基于图神经网络的企业能耗预测装置的构成框图。
具体实施方式
[0061]
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
[0062]
下面对结合附图对本发明的技术方案进行详细说明。根据本发明的第一个实施例,提供了一种基于图神经网络的企业能耗预测方法,图1中示出了该方法的原理示意图,本实施例提供的该预测方法主要包括数据获取和存储、数据预处理、模型训练和验证、实时预测这四个部分,最终的预测结果可以是单个企业的能耗情况,也可以是按照区域或行业统计后的结果。该预测方法的流程图如图2所示,包括以下步骤:
[0063]
s1、从数据源中获取预定历史周期内多个企业的企业数据,所述企业数据划分为待预测变量和历史输入变量。本发明实施例中使用的数据源为某监测系统中逐月上报的企业能耗数据,记录了2600多家重点用能企业的能耗信息,如图1所示,主要包括各个企业的企业收支平衡信息(如用能类型、不同能源类型的投入产出),产值能耗信息(如工业总产值、增加值、用电量、总综合能耗等),以及各个企业的元数据(如所属区域和行业类型)。从上述的数据源中选取预测模型所需的数据类型,并对这些数据进行一系列预处理,并进行特征构造,得到符合模型输入的样本结构。其中,所述待预测变量例如可以包括工业总产值、总综合能耗、工业增加值、等价值综合能耗共4种指标;所述历史输入变量类型例如可以包括工业总产值、生产总成本、总用电量、发电量等16种产值能耗信息。获取全部历史输入变量,统计各个变量的数据分布情况,使用对数转换将各变量转换为近似正态分布,然后计算各个变量对数转换后的均值μ和标准差σ,用于后续样本数据的标准化处理。对数转换可以采用以下公式:
[0064]
x
′
=ln(x)
[0065]
s2、利用所述企业数据,构建样本数据集,将所述样本数据集划分为训练数据集、验证数据集和测试数据集。构建样本数据集,可以包括以下步骤:
[0066]
s21、获取待预测月份前一个月各企业的历史输入变量,所述历史输入变量包括工
业总产值、生产总成本、总用电量、发电量等16种产值能耗信息,并对其中每个企业的所属行业和用能类型进行编码;根据所得到的编码,计算邻接矩阵m和权重矩阵w。例如,确定待预测数据月份为2020年3月,获取上个月上报企业的企业数据,包括所属行业和用能类型,其中行业类型按照二级类划分总共有97个,用能类型共有38个。对每个企业的行业和用能类型进行编码,方法为:初始化一个长度为97+38=135的一维数组a=[0,0,...,0],该数组的初始值为0,按照所属行业将对应行业的值赋为1,将对应的用能类型赋值为1,因此前97个值代表行业信息的编码,后38个值代表企业用能类型的编码,一个企业有一个所属行业,但可以有多个用能类型。使用该编码,可以计算模型输入所需的邻接矩阵m和权重矩阵w。所述计算邻接矩阵m,包括:
[0067]
s311、计算两个企业间的jaccard距离dj(i,j):
[0068][0069]
其中,ai和aj为企业i和企业j的编码;
[0070]
s312、遍历所有企业,计算两两之间的jaccard距离,得到距离矩阵d,该距离矩阵d的维度为n
×
n,n为企业数量;
[0071]
s313、针对距离矩阵d中的元素d
ij
,i≤n,j≤n;
[0072]
若d
ij
>d
th
,则m
ij
=0;
[0073]
若d
ij
≤d
th
,则m
ij
=1
[0074]
从而得到邻接矩阵m,其中,d
th
为预设距离阈值,m
ij
为邻接矩阵m中的元素。
[0075]
所述计算权重矩阵w,包括:
[0076]
针对所述邻接矩阵m中的元素m
ij
,
[0077]
若m
ij
=1,则采用高斯核函数计算权重值w
ij
:
[0078][0079]
若m
ij
=0,则w
ij
=0;
[0080]
从而得到权重矩阵w,其中,w
ij
为权重矩阵w中的元素。
[0081]
s22、获取待预测月份前预定月数各企业的历史输入变量,以得到单个样本的输入特征x,该输入特征x的维度为n
×
t
×ci
;其中,n为企业数量,t为历史月数,ci为输入特征数量;
[0082]
s23、获取待预测月份的待预测变量,得到单个样本的标签y,该标签y的维度为n
×co
,co为输出特征数量;
[0083]
s24、采用以下公式对所述输入特征x和标签y进行标准化处理:
[0084][0085]
其中,v为标准化前的值,v
′
为标准化后的值。
[0086]
s25、遍历所述预定历史周期中所有的历史月份,重复所述步骤s21-s24,得到所述样本数据集的所有样本,所述样本的数据结构包括邻接矩阵m、权重矩阵w、输入特征x和标签y。
[0087]
s3、获取待预测月份前t个月各企业的历史输入变量,所述历史输入变量包括工业总产值、生产总成本、总用电量、发电量等16种产值能耗信息,并对每个企业的所属行业和用能类型进行编码,根据所得到的编码,计算邻接矩阵m和权重矩阵w。
[0088]
s4、构建基于图卷积神经网络的预测模型,并将所述邻接矩阵m和权重矩阵w输入所述图卷积神经网络的预测模型中。
[0089]
s5、采用所述训练数据集中的样本对所述预测模型进行训练,并采用所述验证数据集验证所述预测模型的精度,直至采用测试数据集测试输出的预测结果满足精度要求。图3中示出了本发明实施例提供的图卷积神经网络(graph convolutional networks,gcn)的能耗预测模型的结构示意图。该预测模型的主题结构基于图卷积神经网络,包括输入层、隐藏层和输出层;所述输入层的节点为企业,边连接包括所述邻接矩阵m,边权重包括所述权重矩阵w,节点属性例如可以为预定历史周期内各企业的企业数据,该预定历史周期例如为12个月。中间的隐藏层为两个gcn卷积层,输出层即为各个企业在下个月的预测结果。
[0090]
采用所述训练数据集中的样本对所述预测模型进行训练,训练流程可以按照以下步骤进行:
[0091]
s51、设定超参数和模型结构参数,包括学习率,优化器,输入输出长度,滤波器大小,邻接矩阵阈值等。
[0092]
s52、使用训练数据集中的样本训练模型,并采用所述验证数据集验证所述预测模型的精度,根据验证结果多次调整以上参数,迭代训练,以得到最优模型。
[0093]
s53、使用测试数据集测试最终模型的精度。由于本发明实施例采用的预测模型为回归预测问题,因此选择决定系数r2、求和百分比误差error作为精度评价指标,来为训练过程中的参数选择和最终的精度评价提供依据。r2越接近1,求和百分比误差越小,表示精度越高,两者的计算公式分别为:
[0094][0095][0096]
其中,m为样本数量,yi为真实值,为预测值,为真实值的均值。
[0097]
以下以一个实例说明总体精度验证的过程。
[0098]
(1)初始化模型,读取训练好的参数文件并恢复模型。
[0099]
(2)将测试数据集中的样本输入已恢复的模型,得到所有测试样本中各个企业下个月的预测结果。
[0100]
(3)对比每个测试样本中所有企业各个预测指标的真实值和预测值,分别计算上述指标的r2和error,并以此方式遍历计算所有测试月份的样本。
[0101]
(4)设置测试月份为2020.1~2021.5,汇总所有月份的精度评价指标,并计算平均值,结果如表1所示。四个指标的r2均在0.9以上,工业总产值、工业增加值和等价值综合能耗的误差均小于5%,工业增加值的误差略大于其他三者,为10.22%。
[0102]
表1总体精度评价结果
[0103][0104]
s6、采用所述预测模型进行企业能耗预测。
[0105]
以下以一个实例说明采用本发明实施例进行预测的结果。
[0106]
以2021年6月为例,预测了某省2000多家重点用能企业的能耗指标,并选取主要行业汇总得到表2。表3为所有企业预测结果求和与后期上报的实际值的对比情况,除工业增加值误差略大(11.42%)外,其他三个指标的误差均小于5%,其中总综合能耗和等价值综合能耗误差小于1%。在此精度下,结合行业专家的先验知识,预测结果可以作为宏观调控的重要参考依据。
[0107]
表2 2021.6月某省主要行业能耗预测结果
[0108][0109]
表3 2021.6月预测误差
[0110][0111]
在模型训练完成后,实际使用过程中,需要在服务器搭建预测服务,供客户端调用,以满足实际应用中企业能耗预测的需求。
[0112]
6-1获取待预测月份的输入数据,并按照步骤s2-s4进行预处理,其中标准化过程中使用的均值和标准差需要与训练数据集保持一致。
[0113]
6-2.初始化模型,读取训练好的参数文件并恢复模型。
[0114]
6-3.将步骤6-1的结果输入模型得到输出结果,然后对模型输出结果进行标准化处理公式的逆运算,得到四个指标的预测值。
[0115]
6-4.按照企业所属行业和区域统计汇总预测结果,并上传到平台前端展示。
[0116]
6-5.将上述过程部署为定时运行的预测服务。
[0117]
由于市场价格等外部因素的影响,企业的用能类型,各类型能耗占比等可能会发生变化,用历史数据训练的模型精度会出现退化,因此需要每月将新增的历史数据加入训练数据集,对模型进行增量训练,更新模型,保持较高的预测精度,这一步对于预测服务的持续稳定运行是必要的。
[0118]
根据本发明的另一个方面,提供了一种基于图神经网络的企业能耗预测装置,该装置的构成框图如图4所示,该装置包括数据获取模块、样本数据集构建模块、矩阵计算模块、预测模型构建模块、模型训练模块、以及预测模块;其中,
[0119]
所述数据获取模块用于从数据源中获取预定历史周期内多个企业的企业数据,所述企业数据划分为待预测变量和历史输入变量;
[0120]
所述样本数据集构建模块用于利用所述企业数据,构建样本数据集,将所述样本数据集划分为训练数据集、验证数据集和测试数据集;
[0121]
所述矩阵计算模块用于获取待预测月份前t个月各企业的历史输入变量,所述历史输入变量包括16种产值能耗信息,并对每个企业的所属行业和用能类型进行编码,根据所得到的编码,计算邻接矩阵m和权重矩阵w;
[0122]
所述预测模型构建模块用于构建基于图卷积神经网络的预测模型,并将所述邻接矩阵m和权重矩阵w输入所述图卷积神经网络的预测模型中;
[0123]
所述模型训练模块用于采用所述训练数据集中的样本对所述预测模型进行训练,并采用所述验证数据集验证所述预测模型的精度,直至采用测试数据集测试输出的预测结果满足精度要求;
[0124]
所述预测模块用于采用所述预测模型进行企业能耗预测。
[0125]
本发明实施例该装置中各模块实现其功能的具体步骤与本发明第一个实施例所提供的方法相同,在此不再赘述。
[0126]
综上所述,本发明涉及一种基于图神经网络的企业能耗预测方法及装置,通过获取历史数据构建样本数据集,并根据每个企业的所属行业和用能类型计算邻接矩阵m和权重矩阵w,以构建基于图神经网络的预测模块。本发明提供的技术方案,针对现有技术的缺点,不仅考虑历史能耗数据与未来预测结果的时序变化关系,同时考虑到企业能耗类型和行业信息,以此计算邻接矩阵m和权重矩阵w来构建图神经网络,从而提高了预测精度,通过提供一个更加灵活的预测框架,既可以从更细的尺度预测单个企业的能耗情况,也可以得到不同行业或不同区域的能耗预测结果。
[0127]
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
技术特征:
1.一种基于图神经网络的企业能耗预测方法,其特征在于,包括:s1、从数据源中获取预定历史周期内多个企业的企业数据,所述企业数据划分为待预测变量和历史输入变量;s2、利用所述企业数据,构建样本数据集,将所述样本数据集划分为训练数据集、验证数据集和测试数据集;s3、获取待预测月份前t个月各企业的历史输入变量,利用其中每个企业的所属行业和用能类型计算邻接矩阵m和权重矩阵w;s4、构建基于图卷积神经网络的预测模型,并将所述邻接矩阵m和权重矩阵w输入所述图卷积神经网络的预测模型中;s5、采用所述训练数据集中的样本对所述预测模型进行训练,并采用所述验证数据集验证所述预测模型的精度,直至采用测试数据集测试输出的预测结果满足精度要求;s6、采用所述预测模型进行企业能耗预测。2.根据权利要求1所述的方法,其特征在于,所述步骤s1还包括:将各变量转换为近似正态分布,并计算各个变量对数转换后的均值μ和标准差σ。3.根据权利要求2所述的方法,其特征在于,所述构建样本数据集,包括:s21、获取待预测月份前t个月各企业的历史输入变量,所述历史输入变量包括16种产值能耗信息,并对每个企业的所属行业和用能类型进行编码;根据所得到的编码,计算邻接矩阵m和权重矩阵w;s22、获取待预测月份前预定月数各企业的历史输入变量,以得到单个样本的输入特征x,该输入特征x的维度为n
×
t
×
c
i
;其中,n为企业数量,t为历史月数,c
i
为输入特征数量;s23、获取待预测月份的待预测变量,得到单个样本的标签y,该标签y的维度为n
×
c
o
,c
o
为输出特征数量;s24、对所述输入特征x和标签y进行标准化处理;s25、遍历所述预定历史周期中所有的历史月份,重复所述步骤s21-s24,得到所述样本数据集的所有样本,所述样本的数据结构包括邻接矩阵m、权重矩阵w、输入特征x和标签y。4.根据权利要求3所述的方法,其特征在于,所述步骤s24中,对所述输入特征x和标签y进行标准化处理,包括:其中,y为标准化前的值,v
′
为标准化后的值。5.根据权利要求3所述的方法,其特征在于,所述利用所述历史输入变量计算邻接矩阵m和权重矩阵w,包括:所述历史输入变量包括16种产值能耗信息,对每个企业的所属行业和用能类型进行编码,根据所得到的编码,计算邻接矩阵m和权重矩阵w。6.根据权利要求5所述的方法,其特征在于:所述计算邻接矩阵m,包括:s311、计算两个企业间的jaccard距离d
j
(i,j):
其中,a
i
和a
j
为企业i和企业j的编码;s312、遍历所有企业,计算两两之间的jaccard距离,得到距离矩阵d,该距离矩阵d的维度为n
×
n,n为企业数量;s313、针对距离矩阵d中的元素d
ij
,i≤n,j≤n;若d
ij
>d
th
,则m
ij
=0;若d
ij
≤d
th
,则m
ij
=1;从而得到邻接矩阵m,其中,d
th
为预设距离阈值,m
ij
为邻接矩阵m中的元素。7.根据权利要求5所述的方法,其特征在于,所述计算权重矩阵w,包括:针对所述邻接矩阵m中的元素m
ij
,若m
ij
=1,则采用高斯核函数计算权重值w
ij
:若m
ij
=0,则w
ij
=0;从而得到权重矩阵w,其中,w
ij
为权重矩阵w中的元素。8.根据权利要求1所述的方法,其特征在于,所述图卷积神经网络的预测模型包括输入层、隐藏层和输出层;所述输入层的节点为企业,边连接包括所述邻接矩阵m,边权重包括所述权重矩阵w。9.根据权利要求1所述的方法,其特征在于,所述预测结果满足精度要求,包括:采用决定系数r2、求和百分比误差error作为精度评价指标:、求和百分比误差error作为精度评价指标:其中,m为样本数量,yi为真实值,为预测值,为真实值的均值。10.一种基于图神经网络的企业能耗预测装置,其特征在于,包括数据获取模块、样本数据集构建模块、矩阵计算模块、预测模型构建模块、模型训练模块、以及预测模块;其中,所述数据获取模块用于从数据源中获取预定历史周期内多个企业的企业数据,所述企业数据划分为待预测变量和历史输入变量;所述样本数据集构建模块用于利用所述企业数据,构建样本数据集,将所述样本数据集划分为训练数据集、验证数据集和测试数据集;所述矩阵计算模块用于获取待预测月份前t个月各企业的历史输入变量,所述历史输入变量包括16种产值能耗信息,并对每个企业的所属行业和用能类型进行编码,根据所得到的编码,计算邻接矩阵m和权重矩阵w;所述预测模型构建模块用于构建基于图卷积神经网络的预测模型,并将所述邻接矩阵m和权重矩阵w输入所述图卷积神经网络的预测模型中;所述模型训练模块用于采用所述训练数据集中的样本对所述预测模型进行训练,并采用所述验证数据集验证所述预测模型的精度,直至采用测试数据集测试输出的预测结果满足精度要求;
所述预测模块用于采用所述预测模型进行企业能耗预测。
技术总结
本发明涉及一种基于图神经网络的企业能耗预测方法及装置,通过获取历史数据构建样本数据集,并根据每个企业的所属行业和用能类型计算邻接矩阵M和权重矩阵W,以构建基于图神经网络的预测模块。本发明提供的技术方案,针对现有技术的缺点,不仅考虑历史能耗数据与未来预测结果的时序变化关系,同时考虑到企业能耗类型和行业信息,以此计算邻接矩阵M和权重矩阵W来构建图神经网络,从而提高了预测精度,通过提供一个更加灵活的预测框架,既可以从更细的尺度预测单个企业的能耗情况,也可以得到不同行业或不同区域的能耗预测结果。同行业或不同区域的能耗预测结果。同行业或不同区域的能耗预测结果。
技术研发人员:王鑫磊 左欣 徐崇斌 吴俣 孙晓敏 陈前 杨勇
受保护的技术使用者:北京航天创智科技有限公司
技术研发日:2021.12.03
技术公布日:2022/3/8