本发明涉及地铁交通领域,具体涉及基于优化的改进自适应噪声完备集合经验模态分解(improved-iceemdan)和双向时间卷积网络(bitcn)的乘客流量预测方法(i-iceemdan-bitcn)。
背景技术:
1、城市轨道交通是世界范围内缓解交通拥堵、加快智慧城市发展的有效交通手段。作为城市公共交通的重要组成部分,其乘客流量的精确预测对于提高交通效率、减少拥堵具有重要意义。近年来,无论是发展中国家还是发达国家,地铁的投资和建设都在不断增加,地铁系统的完善方便了乘客出行,从而刺激了乘客量的快速增长。
2、地铁客流的爆炸式增长引发了日常运营一系列问题,如乘客拥挤、服务时间表无效和地铁设施容量不足,并造成了城市公共管理的不平衡。解决这一问题的一种方案是提供前瞻性的客流信息,为运营者在客流控制、换乘站管理、旅客导向服务设计等方面为车站层面提供决策指导。
3、因此,准确的客流客流预测于有效的交通规划以及制定高效的客流管理策略就至关重要。早期的客流预测方法主要是遵循统计原理的参数模型,从数据中推导出未来的客流,包括自回归、季节性自回归综合移动平均线、自回归综合移动平均线等预测方法。虽然在一定程度上能够预测乘客流量,但是这些模型通常要求具有良好的稳定性并适用于线性数据,无法处理数据中复杂的非线性特征,因此通用性不强。与统计理论模型不同,人工智能模型可以更好地处理非线性数据。目前,机器学习模型和深度学习模型得到了广泛地应用。许多研究人员开发了传统的参数模型,机器学习模型,如随机森林和支持向量回归模型,以及后来的深度学习模型,比如递归神经网络(rnn)和卷积神经网络(cnn)。
4、时间卷积网络(tcn)作为cnn的改良,由因果卷积、膨胀卷积以及残差连接组成,通过扩张因果卷积可有效避免未来信息泄露,通过调整卷积核大小、层数、扩张系数等参数扩大感受野,能够捕捉未来时刻与更长历史时刻的依赖关系。因此选择时间卷积网络对未来时间的客流人次进行预测。
5、但是,面对不同类型的复杂数据集,神经网络模型容易受到复杂数据的干扰,降低了预测的准确性。为了提高模型的泛化能力和预测准确度,一种有效的处理策略是将原始数据分解为具有明显特征的多种简单模式,融合神经网络对分解后的分量进行预测并聚合,解决数据集复杂特性的问题。最经典的技术是经验模态分解(emd),其次是其相关的导数技术,如集成emd、互补eemd,以及其他分解技术,包括经验小波变换(ewt)和变分模态分解(vmd)。
6、但是,小波变换和变分模态分解需要对分解的超参数进行设置,如果没有先验知识,很难进行预设。经验模态分解属于自适应迭代分解,但在处理信号时存在频率混叠和模态混合问题,影响了相邻尺度间频率的连续性。
技术实现思路
1、为解决上述技术问题,本发明提供了基于优化的改进自适应噪声完备集合经验模态分解(improved iceemdan)和双向时间卷积网络(bitcn)的乘客流量预测方法(i-iceemdan-bitcn)。能够较好地预测地铁乘客流量未来的变化趋势,提高了乘客流量预测的精度。
2、本发明采取的技术方案为:
3、基于i-iceemdan-bitcn模型的地铁乘客流量的预测方法,包括以下步骤:
4、步骤一:收集客流信息,对数据进行缺失值处理后,使用优化后的iceemdan对数据进行分解,输出最小残差下的分解数据。
5、步骤二:将步骤一中的分解数据归一化后,输入到bitcn模型进行训练,进行特征提取,输出预测结果。
6、步骤三:将步骤二中的得到的数据进行加和,输出成地铁乘客流量预测结果。
7、所述步骤一中,采集地铁站的乘客流量数据,缺失值利用中位数插值进行补充。
8、所述步骤一中,将处理后的数据输入到优化后的改进自适应噪声完备集合经验模态分解模型中,进行多频幅分解。iceemdan是基于emd进行改进的算法,iceemdan通过引入自适应白噪声机制改善了emd在处理信号时出现的频率混叠和模态混合问题,实现了相邻尺度间频率的连续性。不同于传统的傅里叶变换和小波变换,iceemdan采用迭代分解策略,无需预选基函数,从而更适合非线性信号分析。其过程具体如下:
9、1)通过原始序列(地铁客流量)与白噪声序列结合,构造新序列
10、
11、式中:为原始信号,为加入到原始信号中的i组白噪声wi经emd分解后的第一阶模态分量,α0为噪声强度调节系数。
12、2)对新构造的序列应用局部均值运算,计算第一组残差:
13、
14、式中:m(·)表示对序列应用emd算法计算的局部均值。
15、3)从原始信号中减去第一组残差,得到第一个模态函数(imf1)。
16、
17、4)迭代计算残差和模态分量。重复上述过程,对每轮的残差信号添加白噪声,计算新的残差和模态分量,直至完成所有分解:
18、
19、式中:rk为第k组残差,为第k个模态分量。分解过程中的噪声强度调节系数αk用于控制加入白噪声的比例,其确定依赖于信号的特性,可表示为:
20、
21、式中:std为标准差;ε0为首次添加噪声与被分析信号间信噪比的倒数。
22、5)经过分解后,原序列等可以等效为:
23、
24、式中:t为时间变量;为剩余的分解残差。
25、6)对分解后的数据剔除残差信号,保留分解后的分量作为后续模型的输入。
26、所示步骤一中,使用的iceemdan虽然是自适应分解,但是提取噪声的初始阈值是需要手动设置的,好坏关系着分解的质量和时间,过小就是一直失败然后去逼近最大的迭代次数。过大会导致分解不完全,残差包含更多的有效信息。
27、为了提升分解精度,本文设置最小残差为目标函数,通过减法平均的优化算法(sabo)对噪声阈值进行寻优。其过程具体如下:
28、1)设置目标函数,变量,约束条件。变量设置为噪声强度调节系数αk,则αk
29、对应的约束条件可根据序列的大小设置为一个区间。本发明使用iceemdan是为有效分解,设置最小绝对误差(残差)lloss为目标函数。则对应的目标函数公式为:
30、
31、式中:s为序列长度。
32、2)设置sabo种群大小n和迭代次数t。
33、3)随机生成初始代理矩阵:
34、
35、xi,d=lbd+ri,d·(ubd-lbd),i=1,...,n,d=1,...,m (10)
36、式中:是种群矩阵,xi是第i个种群成员,xi,d是其在搜索空间中的第d维决策变量,n是搜索代理的数量,m是决策变量的数量,ri,d是区间[0,1]内的随机数,ubd和lbd分别是第d个决策变量的下限和上限。每个搜索代理是对
37、问题的候选解决方案。
38、4)根据初始搜索代理计算目标函数。
39、5)对于t=1到t;对于i=1到n,计算第i个sabo搜索代理的新的推荐位
40、置
41、
42、式中:是第i个搜索代理xi的新建议位置,n是搜索代理的总数,是一个维度为m的向量,其分量在区间[0,1]内服从正态分布。如果这个新建议的位置导致目标函数值的改善,即比前一个的数值更小,它就被替换,即新的xi。
43、6)更新xi:
44、
45、式中:fi和finew分别是搜索代理xi和的目标函数值。
46、7)结束。保存最优解。结束。
47、8)输出使用sabo获得的最佳准最优解。结束
48、所述步骤二包括如下步骤:
49、s2.1、对步骤一中的分解数据进行批量归一化处理,消除非标准数据对模型精度的影响,其表达式为:
50、
51、式中:xk为的单个数值;xmin为中的最小值;xmax为中的最大值。x*为误差数据归一化后的值。将批量归一化后的数据按照7:3的比例,划分测试集和验证集。测试集用于离线模型的训练,验证集用于验证模型的最终预测效果。
52、s2.2、将s2.1划分的测试集输入到时间序列卷积网络模型的输入层,每个输入层将时间序列对应的地铁客流量数据,作为时间序列卷积网络模型的输入;根据分量的数量k,共建立k个子模型。
53、s2.3、时间卷积网络由残差模块按顺序堆叠组成,向后传播。每一个残差模块由因果卷积、膨胀卷积以及残差连接构成。输入层数据传递到时间序列卷积网络模型的残差块,用于高维特征提取。
54、s2.4、通过因果卷积和膨胀卷积进行特征提取,并在每次卷积计算后进行批归一化处理;使用relu激活函数激活后,向后传播。
55、s2.5、因果卷积允许tcn在每一步只使用当前时刻之前的数据,避免了未来信息的泄露。对s2.4中每两次卷积计算进行一次恒等映射,同时在每次卷积计算是带空洞的因果卷积,在卷积计算之后,为了提高分类准确度,进行批归一化处理,之后使用relu激活函数对得到的值进行激活。tcn采用膨胀因果卷积来提升感受野,对输入序列进行跳步操作以进行卷积运算,其表达式为:
56、
57、式中:cit为对序列中第t个元素的卷积结果;w(i)为卷积核;n为膨胀因子;*为卷积运算符;ker代表卷积核尺寸;xt-n·i对应经过间隔抽样后的输入序列值。并在每个膨胀卷积后引入dropout方法来进行正则化,随机丢弃一部分比例的神经元,以减少过拟合,提高模型的泛化能力。为了能够顺利加和,需要使卷积计算结果和恒等映射的值维度相同,于是在恒等映射的通路上使用1×1的卷积计算,消除残差块连接前的形状张量差异,使两者维度一致。
58、s2.6、输出s2.5时间序列卷积网络模型的残差模块结果,输出h如下所示:
59、h=relu(w1cit+b1) (15)
60、式中,w1和b1为权重矩阵和偏置矩阵。relu表示激活函数。该步骤是一个经过线性变化并通过激活函数映射并输出结果的过程。输入数据经过此类多次卷积操作后,地铁客流量数据中包含的抽象特征被有效提取,且仍可保持各种类数据的内联性,经过多层卷积操作后通过时间序列卷积网络中全卷积层获得与输入维度相同的输出矩阵。
61、s2.7、进一步,更改时间卷积网络为双向处理路径,可以拓展数据量,防止欠拟合。首先,在正向处理的基础上,反转输入的序列x,记作x′。h作为处理路径输出的特征集合,记作使用时间卷积网络同时处理前向和后向的特征集合,用于特征提取和预测。因此,最终的输出公式如下:
62、
63、式中:为后向处理路径输出的特征集合;w2和b2代表对应的权重矩阵和偏置矩阵。本文使用bitcn对输入矩阵进行特征提取,经flatten层对输入张量处理后接全连接层,输出预测结果;代表加和。
64、s2.8、对s2.7的双向时间序列卷积网络模型输出的结果进行累加,得到预测的地铁客流量数据。
65、所述步骤三中,s2.1中的验证集作为输入,输入到训练好的双向时间卷积网络模型,进行分解后乘客流量分量的预测;对分量预测结果进行累加,得到最终的地铁客流量预测结果。
66、为了综合评估模型的效果,通过平均绝对误差(mean absolute error,mae),均方根误差(root mean squared error,rmse),决定系数(r-square,r2)三个评价指标来判断模型的预测效果。三个评价指标来判断模型的预测效果。其判断公式如下:
67、
68、式中:y(t)代表当前时刻的真实输出;y^(t)为模型的预测输出;s代表序列长度,为有限数。
69、本发明基于优化iceemdan-bitcn模型的地铁乘客流量预测方法,技术效果如下:
70、1)本发明基于优化iceemdan-bitcn模型地铁乘客流量预测方法,通过地铁乘客流量数据,实现未来地铁乘客流量的预测。本发明具有较好的适应性,可以实现不同数据情况下地铁乘客流量未来变化的有效趋势。
71、2)本发明提供的时间卷积网络的多层架构设计使得各层均通过不同膨胀系数的残差块堆叠,增强了模型对长序列数据的建模能力并保留关键原始信息。因果卷积该方式允许时间卷积网络在每一步只使用当前时刻之前的数据,避免了未来信息的泄露。膨胀因果卷积的应用使得时间序列卷积网络能够以较少的层数拥有较大的视野范围,提升了时间序列卷积网络接收历史数据的能力。残差网络的引入,将相隔一层或多层的网络层“连接”起来,有效地避免了复杂模型中存在的梯度消失问题。时间序列卷积网络可以输入任意长度的序列,并在输出层输出等长的序列被继续传递至下一单元,其架构可以根据需要调整为任意长度,具有较强的适用性。
72、3)本发明通过修改时间卷积网络为双向处理结构,增加上下文的交互性,增强了实现了从局部到全局的多级特征挖掘,避免了传统模型当误差存在异常时可能会出现上下文的值差距较大的情况,提升了预测精度。同时进一步拓展了数据的长度,避免陷入局部最优的情况。
73、4)本发明针对复杂数据模型参数分解难的问题,提供了一种分解方法。本发明提供了一种分解方法。使用iceemdan在预测前对数据进行前处理,通过分解,强化了模型的学习能力。前置处理增加了模型对不同序列的预测稳定性。
74、5)本发明针在iceemdan的分解基础上优化了分解阈值的选择,使得模型可以针对不同的序列特征可以自适应分解,避免了先验假设造成的解释行差,欠分解,或者过分解的情况,同时提高了分解精度。
1.基于优化的iceemdan和双向时间卷积网络的乘客流量预测方法,其特征在于包括以下步骤:
2.根据权利要求1所述基于优化的iceemdan和双向时间卷积网络的乘客流量预测方法,其特征在于:所述步骤一中,采集地铁站的乘客流量数据,缺失值利用中位数插值进行补充;将处理后的数据输入到优化后的改进自适应噪声完备集合经验模态分解模型中,进行多频幅分解。
3.根据权利要求1所述基于优化的iceemdan和双向时间卷积网络的乘客流量预测方法,其特征在于:所述步骤一中的iceemdan分解过程具体包括:通过原始序列(地铁客流量)与白噪声序列结合,构造新序列,计算局部均值运算,迭代计算残差和模态分量,直到完成所有分解。
4.根据权利要求2所述基于优化的iceemdan和双向时间卷积网络的乘客流量预测方法,其特征在于:所述优化过程如下:设置最小残差为目标函数,通过减法平均的优化算法(sabo)对噪声阈值进行寻优,提升了iceemdan的分解精度。所述优化包括步骤如下:
5.根据权利要求1所述基于优化的iceemdan和双向时间卷积网络的乘客流量预测方法,其特征在于:所述步骤二包括如下步骤:
6.根据权利要求5所述基于优化的iceemdan和双向时间卷积网络的乘客流量预测方法,其特征在于:所述双向时间卷积网络为时间卷积网络对双向路径的处理。在正向处理的基础上,通过反转输入的序列,使用时间卷积网络同时处理前向和后向的特征集合,用于特征提取和预测。
7.根据权利要求1所述基于优化的iceemdan和双向时间卷积网络的乘客流量预测方法,其特征在于:所述步骤三中,s2.1中的验证集作为输入,输入到训练好的双向时间卷积网络模型,进行分解后乘客流量分量的预测;对分量预测结果进行累加,得到最终的地铁客流量预测结果。通过平均绝对误差(mean absolute error,mae),均方根误差(root meansquared error,rmse),决定系数(r-square,r2)三个评价指标来判断模型的预测效果。三个评价指标来判断模型的预测效果。