线路运输货量预测方法、装置、设备及介质与流程

专利查询2023-10-24  96



1.本技术实施例涉及数据处理领域,尤其涉及一种线路运输货量预测方法、装置、设备及介质。


背景技术:

2.在物流货运领域,通常采用经验预估法、监控系统预报数据、时间序列预测方法及机器学习方法,预测物流线路和对应物流线路上的运输货量。但是,经验预估法严重依赖人工经验,人力成本较高,并且人工预估准确率较低。监控系统预报数据是使用静态路由的方法生成的,没有考虑实际的动态因素,而物流货量在实际运输过程中,往往会受到交通、天气、人为等因素的影响,导致运输货量的实际到达时间、出发时间、运输量与静态路由计算的结果不一致,进而导致运力预报数据准确率较低,难以满足实际预测需求。时间序列预测方法及机器学习方法主要是将线路的历史运输货量作为输入,进行预测,但由于没有充分利用现有的运力监控及预报数据,预测准确率难以提升。


技术实现要素:

3.本技术实施例提供了一种线路运输货量预测方法、装置、设备及介质,能够在充分利用监控系统预报的线路上的运输货量的基础上,结合基于回归模型预测的线路上的运输货量,综合确定线路上的货量预测结果,可以有效提高预测的准确率,进而为运营人员提供有效的参考信息。
4.第一方面,本技术实施例还提供了一种线路运输货量预测方法,该方法包括:
5.获取线路第一历史时间内每天的运输货量、所述线路的属性信息和所述线路的预报运输货量;
6.根据所述运输货量、所述属性信息、所述预报运输货量以及训练后的回归模型确定所述线路的预测运输货量;
7.根据所述预报运输货量和所述预测运输货量确定所述线路的运输货量预测结果。
8.第二方面,本技术实施例还提供了一种线路运输货量预测装置,该装置包括:
9.获取模块,用于获取线路第一历史时间内每天的运输货量、所述线路的属性信息和所述线路的预报运输货量;
10.确定模块,用于根据所述运输货量、所述属性信息、所述预报运输货量以及训练后的回归模型确定所述线路的预测运输货量;
11.所述确定模块,用于根据所述预报运输货量和所述预测运输货量确定所述线路的运输货量预测结果。
12.第三方面,本技术实施例还提供了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,当处理器执行计算机程序时,实现如本技术任意实施例提供的线路运输货量预测方法。
13.第四方面,本技术实施例还提供了一种计算机可读存储介质,其上存储有计算机
程序,该计算机程序被处理器执行时,实现如本技术任意实施例提供的线路运输货量预测方法。
14.本技术实施例提供了一种线路运输货量预测方法、装置、设备及介质,该方法包括:获取线路第一历史时间内每天的运输货量、线路的属性信息和线路的预报运输货量;根据运输货量、属性信息、预报运输货量以及训练后的回归模型确定线路的预测运输货量;根据预报运输货量和预测运输货量确定线路的货量预测结果。这样在充分利用监控系统预报的运输货量的基础上,结合基于回归模型预测的运输货量,可以综合确定线路上的运输货量预测结果,可以有效提高预测的准确率,进而为运营人员提供有效的参考信息。
附图说明
15.图1为本技术实施例中的一种线路运输货量预测方法的流程图;
16.图2是本技术实施例中的确定训练后的回归模型的方法流程图;
17.图3是本技术实施例中的滑动时间窗口的示意图;
18.图4是本技术实施例中的一种线路运输货量预测装置的结构示意图;
19.图5是本技术实施例中的另一种线路运输货量预测装置的结构示意图;
20.图6是本技术实施例中的计算机设备的结构示意图。
具体实施方式
21.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本技术,而非对本技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本技术相关的部分而非全部结构。
22.另外,在本技术实施例中,“可选地”或者“示例性地”等词用于表示作例子、例证或说明。本技术实施例中被描述为“可选地”或者“示例性地”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“可选地”或者“示例性地”等词旨在以具体方式呈现相关概念。
23.图1为本技术实施例提供的一种线路运输货量预测方法的流程图,该方法可以应用于陆运、水运、空运等物流运输场景下,基于各场景下任一线路的预报运输货量和预测运输货量,综合确定该线路上最终运输货量的预测结果,可以有效提高线路上运输货量的预测准确率。如图1所示,该方法可以包括但不限于以下步骤:
24.s101、获取线路第一历史时间内每天的运输货量、线路的属性信息和线路的预报运输货量。
25.本技术实施例中的线路即为物流运输领域中货物运输的线路,该线路可以为多条线路。进一步地,在陆运、水运、空运不同场景下,该线路还可以理解为陆运线路(例如,高速公路、铁路等)、水运航线线路、空运航线线路等。线路上第一历史时间内每天的运输货量可以理解为在前一段时间(例如,前一周或前一个月)内,该条线路上每天的实际运输货量。例如,以line01线路和line02线路为例,表1为在第一历史时间内,这两条线路上每天的运输货量。
26.表1
[0027][0028][0029]
线路的属性信息可以包括线路的标识(identity,id)、线路类型(例如,该条线路为支线还是干线)、该条线路的始发城市、目的城市、始发区域等等,示例性地,线路的属性信息可以如表2所示。
[0030]
表2
[0031]
线路id线路类型始发城市目的城市

始发区域line01干线北京广州

华北区line02支线北京天津

华北区
………………
line100干线哈尔滨武汉

东北区
[0032]
线路的预报运输货量可以通过监控系统实时预报获取,比如,在陆运物流场景下,可以通过陆运运力监控系统实时预报获取,或者在空运物流场景下,可以通过空运领域中的运力监控系统进行实时预报获取。例如,预报时间为提前24小时或提前48小时,可以以每小时为单位提前预报不同时间点上该线路的预报运输货量。比如,该条线路上提前1小时的预报运输货量、提前2小时的预报运输货量
……
。示例性地,以陆运物流场景下的line01线路为例,该条线路上的基于陆运运力监控系统预报的预报运输货量如表3所示。
[0033]
表3
[0034][0035][0036]
s102、根据运输货量、属性信息、预报运输货量以及训练后的回归模型确定线路的预测运输货量。
[0037]
示例性地,本步骤的实现方式可以包括根据运输货量、属性信息和第一滑动时间窗口确定线路的特征工程矩阵,并根据运输货量和预报运输货量确定线路的标签值,进而根据特征工程矩阵和标签值以及训练后的回归模型确定线路的预测运输货量。
[0038]
s103、根据预报运输货量和预测运输货量确定线路的运输货量预测结果。
[0039]
基于训练后的回归模型得到线路的预测运输货量后,将该预测运输货量与预报运输货量相加,将得到的两者的和确定为线路的运输货量预测结果。
[0040]
本技术实施例提供了一种线路运输货量预测方法,该方法包括:获取线路第一历史时间内每天的运输货量、线路的属性信息和线路的预报运输货量;根据运输货量、属性信息、预报运输货量以及训练后的回归模型确定线路的预测运输货量;根据预报运输货量和
预测运输货量确定线路的运输货量预测结果。这样在充分利用监控系统预报的线路的运输货量的基础上,结合基于回归模型预测的对应线路的预测运输货量,综合确定线路上的货量预测结果,可以有效提高预测的准确率,进而为运营人员提供有效的参考信息。
[0041]
如图2所示,在一种示例中,获取上述步骤s102中训练后的回归模型的实现方式可以包括但不限于以下方式:
[0042]
s201、获取线路第二历史时间内每天的运输货量、线路的历史预报运输货量和线路的属性信息。
[0043]
本步骤中的第二历史时间为回归模型训练阶段选取训练样本的时间。例如,假设第二历史时间为3个月,即获取线路上前3个月内每天的运输货量。也就是说,第一历史时间与第二历史时间的区别在于,第一历史时间为回归模型使用阶段选取样本的时间,第二历史时间为回归模型训练阶段选取样本的时间,第一历史时间与第二历史时间的时间长度可以相同,也可以不同,获取的线路第二历史时间内每天的运输货量的形式可以如表1所示。其中,上述样本可以理解为每条线路上每天的运输货量。
[0044]
线路的历史预报运输货量即为监控系统对上述第二历史时间内线路上每天运输货量的预报量,也即预测的上述样本中每条线路每天的运输货量,进一步地,历史预报运输货量的时间粒度可以为小时,例如,提前24小时或48小时,每小时更新线路的预报运输货量。线路的历史预报运输货量的预报记录形式可以如表3所示。
[0045]
线路的属性信息可以应用于回归模型训练阶段,用于结合其他数据进行模型训练,也可以应用于回归模型使用阶段,用于结合其他数据在当前时刻预测后面24小时或48小时线路上的预测运输货量。
[0046]
s202、根据线路第二历史时间内每天的运输货量和线路的历史预报运输货量确定线路的标签值。
[0047]
示例性地,本步骤中确定线路标签值的方式可以包括在线路第二历史时间内每天的运输货量中减去线路的历史预报运输货量,将得到的差值确定为线路当前的标签值。例如,以监控系统提前48小时预报线路上的预报运输货量为例,如表4所示,将线路第二历史时间内每天的实际运输货量减去该线路上提前1到48小时的预报运输货量,即为该线路对应的标签值。其中,标签值为正数,表示预报运输货量比线路第二历史时间内每天的实际运输货量少,标签值为负数,表示预报运输货量比线路第二历史时间内每天的实际运输货量少。每条线路每天可以有多个标签用于模型训练,如表4所示,line0线路有48个标签值可以用于回归模型训练。
[0048]
表4
[0049][0050][0051]
需要说明的是,上述表1中仅示出了line01线路上每天提前1到48小时的标签值,该表中还可以包含其他线路上每天提前1到48小时的标签值。
[0052]
可选地,在步骤s102中根据第一历史时间内每天的运输货量和线路的预报运输货量确定线路的标签值,也可以采用上述方式。即在第一历史时间内每天的运输货量中减去线路的预报运输货量,将得到的差值确定为线路当前的标签值。
[0053]
s203、根据线路第二历史时间内每天的运输货量和线路的属性信息确定线路的特征工程矩阵。
[0054]
示例性地,本步骤的实现方式可以包括基于第二滑动时间窗口提取线路第二历史时间内每天的运输货量的特征值,如图3所示。第二滑动时间窗口由当前时间向后滑动,提取的特征值可以包括第二滑动时间窗内运输货量的均值、最大值、最小值、中位数等等。可选地,第二滑动时间窗的长度可以调整,例如先以某一固定时间长度作为第二滑动时间窗,确定时间窗内各个特征值,再调整该第二滑动时间窗的时间长度,继续确定时间窗内各个特征值。示例性地,以line01线路和line02线路为例,表4为每条线路上不同第二滑动时间窗口内运输货量的特征值。
[0055]
表4
[0056][0057]
将上述基于第二滑动时间窗口得到的线路的特征值与该线路的属性信息合并,即可得到对应线路的特征工程矩阵。
[0058]
相应地,步骤s102中根据运输货量、属性信息和第一滑动时间窗口确定线路的特
征工程矩阵的实现方式也可以采用上述同样的方式,即基于第一滑动时间窗口提取线路第一历史时间内每天的运输货量的特征值;将特征值与属性信息合并,得到线路的特征工程矩阵。
[0059]
可以理解的是,上述第一滑动时间窗口用于在回归模型使用阶段提取第一历史时间内线路上每天的运输货量的特征值,第二滑动时间窗口用于在回归模型训练阶段提取第二历史时间内线路上每天的运输货量的特征值。可选地,第一滑动时间窗口与第二滑动时间窗口的时间长度可以相同,也可以不同。
[0060]
s204、根据标签值和特征工程矩阵训练回归模型,得到训练后的回归模型。
[0061]
基于上述步骤得到训练样本的标签值和特征工程训练矩阵后,将其输入至回归模型中进行训练,不断优化模型参数。示例性地,本技术实施例中采用的回归模型可以包括xgboost模型、lightgbm模型、线性回归模型等。基于训练样本训练得到优化后的模型参数,将训练后的回归模型存储至服务器中,用于后期预测线路的预测运输货量。
[0062]
在本技术实施例中,将线路上历史每天的实际运输货量和线路上监控系统预报的运输货量的差值作为标签值,并结合对应线路上的属性信息进行模型预测,进一步地,将模型预测的结果与监控系统预报的结果相加,可以充分利用监控系统针对线路上的实时预报数据和模型针对线路上的预测数据,从而有效提高线路上运输货量的预测准确率。通过线下实验表明,本技术实施例提供的方法比直接预测线路运输货量的准确率高10%以上,并且可以实现以小时粒度为对象进行实时预测。
[0063]
图4为本技术实施例提供的一种线路运输货量预测装置的结构示意图,如图4所示,该装置可以包括:获取模块401、确定模块402;
[0064]
其中,获取模块,用于获取线路第一历史时间内每天的运输货量、线路的属性信息和线路的预报运输货量;
[0065]
确定模块,用于根据运输货量、属性信息、预报运输货量以及训练后的回归模型确定线路的预测运输货量;
[0066]
确定模块,用于根据预报运输货量和预测运输货量确定线路的运输货量预测结果。
[0067]
在一种示例中,确定模块,用于根据运输货量、属性信息和第一滑动时间窗口确定线路的特征工程矩阵;根据运输货量和预报运输货量确定线路的标签值;以及,根据特征工程矩阵和标签值以及训练后的回归模型确定线路的预测运输货量。
[0068]
如图5所示,在一种示例中,上述装置还可以包括训练模块403;
[0069]
该训练模块可以包括获取单元和确定单元;
[0070]
其中,获取单元,用于获取线路第二历史时间内每天的运输货量、线路的历史预报运输货量和线路的属性信息;
[0071]
确定单元,用于根据线路第二历史时间内每天的运输货量和线路的历史预报运输货量确定线路的标签值;
[0072]
确定单元,还用于根据线路第二历史时间内每天的运输货量和线路的属性信息确定线路的特征工程矩阵;以及,根据标签值和特征工程矩阵训练回归模型,得到训练后的回归模型。
[0073]
进一步地,确定单元,还用于在线路第二历史时间内每天的运输货量中减去线路
的历史预报运输货量,将得到的差值确定为线路当前的标签值;以及,基于第二滑动时间窗口提取线路第二历史时间内每天的运输货量的特征值,将特征值与线路的属性信息合并,得到线路的特征工程矩阵。
[0074]
在一种示例中,上述确定模块,用于在线路第一历史时间内每天的运输货量中减去线路的预报运输货量,将得到的差值确定线路当前的标签值;
[0075]
在一种示例中,上述确定模块,用于基于第一滑动时间窗口提取线路第一历史时间内每天的运输货量的特征值;并将特征值与属性信息合并,得到线路的特征工程矩阵。
[0076]
在一种示例中,确定模块,用于将预报运输货量和预测运输货量相加,得到两者的和;并将和确定为线路的运输货量预测结果。
[0077]
上述线路运输货量预测装置可以执行图1-图2所提供的线路运输货量预测方法,具备该方法中相应的器件和有益效果。
[0078]
图6为本发明实施例6提供的一种计算机设备的结构示意图,如图6所示,该计算机设备包括控制器601、存储器602、输入装置603、输出装置604;计算机设备中控制器601的数量可以是一个或多个,图6中以一个控制器601为例;计算机设备中的控制器601、存储器602、输入装置603和输出装置604可以通过总线或其他方式连接,图6中以通过总线连接为例。
[0079]
存储器602作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如图1-图2实施例中的线路运输货量预测方法对应的程序指令/模块(例如,线路运输货量预测装置中的获取模块401、确定模块402)。控制器601通过运行存储在存储器602中的软件程序、指令以及模块,从而执行计算机设备的各种功能以及数据处理,即实现上述的线路运输货量预测方法。
[0080]
存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据计算机的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器602可进一步包括相对于控制器601远程设置的存储器,这些远程存储器可以通过网络连接至终端/服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0081]
输入装置603可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置604可包括显示屏等显示装置。
[0082]
本技术实施例还提供一种包含计算机可执行指令的存储介质,该计算机可执行指令在由计算机控制器执行时用于执行一种线路运输货量预测方法,该方法包括图1、图2所示的步骤。
[0083]
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本技术可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述的方法。
[0084]
值得注意的是,上述线路运输货量预测装置中所包括的模块只是按照功能逻辑进行划分,但并不局限于上述的划分方式,只要能够实现相应的功能即可,不用于限制本技术的保护范围。
[0085]
注意,上述仅为本技术的较佳实施例及所运用技术原理。本领域技术人员会理解,本技术不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本技术的保护范围。因此,虽然通过以上实施例对本技术进行了较为详细的说明,但是本技术不仅仅限于以上实施例,在不脱离本技术构思的情况下,还可以包括更多其他等效实施例,而本技术的范围由所附的权利要求范围决定。

技术特征:
1.一种线路运输货量预测方法,其特征在于,包括:获取线路第一历史时间内每天的运输货量、所述线路的属性信息和所述线路的预报运输货量;根据所述运输货量、所述属性信息、所述预报运输货量以及训练后的回归模型确定所述线路的预测运输货量;根据所述预报运输货量和所述预测运输货量确定所述线路的运输货量预测结果。2.根据权利要求1所述的方法,其特征在于,根据所述运输货量、所述属性信息、所述预报运输货量以及训练后的回归模型确定所述线路的预测运输货量,包括:根据所述运输货量、所述属性信息和第一滑动时间窗口确定所述线路的特征工程矩阵;根据所述运输货量和所述预报运输货量确定所述线路的标签值;根据所述特征工程矩阵和所述标签值以及训练后的回归模型确定所述线路的预测运输货量。3.根据权利要求1所述的方法,其特征在于,确定所述训练后的回归模型,包括:获取线路第二历史时间内每天的运输货量、所述线路的历史预报运输货量和所述线路的属性信息;根据所述线路第二历史时间内每天的运输货量和所述线路的历史预报运输货量确定所述线路的标签值;根据所述线路第二历史时间内每天的运输货量和所述线路的属性信息确定所述线路的特征工程矩阵;根据所述标签值和所述特征工程矩阵训练回归模型,得到训练后的回归模型。4.根据权利要求2或3所述的方法,其特征在于,所述确定所述线路的标签值,包括:在所述线路第一历史时间内每天的运输货量中减去所述线路的预报运输货量,将得到的差值确定所述线路当前的标签值;或者,在所述线路第二历史时间内每天的运输货量中减去所述线路的历史预报运输货量,将得到的差值确定为所述线路当前的标签值。5.根据权利要求2所述的方法,其特征在于,所述确定所述线路的特征工程矩阵,包括:基于第一滑动时间窗口提取所述线路第一历史时间内每天的运输货量的特征值;将所述特征值与所述属性信息合并,得到所述线路的特征工程矩阵。6.根据权利要求3所述的方法,其特征在于,所述确定所述线路的特征工程矩阵,包括:基于第二滑动时间窗口提取所述线路第二历史时间内每天的运输货量的特征值;将所述特征值与所述线路的属性信息合并,得到所述线路的特征工程矩阵。7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述预报运输货量和所述预测运输货量确定所述线路的运输货量预测结果,包括:将所述预报运输货量和所述预测运输货量相加,得到两者的和;将所述和确定为所述线路的运输货量预测结果。8.一种线路运输货量预测装置,其特征在于,包括:获取模块,用于获取线路第一历史时间内每天的运输货量、所述线路的属性信息和所述线路的预报运输货量;
确定模块,用于根据所述运输货量、所述属性信息、所述预报运输货量以及训练后的回归模型确定所述线路的预测运输货量;所述确定模块,用于根据所述预报运输货量和所述预测运输货量确定所述线路的运输货量预测结果。9.一种计算机设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-7任一项所述的线路运输货量预测方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-7任一项所述的线路运输货量预测方法。

技术总结
本申请公开了一种线路运输货量预测方法、装置、设备及介质,该方法包括:获取线路第一历史时间内每天的运输货量、线路的属性信息和线路的预报运输货量;根据运输货量、属性信息、预报运输货量以及训练后的回归模型确定线路的预测运输货量;根据预报运输货量和预测运输货量确定线路的货量预测结果。这样在充分利用监控系统预报的运输货量的基础上,结合基于回归模型预测的运输货量,可以综合确定线路上的货量预测结果,可以有效提高预测的准确率,进而为运营人员提供有效的参考信息。为运营人员提供有效的参考信息。为运营人员提供有效的参考信息。


技术研发人员:王应德 刘祥 庄晓天 吴盛楠
受保护的技术使用者:北京京东振世信息技术有限公司
技术研发日:2021.11.30
技术公布日:2022/3/8

最新回复(0)