1.本技术涉及数据分析领域,尤其涉及一种数据处理方法、装置、计算机设备及存储介质。
背景技术:
2.目前,各种广告投放方式层出不穷,如电视广告、短视频广告以及纸质广告等,企业可以通过各种广告投放方式提高企业的总体效益,但企业无法获取各个广告投放方式在一定时间段的收益信息,即无法获取各个广告投放方式对应的投资效益。基于此,如何便捷地获取各个广告投放方式的投资效益信息成为一个研究热点。
技术实现要素:
3.本技术实施例提供了一种数据处理方法、装置、计算机设备及存储介质,可以通过目标数据集构建的决策树,方便快捷地获取各个广告投放方式的投资效益信息。
4.一方面,本技术实施例提供了一种数据处理方法,所述方法包括:
5.获取目标数据集,所述目标数据集包括h个时间段对应的数据,每个时间段对应的数据包括j个广告投放方式在所述每个时间段的收益信息,以及各个广告投放方式在所述每个时间段的投资信息,j为大于1的整数,h为大于1的整数,所述收益信息用于指示所述j个广告投放方式在所述每个时间段的收益额度,所述投资信息用于指示所述各个广告投放方式在所述每个时间段的投资额度;
6.调用目标数据处理模型对所述目标数据集进行处理,以构建m个决策树,m为正整数;
7.基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式的投资效益信息,所述投资效益信息用于表征所述各个广告投放方式在单位投资额度下,所述各个广告投放方式产生的效益度。
8.另一方面,本技术实施例提供了一种数据处理装置,所述装置包括:
9.获取单元,用于获取目标数据集,所述目标数据集包括h个时间段对应的数据,每个时间段对应的数据包括j个广告投放方式在所述每个时间段的收益信息,以及各个广告投放方式在所述每个时间段的投资信息,j为大于1的整数,h为大于1的整数,所述收益信息用于指示所述j个广告投放方式在所述每个时间段的收益额度,所述投资信息用于指示所述各个广告投放方式在所述每个时间段的投资额度;
10.构建单元,用于调用目标数据处理模型对所述目标数据集进行处理,以构建m个决策树,m为正整数;
11.确定单元,用于基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式的投资效益信息,所述投资效益信息用于表征所述各个广告投放方式在单位投资额度下,所述各个广告投放方式产生的效益度。
12.再一方面,本技术实施例提供了一种计算机程序产品,所述计算机程序产品包括
计算机程序,所述计算机程序被处理器执行时实现如下步骤:
13.获取目标数据集,所述目标数据集包括h个时间段对应的数据,每个时间段对应的数据包括j个广告投放方式在所述每个时间段的收益信息,以及各个广告投放方式在所述每个时间段的投资信息,j为大于1的整数,h为大于1的整数,所述收益信息用于指示所述j个广告投放方式在所述每个时间段的收益额度,所述投资信息用于指示所述各个广告投放方式在所述每个时间段的投资额度;
14.调用目标数据处理模型对所述目标数据集进行处理,以构建m个决策树,m为正整数;
15.基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式的投资效益信息,所述投资效益信息用于表征所述各个广告投放方式在单位投资额度下,所述各个广告投放方式产生的效益度。
16.再一方面,本技术实施例提供了一种计算机设备,所述计算机设备包括处理器、存储器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时实现如下步骤:
17.获取目标数据集,所述目标数据集包括h个时间段对应的数据,每个时间段对应的数据包括j个广告投放方式在所述每个时间段的收益信息,以及各个广告投放方式在所述每个时间段的投资信息,j为大于1的整数,h为大于1的整数,所述收益信息用于指示所述j个广告投放方式在所述每个时间段的收益额度,所述投资信息用于指示所述各个广告投放方式在所述每个时间段的投资额度;
18.调用目标数据处理模型对所述目标数据集进行处理,以构建m个决策树,m为正整数;
19.基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式的投资效益信息,所述投资效益信息用于表征所述各个广告投放方式在单位投资额度下,所述各个广告投放方式产生的效益度。
20.再一方面,本技术实施例提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序适于由处理器加载并执行如下步骤:
21.获取目标数据集,所述目标数据集包括h个时间段对应的数据,每个时间段对应的数据包括j个广告投放方式在所述每个时间段的收益信息,以及各个广告投放方式在所述每个时间段的投资信息,j为大于1的整数,h为大于1的整数,所述收益信息用于指示所述j个广告投放方式在所述每个时间段的收益额度,所述投资信息用于指示所述各个广告投放方式在所述每个时间段的投资额度;
22.调用目标数据处理模型对所述目标数据集进行处理,以构建m个决策树,m为正整数;
23.基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式的投资效益信息,所述投资效益信息用于表征所述各个广告投放方式在单位投资额度下,所述各个广告投放方式产生的效益度。
24.本技术实施例可以获取目标数据集,该目标数据集包括h个时间段对应的数据,每个时间段对应的数据包括j个广告投放方式在每个时间段的收益信息,以及各个广告投放方式在每个时间段的投资信息;调用目标数据处理模型对目标数据集进行处理,以构建m个
决策树,便于后续计算各个广告投放方式在每个决策树中的重要度;基于各个广告投放方式在每个决策树中的重要度,确定各个广告投放方式的投资效益信息。可见,本技术实施例可通过构建的决策树,方便快捷地获取各个广告投放方式的投资效益信息,也就是说,可以便捷地对各个广告投放方式在单位投资额度下,各个广告投放方式产生的效益度进行分析;基于此,可便于用户更好地分配资源,实现资源的精准投放,从而提高总体收益。
附图说明
25.为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
26.图1a为本技术实施例提供的一种数据处理方案的流程示意图;
27.图1b为本技术实施例提供的一种广告投放方式对应图形的示意图;
28.图2为本技术实施例提供的一种数据处理方法的流程示意图;
29.图3为本技术实施例提供的一种决策树的结构示意图;
30.图4为本技术实施例提供的另一种数据处理方法的流程示意图;
31.图5为本技术实施例提供的另一种广告投放方式对应图形的示意图;
32.图6为本技术实施例提供的一种数据处理装置的结构示意图;
33.图7为本技术实施例提供的一种计算机设备的结构示意图。
具体实施方式
34.下面将结合本技术实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
35.在本技术中,涉及决策树技术;所谓的决策树(decision tree)是在已知各种情况发生概率的基础上,通过构建决策树来求取净现值的期望值大于或等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。基于决策树技术,本技术实施例提出一种数据处理方案,以方便快捷地获取各个广告投放方式的投资效益信息,也就是说,可以有效地对各个广告投放方式的投资信息和收益信息之间的比值关系进行分析,从而便于用户更好地选取广告投放方式,以获取更高的投资效益。在具体实现中,该数据处理方案可由一个计算机设备执行,该计算机设备可以是终端或者服务器;此处所提及的终端可以包括但不限于:智能手机、平板电脑、笔记本电脑、台式计算机、智能手表、智能电视、智能车载终端等;终端内可运行各式各样的客户端(application,app),如视频播放客户端、社交客户端、浏览器客户端、信息流客户端、教育客户端,等等。此处所提及的服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器,等等。
36.需要说明的是,在其他实施例中,该数据处理方案也可由服务器和终端共同执行;服务器和终端通过网络(如有线网络、无线网络等)连接,对此不作限定。并且,本技术实施例所提及的计算机设备可以位于区块链网络外,也可以位于区块链网络内,对此不作限定;
所谓的区块链网络是一种由点对点网络(p2p网络)和区块链所构成的网络,而区块链则是指一种分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式,其本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块(或称为区块)。
37.参见图1a所示,本技术实施例所提出的数据处理方案的大致原理如下:
38.①
计算机设备可以获取多个数据。需要说明的是,获取到的任一数据包括多个广告投放方式中各个广告投放方式在同一时间段的投资信息,以及该多个广告投放方式在相应时间段的收益信息。可以理解的是,此处的收益信息指的是:在相应时间段的总体收益。
39.②
采用获取到的多个数据构建一个或多个决策树。具体的,计算机设备可以在构建决策树的过程中,确定各个决策树中每个目标节点的平方损失减少值,所谓的目标节点可以指的是具有子节点的节点。
40.③
基于各个决策树中每个目标节点对应的平方损失减少值,计算各个广告投放方式的投资效益信息。
41.④
确定各个广告投放方式的投资效益信息对应的图形,并对各个广告投放方式的投资效益信息对应的图形进行显示。举例来说,如图1b所示,假设上述多个广告投放方式包括方式a、方式b以及方式c,那么计算机设备在获取各个广告投放方式的投资效益信息后,可以根据各个广告投放方式的投资效益信息,确定各个广告投放方式的投资效益信息对应的图形,并对各个广告投放方式的投资效益信息对应的图形进行显示。需要说明的是,图1b仅示例性的对各个广告投放方式的投资效益信息对应的图形进行显示,如各个广告投放方式的投资效益信息对应的图形还可以为散点图,本技术对此不作限定。
42.经实践表明,本技术实施例提出的数据处理方案可至少具有如下几点有益效果:
43.第一点:采用获取到的多个数据构建一个或多个决策树,从而基于构建的决策树,方便快捷地获取各个广告投放方式的投资效益信息;第二点:可通过对各个广告投放方式对应图形的显示,直观地表示各个广告投放方式的投资效益信息,便于用户直观地掌握各个广告投放方式的投资效益信息,以及各个广告投放方式的投资效益信息之间的对比结果。
44.基于上述数据处理方案的相关描述,本技术实施例提出一种数据处理方法,该数据处理方法可以由上述所提及到的计算机设备执行,该计算机设备可以是终端或者服务器;或者,该数据处理方法可由终端和服务器共同执行。为便于阐述,后续均以计算机设备执行该数据处理方法为例进行说明;请参见图2,该数据处理方法可包括以下步骤s201-s203:
45.s201,获取目标数据集,目标数据集包括h个时间段对应的数据,每个时间段对应的数据包括j个广告投放方式在每个时间段的收益信息,以及各个广告投放方式在每个时间段的投资信息。
46.其中,h为大于1的整数,j为大于1的整数,上述收益信息用于指示j个广告投放方式在每个时间段的收益额度,上述投资信息用于指示各个广告投放方式在每个时间段的投资额度。可选的,h个时间段中的一个时间段可以是一年,也可以是一个月,本技术对此不作限定。
47.在具体实现中,计算机设备可以根据用户指令从云端下载目标数据集,也可以从
用户提供的移动存储器中获取目标数据集,该移动存储器可以是移动硬盘或者usb闪存盘(usb flash disk)等;计算机设备也可以从自身的存储空间中获取目标数据集,例如当目标数据集存在于计算机设备的只读存储器(read only memory,rom)时,计算机设备可以从该只读存储器中获取目标数据集。
48.可选的,目标数据集中的每个时间段对应的数据可以是目标业务在每个时间段对应的数据,所谓的目标业务可以为业务集中的任一业务,业务集包含一个或多个业务,此处的目标业务在每个时间段对应的数据包括各个广告投放方式在每个时间段用于目标业务的投资信息,以及目标业务在每个时间段的收益信息。目标数据集中的每个时间段对应的数据也可以是多个业务在每个时间段对应的数据,此处的多个业务在每个时间段对应的数据可以包括各个广告投放方式在每个时间段用于上述多个业务的投资信息,以及上述多个任务在每个时间段的收益信息。本技术对此不作限定。
49.相应的,计算机设备可以采用目标业务在每个时间段对应的数据,获取各个广告投放方式在目标业务下的投资效益信息;也可以采用多个业务在每个时间段对应的数据,获取各个广告投放方式在多个业务下的投资效益信息。
50.s202,调用目标数据处理模型对目标数据集进行处理,以构建m个决策树。
51.其中,m为正整数。需要说明的是,m的取值可以是600,也可以是650等,本技术对此不作限定。
52.可选的,计算机设备调用目标数据处理模型对目标数据集进行处理可以指的是采用cart(classification and regression tree,分类回归树)算法对目标数据集进行决策树构建,也可以指的是采用随机树算法对目标数据集进行决策树构建;也就是说,计算机设备调用目标数据处理模型对目标数据集进行处理得到的决策树可以是分类回归树,也可以是随机树,本技术对此不作限定。进一步的,在构建每个决策树的过程中,计算机设备可以将mse(mean squared error,均方误差)或mae(mean absolute error,平均绝对误差)等作为选择划分特征和划分点的依据;换句话说,计算机设备在每次对决策树中的节点进行划分时,可以确定目标划分特征和目标划分点,并根据目标划分特征和目标划分点进行节点划分;其中,目标划分特征和目标划分点可以是使得节点划分后均方误差最小的划分特征和划分点,或者是使得节点划分后平均绝对误差最小的划分特征和划分点,等等。
53.在一种实施方式中,在构建第m个决策树时,计算机设备可以对目标数据集进行采样处理,得到目标数据子集,该目标数据子集包括目标数据集中的多个时间段对应的数据,m∈[1,m];并调用目标数据处理模型对目标数据子集进行处理,以构建第m个决策树。可以理解的是,在对各个决策树进行构建的过程中,计算机设备均需对目标数据集进行采样处理,即分别从目标数据集中选取多个时间段对应的数据组成各个决策树对应的目标数据子集;也就是说,不同决策树对应的目标数据子集可以不同。可选的,计算机设备可以在目标数据集中进行随机采样,即在目标数据集中随机选取多个时间段对应的数据组成目标数据子集;也可以按序选取多个时间段对应的数据组成目标数据子集,本技术对此不作限定。
[0054]
例如,如图3所示,假设m的取值为2,那么计算机设备可以在目标数据集中选取w个时间段对应的数据组成第一个决策树(即决策树a)对应的目标数据子集,并采用决策树a对应的目标数据子集构建决策树a,w为大于1的整数;相应的,计算机设备可以在目标数据集中选取e个时间段对应的数据组成第二个决策树(即决策树b)对应的目标数据子集,并采用
决策树b对应的目标数据子集构建决策树b,e为大于1的整数。需要说明的是,w的取值可以等于e的取值,也可以不等于e的取值;也就是说,不同决策树对应的目标数据子集中数据的数量可以相同,也可以不同,本技术对此不作限定。
[0055]
需要说明的是,一个决策树对应一个弱学习器。进一步的,在构建第m个决策树时,计算机设备可以确定第m个决策树对应的弱学习器,并采用第m个决策树对应的弱学习器对相应的目标数据子集进行训练。需要说明的是,第m个决策树对应的弱学习器可以指的是:第m个决策树的类型。例如,计算机设备可以将分类回归树作为第m个决策树对应的弱学习器,那么计算机设备可以按照分类回归树对第m个决策树对应的目标数据子集进行训练,从而得到第m个决策树;也就是说,计算机设备可以采用分类回归树算法对第m个决策树对应的目标数据子集进行训练,得到第m个决策树,此处的第m个决策树的类型为分类回归树。又如,计算机设备可以将随机树作为第m个决策树对应的弱学习器,那么计算机设备可以按照随机树对第m个决策树对应的目标数据子集进行训练,从而得到第m个决策树,也就是说,计算机设备可以采用随机树算法对第m个决策树对应的目标数据子集进行训练,得到第m个决策树,此处的第m个决策树的类型为随机树。
[0056]
s203,基于各个广告投放方式在每个决策树中的重要度,确定各个广告投放方式的投资效益信息。
[0057]
其中,投资效益信息可以用于表征各个广告投放方式在单位投资额度下,各个广告投放方式产生的效益度;可以理解的是,在相同的投资额度下,任一广告投放方式的投资效益信息越大,该任一广告投放方式所带来的收益越多,即该任一广告投放方式产生的效益度越大。相应的,各个广告投放方式在每个决策树中的重要度可以用于指示:各个广告投放方式对应每个决策树的投资效益信息。
[0058]
在一种实施方式中,计算机设备基于各个广告投放方式在每个决策树中的重要度,确定各个广告投放方式的投资效益信息之前,计算机设备还可以确定第j个广告投放方式在第m个决策树的每个目标节点中的重要度,目标节点为第m个决策树中包含子节点的节点,m∈[1,m],j∈[1,j];对第j个广告投放方式在每个目标节点中的重要度进行求和运算,得到第j个广告投放方式在第m个决策树中的重要度。需要说明的是,目标节点可以指的是:具有子节点的节点。
[0059]
需要说明的是,计算机设备可以采用公式1.1,计算第j个广告投放方式在第m个决策树中的重要度:
[0060][0061]
其中,q为第m个决策树中包括的非叶子节点的数量,即上述第m个决策树包括的目标节点的数量为q,iq为第j个广告投放方式在第m个决策树的第q个目标节点中的重要度,q为正整数,q∈[1,q]。
[0062]
进一步的,计算机设备确定第j个广告投放方式在第m个决策树的每个目标节点中的重要度的具体实施过程可以包括:若第q个目标节点与第j个广告投放方式具有关联关系,确定第j个广告投放方式在第q个目标节点中的重要度为第q个目标节点分裂后的平方损失减少值,q∈[1,q];若第q个目标节点与第j个广告投放方式未具有关联关系,确定第j个广告投放方式在第q个目标节点中的重要度为零。需要说明的是,此处的第q个目标节点
与第j个广告投放方式具有关联关系可以指的是:第q个目标节点的划分特征为第j个广告投放方式对应的特征,即计算机设备按照第j个广告投放方式对应的特征对第q个目标节点中的数据进行划分。
[0063]
举例来说,如图3所示,假设m的取值为1,即第m个决策树为决策树a,那么第m个决策树包括目标节点a
11
和目标节点a
21
,即q的取值为2。假设目标节点a
11
(即q的取值为1时的目标节点)的划分特征为第v个广告投放方式对应的特征,且目标节点a
21
(即q的取值为2时的目标节点)的划分特征为第j个广告投放方式对应的特征,v∈[1,j],v的取值不等于j的取值,那么第j个广告投放方式在目标节点a
11
中的重要度为零,第j个广告投放方式在目标节点a
21
中的重要度为目标节点a
21
分裂后的平方损失减少值。需要说明的是,目标节点a
21
分裂后的平方损失减少值可以指的是:目标节点a
21
中包括的数据对应的平方损失值,与子节点a
31
中包括的数据对应的平方损失值以及子节点a
32
中包括的数据对应的平方损失值之间的差值;换句话说,计算机设备在确定目标节点a
21
分裂后的平方损失减少值时,可将目标节点a
21
中包括的数据对应的平方损失值减去子节点a
31
中包括的数据对应的平方损失值,并减去子节点a
32
中包括的数据对应的平方损失值,以得到目标节点a
21
分裂后的平方损失减少值。
[0064]
在一种实施方式中,计算机设备可以将第j个广告投放方式在各个决策树中的重要度的均值作为第j个广告投放方式的投资效益信息,即计算机设备可以采用公式1.2,计算第j个广告投放方式的投资效益信息:
[0065][0066]
其中,m为构建的决策树的数量,δj(tm)为第j个广告投放方式在第m个决策树中的重要度。
[0067]
进一步的,计算机设备在获取到各个广告投放方式的投资效益信息后,计算机设备可以采用echarts可视化工具、flot可视化工具等,对各个广告投放方式的投资效益信息进行显示。
[0068]
具体的,计算机设备可以确定目标显示方式,目标显示方式包括如下至少一种:显示形状、显示颜色或显示尺寸;按照目标显示方式对各个广告投放方式的投资效益信息进行图形映射处理,得到目标显示界面,目标显示界面包括各个广告投放方式的投资效益信息对应的图形;并显示目标显示界面。示例性的,上述显示形状可以是指的是柱状图,也可以指的是饼状图,等等。本技术对目标显示方式的具体内容不作限定。
[0069]
本技术实施例可以获取目标数据集,该目标数据集包括h个时间段对应的数据,每个时间段对应的数据包括j个广告投放方式在每个时间段的收益信息,以及各个广告投放方式在每个时间段的投资信息;调用目标数据处理模型对目标数据集进行处理,以构建m个决策树,便于后续计算各个广告投放方式在每个决策树中的重要度;基于各个广告投放方式在每个决策树中的重要度,确定各个广告投放方式的投资效益信息。可见,本技术实施例可通过构建的决策树,方便快捷地获取各个广告投放方式的投资效益信息,也就是说,可以便捷地对各个广告投放方式在单位投资额度下,各个广告投放方式产生的效益度进行分析;基于此,可便于用户更好地分配资源,实现资源的精准投放,从而提高总体收益。
[0070]
请参见图4,为本技术实施例提供的另一种数据处理方法的流程示意图。该数据处
理方法可以由上述所提及的计算机设备执行,该计算机设备可以是终端或者服务器;或者,该数据处理方法可由终端和服务器共同执行。为了便于阐述,后续均以计算机设备执行该数据处理方法为例进行说明;请参见图4,该数据处理方法可包括以下步骤s401-s403:
[0071]
s401,获取目标数据集,目标数据集包括h个时间段对应的数据,每个时间段对应的数据包括j个广告投放方式在每个时间段的收益信息,以及各个广告投放方式在每个时间段的投资信息。
[0072]
其中,j为大于1的整数,h为大于1的整数,上述收益信息用于指示j个广告投放方式在每个时间段的收益额度,上述投资信息用于指示各个广告投放方式在每个时间段的投资额度。
[0073]
s402,调用目标数据处理模型对目标数据集进行处理,以构建m个决策树。
[0074]
其中,m为正整数。
[0075]
在一种实施方式中,每个决策树是通过目标数据处理模型得到的,计算机设备可以确定多个模型参数组,该多个模型参数组中的每个模型参数组包含数据处理模型的一个或多个模型参数;调用采用每个模型参数组中的模型参数的数据处理模型,对训练数据集进行数据处理,以确定目标数据处理模型,目标数据处理模型采用的模型参数为最优的模型参数组中的模型参数。
[0076]
可选的,上述训练数据集可以是任一开源数据集,也可以是目标数据集中的任一数据子集,本技术对此不作限定。上述数据处理模型可以指的是基于adaboost(adaptive boosting,自适应增强)算法的模型,也可以指的是基于gbdt(gradient boosting decision tree,梯度提升决策树)算法的模型等,本技术对此不作限定。
[0077]
需要说明的是,每个模型参数组包括但不限于:弱学习器的最大迭代次数(即m的取值)、每个弱学习器的权重缩减系数、损失函数、决策树最大深度,等等。例如,假设每个模型参数组包括弱学习器的最大迭代次数、每个弱学习器的权重缩减系数、损失函数、划分决策树时考虑的最大特征数、决策树的最大深度以及节点再划分所需的最小样本数,那么计算机设备可以确定最优的模型参数组,且最优的模型参数组可以包括:弱学习器的最大迭代为600、每个弱学习器的权重缩减系数为0.4、损失函数为对数似然损失函数、划分决策树时考虑的最大特征数为none、决策树的最大深度为3以及节点再划分所需的最小样本数为2。需要说明的是,最优的模型参数组中的各个模型参数的取值也可为其他取值,本技术对最优的模型参数组所包含的模型参数的数量,以及最优的模型参数组中各个模型参数的具体取值不作限定。可以理解的是,最优的模型参数组为上述多个模型参数组中的任一模型参数组,那么计算机设备在不同的多个模型参数组中确定最优的模型参数组时,最优的模型参数组可以不同,即最优的模型参数组中的各个模型参数的取值可以发生变化。
[0078]
可以理解的是,计算机设备可以采用网格寻优法对每个模型参数组进行参数分析,以选取最优的模型参数组。示例性的,假设每个模型参数组包含弱学习器的最大迭代次数,且上述多个模型参数组的数量为3,包含的最大迭代次数分别为500、600、700,那么计算机设备可以调用最大迭代次数为500的数据处理模型对训练数据进行数据处理、调用最大迭代次数为600的数据处理模型对训练数据进行数据处理、调用最大迭代次数为700的数据处理模型对训练数据进行数据处理,若最大迭代次数为600的数据处理模型对应的数据处理结果最优,则将最大迭代次数为600的数据处理模型作为目标数据处理模型,即最大迭代
次数为600的模型参数组为最优的模型参数组。
[0079]
进一步的,计算机设备确定多个模型参数组的具体实施过程可以包括:确定n个模型参数中的每个模型参数的一个或多个取值,n为正整数;对每个模型参数的各个取值进行排列组合,将排列组合结果作为上述多个模型参数组。
[0080]
示例性的,假设n的取值为2,且一个模型参数的取值包含a和b,另一个模型参数的取值包含c和d,那么计算机设备对每个模型参数的各个取值进行排列组合,得到排列组合结果,此处的排列组合结果包括(a,c)、(a,d)、(b,c)以及(b,d),并将排列组合结果作为上述多个模型参数组,即上述多个模型参数组包括(a,c)、(a,d)、(b,c)以及(b,d)。
[0081]
s403,基于各个广告投放方式在每个决策树中的重要度,确定各个广告投放方式在目标时间段的投资效益信息。
[0082]
其中,上述目标时间段为第h个时间段,h∈[1,h],上述投资效益信息用于表征各个广告投放方式在单位投资额度下,各个广告投放方式在目标时间段产生的效益度。可以理解的是,计算机设备可以确定各个广告投放方式在h个时间段中每个时间段的投资效益信息。
[0083]
在一种实施方式中,计算机设备基于各个广告投放方式在每个决策树中的重要度,确定各个广告投放方式在目标时间段的投资效益信息的具体实施过程可以包括:确定第h个时间段对应的数据所指示的各个广告投放方式在每个决策树中的重要度;基于第h个时间段对应的数据所指示的各个广告投放方式在每个决策树中的重要度,确定各个广告投放方式在第h个时间段的投资效益信息。需要说明的是,第j个广告投放方式在第h个时间段的投资效益信息可以指的是:第h个时间段对应的数据所指示的第j个广告投放方式在每个决策树中的重要度的均值。
[0084]
在此种情况下,计算机设备确定第h个时间段对应的数据所指示的各个广告投放方式在每个决策树中的重要度的具体实施方式可以包括:确定第h个时间段对应的数据所指示的第j个广告投放方式在第m个决策树的每个目标节点中的重要度,m∈[1,m],j∈[1,j];对第h个时间段对应的数据所指示的第j个广告投放方式在第m个决策树的每个目标节点中的重要度进行求和运算,得到第h个时间段对应的数据所指示的第j个广告投放方式在第m个决策树中的重要度。
[0085]
需要说明的是,第m个决策树包含q个目标节点,q为正整数;计算机设备确定第h个时间段对应的数据所指示的第j个广告投放方式在第m个决策树的每个目标节点中的重要度的具体实施过程可以包括:若第h个时间段对应的数据所指示的第j个广告投放方式与第m个决策树的第q个目标节点具有关联关系,则确定第h个时间段对应的数据所指示的第j个广告投放方式在第q个目标节点中的重要度为第q个目标节点分裂后的平方损失减少值,q∈[1,q];若第h个时间段对应的数据所指示的第j个广告投放方式与第m个决策树的第q个目标节点未具有关联关系,则确定第h个时间段对应的数据所指示的第j个决策树在第q个目标节点中的重要度为零。
[0086]
进一步的,上述第h个时间段对应的数据所指示的第j个广告投放方式与第m个决策树的第q个目标节点具有关联关系可以指的是:第m个决策树的第q个目标节点的划分特征为第j个广告投放方式对应的特征,且第q个目标节点的划分点为第h个时间段对应的数据所指示的第j个广告投放方式的投资信息;也可以指的是:第m个决策树的第q个目标节点
的划分特征为第j个广告投放方式对应的特征,且第q个目标节点的划分点距离第h个时间段对应的数据所指示的第j个广告投放方式的投资信息最近(即第q个目标节点的划分点与第h个时间段对应的数据所指示的第j个广告投放方式的投资信息之间的差值最小),等等。
[0087]
另一种实施方式中,在基于各个广告投放方式在每个决策树中的重要度,确定各个广告投放方式在目标时间段的投资效益信息之前,假设目标时间段为第h个时间段,那么计算机设备可以在h个时间段对应的数据中选取l个时间段对应的数据,l个时间段包括第h个时间段以及第h个时间段之前的至少一个时间段,l大于1的整数;生成目标数据集,目标数据集包括l个时间段对应的数据。
[0088]
可以理解的是,计算机设备可以将目标时间段对应的数据以及目标时间段之间的至少一个时间段对应的数据作为目标数据集,从而确定各个广告投放方式在目标时间段的投资效益信息。举例来说,假设目标时间段为2020年,那么目标数据集可以包含2020年对应的数据(即2020年各个广告投放方式的投资信息以及2020年的收益信息)、2019年对应的数据(即2019年各个广告投放方式的投资信息以及2019年的收益信息),也可以包含2020年对应的数据、2018年对应的数据、2005年对应的数据等。本技术对l的取值,以及l个时间段的具体确定方式不作限定。
[0089]
进一步的,计算机设备在获取到各个广告投放方式在目标时间段的投资效益信息后,可以采用echarts可视化工具、flot可视化工具等,对各个广告投放方式在目标时间段的投资效益信息进行显示。
[0090]
具体的,计算机设备可以确定目标显示方式,目标显示方式包括如下至少一种:显示形状、显示颜色或显示尺寸;按照目标显示方式对各个广告投放方式在目标时间段的投资效益信息进行图形映射处理,得到目标显示界面,目标显示界面包括各个广告投放方式在目标时间段的投资效益信息对应的图形;并显示目标显示界面。举例来说,上述显示形状可以指的是柱状图,也就是说,计算机设备可以按照柱状图的形状对各个广告投放方式在目标时间段的投资效益信息进行显示;上述显示形状也可以指的是饼状图,也就是说,计算机设备可以按照饼状图的形状对各个广告投放方式在目标时间段的投资效益信息进行显示,等等。
[0091]
例如,如图5所示,假设j个广告投放方式包括方式a、方式b、方式c、方式d、方式e以及方式f,且目标时间段分别为2020年和2021年,也就是说,计算机设备可以分别获取到各个广告投放方式在2020年的投资效益信息,以及各个广告投放方式在2021年的投资效益信息。假设目标显示方式包括显示形状和显示颜色,且显示形状为柱状图,显示颜色包括各个广告投放方式在2020年的投资效益信息对应的显示颜色为黑色,以及各个广告投放方式在2021年的投资效益信息对应的显示颜色为白色;那么计算机设备可以按照目标显示方式将各个广告投放方式在2020年的投资效益信息进行图形映射处理,并对各个广告投放方式在2021年的投资效益信息进行图形映射处理,得到目标显示界面501。进一步的,计算机设备可以显示目标显示界面501。可以理解的是,图5仅示例性的对各个广告投放方式在目标时间段的投资效益信息进行显示,如计算机设备还可以将各个广告投放方式在2020年的投资效益信息对应的图形显示为白色,并将各个广告投放方式在2021年的投资效益信息对应的图形显示为黑色等,本技术对各个广告投放方式在目标时间段的投资效益信息的具体显示方式不作限定。
[0092]
需要说明的是,计算机设备可以直接将各个广告投放方式在目标时间段的投资效益信息显示在相应的信息显示区域,也可以在检测到用户的投资效益信息显示操作时,对投资效益信息显示操作所指示的投资效益信息进行显示。可选的上述投资效益信息显示操作可以指的是用户执行的点击操作,也可以指的是用户执行的滑动操作等,本技术对此不作限定。
[0093]
例如,如图5所示,假设投资效益信息显示操作所指示的投资效益信息为方式c在2020年的投资效益信息以及方式c在2021年的投资效益信息,那么计算机设备可以对方式c在2020年的投资效益信息和方式c在2021年的投资效益信息进行显示。假设方式c对应的目标显示区域为显示区域502,那么计算机设备可以将方式c在2020年的投资效益信息显示在目标显示界面501的显示区域502中,并将方式c在2021年的投资效益信息显示在目标显示界面501的显示区域502中。
[0094]
本技术实施例可以获取目标数据集,并调用目标数据处理模型对目标数据集进行处理,以构建m个决策树,以便于后续计算目标时间段对应的数据所指示的各个广告投放方式在每个决策树中的重要度;在确定目标时间段对应的数据所指示的各个广告投放方式在每个决策树中的重要度之后,可基于目标时间段对应的数据所指示的各个广告投放方式在每个决策树中的重要度,确定各个广告投放方式在目标时间段的投资效益信息,以便于用户根据各个广告投放方式在目标时间段的投资效益信息,更加细致地掌握各个广告投放方式在目标时间段的投资效益信息,从而便于用户对后续的广告投放计划进行优化,以获取更高的效益。可从多个模型参数组中选取最优的模型参数组,得到目标数据处理模型,并调用目标数据处理模型对目标数据集进行处理,以提高数据模型的准确性,从而得到较优的m个决策树。还可按照目标显示方式,对各个广告投放方式在目标时间段的投资效益信息进行映射处理,得到目标显示界面,并对目标显示界面进行显示,以直观地表示各个广告投放方式在目标时间段的投资效益信息,从而便于用户直观地观测到各个广告投放方式在目标时间段的投资效益信息之间的对比结果。
[0095]
基于上述数据处理方法的相关实施例的描述,本技术实施例还提出了一种数据处理装置,该数据处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码)。该数据处理装置可以执行图2或图4所示的数据处理方法;请参见图6,所述数据处理装置可以运行如下单元:
[0096]
获取单元601,用于获取目标数据集,所述目标数据集包括h个时间段对应的数据,每个时间段对应的数据包括j个广告投放方式在所述每个时间段的收益信息,以及各个广告投放方式在所述每个时间段的投资信息,j为大于1的整数,h为大于1的整数,所述收益信息用于指示所述j个广告投放方式在所述每个时间段的收益额度,所述投资信息用于指示所述各个广告投放方式在所述每个时间段的投资额度;
[0097]
构建单元602,用于调用目标数据处理模型对所述目标数据集进行处理,以构建m个决策树,m为正整数;
[0098]
确定单元603,用于基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式的投资效益信息,所述投资效益信息用于表征所述各个广告投放方式在单位投资额度下,所述各个广告投放方式产生的效益度。
[0099]
在一种实施方式中,确定单元603在基于所述各个广告投放方式在每个决策树中
的重要度,确定所述各个广告投放方式的投资效益信息之前,还可用于:
[0100]
确定第j个广告投放方式在第m个决策树的每个目标节点中的重要度,所述目标节点为所述第m个决策树中包含子节点的节点,m∈[1,m],j∈[1,j];
[0101]
对所述第j个广告投放方式在所述每个目标节点中的重要度进行求和运算,得到所述第j个广告投放方式在所述第m个决策树中的重要度。
[0102]
另一种实施方式中,第m个决策树包含q个目标节点,q为正整数;确定单元603在确定第j个广告投放方式在第m个决策树的每个目标节点中的重要度时,可具体用于:
[0103]
若第q个目标节点与所述第j个广告投放方式具有关联关系,确定所述第j个广告投放方式在所述第q个目标节点中的重要度为所述第q个目标节点分裂后的平方损失减少值,q∈[1,q];
[0104]
若所述第q个目标节点与所述第j个广告投放方式未具有关联关系,确定所述第j个广告投放方式在所述第q个目标节点中的重要度为零。
[0105]
另一种实施方式中,确定单元603在基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式的投资效益信息时,可具体用于:
[0106]
基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式在目标时间段的投资效益信息,所述目标时间段为第h个时间段,h∈[1,h]。
[0107]
另一种实施方式中,确定单元603在基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式在目标时间段的投资效益信息时,可具体用于:
[0108]
确定第h个时间段对应的数据所指示的各个广告投放方式在所述每个决策树中的重要度;
[0109]
基于所述第h个时间段对应的数据所指示的各个广告投放方式在所述每个决策树中的重要度,确定所述各个广告投放方式在所述第h个时间段的投资效益信息。
[0110]
另一种实施方式中,获取单元601在获取目标数据集,所述目标数据集包括h个时间段对应的数据时,可具体用于:
[0111]
在h个时间段对应的数据中选取l个时间段对应的数据,所述l个时间段包括所述第h个时间段以及所述第h个时间段之前的至少一个时间段,l为大于1的整数;
[0112]
生成所述目标数据集,所述目标数据集包括所述l个时间段对应的数据。
[0113]
另一种实施方式中,数据处理装置还包括显示单元604;确定单元603还可用于:
[0114]
确定目标显示方式,所述目标显示方式包括如下至少一种:显示形状、显示颜色或显示尺寸;
[0115]
按照所述目标显示方式对所述各个广告投放方式的投资效益信息进行图形映射处理,得到目标显示界面,所述目标显示界面包括所述各个广告投放方式的投资效益信息对应的图形;
[0116]
显示单元604用于显示所述目标显示界面。
[0117]
另一种实施方式中,构建单元602在调用目标数据处理模型对所述目标数据集进行处理,以构建m个决策树时,可具体用于:
[0118]
在构建第m个决策树时,对所述目标数据集进行采样处理,得到目标数据子集,所述目标数据子集包括所述目标数据集中的多个时间段对应的数据,m∈[1,m];
[0119]
调用所述目标数据处理模型对所述目标数据子集进行处理,以构建所述第m个决
策树。
[0120]
另一种实施方式中,确定单元603还可用于:
[0121]
确定多个模型参数组,所述多个模型参数组中的每个模型参数组包含数据处理模型的一个或多个模型参数;
[0122]
调用采用所述每个模型参数组中的模型参数的数据处理模型,对训练数据集进行数据处理,以确定目标数据处理模型,所述目标数据处理模型采用的模型参数为最优的模型参数组中的模型参数。
[0123]
根据本技术的一个实施例,图2或图4所示的方法所涉及的各个步骤均可以由图6所示的数据处理装置中的各个单元来执行的。例如,图2中所示的步骤s201可由图6中所示的获取单元601执行,步骤s202可由图6中所示的构建单元602执行,步骤s203可由图6中所示的确定单元603执行。又如,图4中所示的步骤s401可由图6中所示的获取单元601执行,步骤s402可由图6中所示的构建单元602执行,步骤s403可由图6中所示的确定单元603执行,等等。
[0124]
根据本技术的另一个实施例,图6所示的数据处理装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本技术实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本技术的其它实施例中,基于数据处理装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
[0125]
根据本技术的另一个实施例,可以通过在包括中央处理单元(cpu)、随机存取存储介质(ram)、只读存储介质(rom)等处理元件和存储元件的例如计算机的通用计算设备上运行能够执行如图2或图4中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图6中所示的数据处理装置,以及来实现本技术实施例的数据处理方法。所述计算机程序可以记载于例如计算机存储介质上,并通过计算机存储介质装载于上述计算设备中,并在其中运行。
[0126]
本技术实施例可以获取目标数据集,该目标数据集包括h个时间段对应的数据,每个时间段对应的数据包括j个广告投放方式在每个时间段的收益信息,以及各个广告投放方式在每个时间段的投资信息;调用目标数据处理模型对目标数据集进行处理,以构建m个决策树,便于后续计算各个广告投放方式在每个决策树中的重要度;基于各个广告投放方式在每个决策树中的重要度,确定各个广告投放方式的投资效益信息。可见,本技术实施例可通过构建的决策树,方便快捷地获取各个广告投放方式的投资效益信息,也就是说,可以便捷地对各个广告投放方式在单位投资额度下,各个广告投放方式产生的效益度进行分析;基于此,可便于用户更好地分配资源,实现资源的精准投放,从而提高总体收益。
[0127]
基于上述方法实施例以及装置实施例的描述,本技术实施例还提供一种计算机设备。请参见图7,该计算机设备至少包括处理器701、输入接口702、输出接口703以及计算机存储介质704。其中,计算机设备内的处理器701、输入接口702、输出接口703以及计算机存储介质704可通过总线或其他方式连接。
[0128]
计算机存储介质704可以存储在计算机设备的存储器中,所述计算机存储介质704
用于存储计算机程序,所述计算机程序包括程序指令,所述处理器701用于执行所述计算机存储介质704存储的程序指令。处理器701(或称cpu(central processing unit,中央处理器))是计算机设备的计算核心以及控制核心,其适于实现计算机程序,具体适于加载并执行计算机程序从而实现相应方法流程或相应功能;在一个实施例中,本技术实施例所述的处理器701可以用于进行一系列的数据处理,具体包括:获取目标数据集,所述目标数据集包括h个时间段对应的数据,每个时间段对应的数据包括j个广告投放方式在所述每个时间段的收益信息,以及各个广告投放方式在所述每个时间段的投资信息,j为大于1的整数,h为大于1的整数,所述收益信息用于指示所述j个广告投放方式在所述每个时间段的收益额度,所述投资信息用于指示所述各个广告投放方式在所述每个时间段的投资额度;调用目标数据处理模型对所述目标数据集进行处理,以构建m个决策树,m为正整数;基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式的投资效益信息,所述投资效益信息用于表征所述各个广告投放方式在单位投资额度下,所述各个广告投放方式产生的效益度,等等。
[0129]
本技术实施例还提供了一种计算机存储介质(memory),所述计算机存储介质是计算机设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机存储介质既可以包括计算机设备中的内置存储介质,当然也可以包括计算机设备所支持的扩展存储介质。计算机存储介质提供存储空间,该存储空间存储了计算机设备的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的计算机程序,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机存储介质可以是高速ram存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器;可选的,还可以是至少一个位于远离前述处理器的计算机存储介质。在一个实施例中,可由处理器加载并执行计算机存储介质中存放的计算机程序,以实现上述有关图2或图4所示的数据处理方法的实施例中的各个方法步骤。
[0130]
本技术实施例可以获取目标数据集,该目标数据集包括h个时间段对应的数据,每个时间段对应的数据包括j个广告投放方式在每个时间段的收益信息,以及各个广告投放方式在每个时间段的投资信息;调用目标数据处理模型对目标数据集进行处理,以构建m个决策树,便于后续计算各个广告投放方式在每个决策树中的重要度;基于各个广告投放方式在每个决策树中的重要度,确定各个广告投放方式的投资效益信息。可见,本技术实施例可通过构建的决策树,方便快捷地获取各个广告投放方式的投资效益信息,也就是说,可以便捷地对各个广告投放方式在单位投资额度下,各个广告投放方式产生的效益度进行分析;基于此,可便于用户更好地分配资源,实现资源的精准投放,从而提高总体收益。
[0131]
需要说明的是,根据本技术的一个方面,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述图2或图4所示的数据处理方法实施例方面的各种可选方式中提供的方法。
[0132]
并且,应理解的是,以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
技术特征:
1.一种数据处理方法,其特征在于,包括:获取目标数据集,所述目标数据集包括h个时间段对应的数据,每个时间段对应的数据包括j个广告投放方式在所述每个时间段的收益信息,以及各个广告投放方式在所述每个时间段的投资信息,j为大于1的整数,h为大于1的整数,所述收益信息用于指示所述j个广告投放方式在所述每个时间段的收益额度,所述投资信息用于指示所述各个广告投放方式在所述每个时间段的投资额度;调用目标数据处理模型对所述目标数据集进行处理,以构建m个决策树,m为正整数;基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式的投资效益信息,所述投资效益信息用于表征所述各个广告投放方式在单位投资额度下,所述各个广告投放方式产生的效益度。2.根据权利要求1所述的方法,其特征在于,所述基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式的投资效益信息之前,所述方法还包括:确定第j个广告投放方式在第m个决策树的每个目标节点中的重要度,所述目标节点为所述第m个决策树中包含子节点的节点,m∈[1,m],j∈[1,j];对所述第j个广告投放方式在所述每个目标节点中的重要度进行求和运算,得到所述第j个广告投放方式在所述第m个决策树中的重要度。3.根据权利要求2所述的方法,其特征在于,所述第m个决策树包含q个目标节点,q为正整数;所述确定第j个广告投放方式在第m个决策树的每个目标节点中的重要度,包括:若第q个目标节点与所述第j个广告投放方式具有关联关系,确定所述第j个广告投放方式在所述第q个目标节点中的重要度为所述第q个目标节点分裂后的平方损失减少值,q∈[1,q];若所述第q个目标节点与所述第j个广告投放方式未具有关联关系,确定所述第j个广告投放方式在所述第q个目标节点中的重要度为零。4.根据权利要求1所述的方法,其特征在于,所述基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式的投资效益信息,包括:基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式在目标时间段的投资效益信息,所述目标时间段为第h个时间段,h∈[1,h]。5.根据权利要求4所述的方法,其特征在于,所述基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式在目标时间段的投资效益信息,包括:确定第h个时间段对应的数据所指示的各个广告投放方式在所述每个决策树中的重要度;基于所述第h个时间段对应的数据所指示的各个广告投放方式在所述每个决策树中的重要度,确定所述各个广告投放方式在所述第h个时间段的投资效益信息。6.根据权利要求4所述的方法,其特征在于,所述获取目标数据集,所述目标数据集包括h个时间段对应的数据,包括:在h个时间段对应的数据中选取l个时间段对应的数据,所述l个时间段包括所述第h个时间段以及所述第h个时间段之前的至少一个时间段,l为大于1的整数;生成所述目标数据集,所述目标数据集包括所述l个时间段对应的数据。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定目标显示方式,所述目标显示方式包括如下至少一种:显示形状、显示颜色或显示尺寸;按照所述目标显示方式对所述各个广告投放方式的投资效益信息进行图形映射处理,得到目标显示界面,所述目标显示界面包括所述各个广告投放方式的投资效益信息对应的图形;显示所述目标显示界面。8.根据权利要求1所述的方法,其特征在于,所述调用目标数据处理模型对所述目标数据集进行处理,以构建m个决策树,包括:在构建第m个决策树时,对所述目标数据集进行采样处理,得到目标数据子集,所述目标数据子集包括所述目标数据集中的多个时间段对应的数据,m∈[1,m];调用所述目标数据处理模型对所述目标数据子集进行处理,以构建所述第m个决策树。9.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定多个模型参数组,所述多个模型参数组中的每个模型参数组包含数据处理模型的一个或多个模型参数;调用采用所述每个模型参数组中的模型参数的数据处理模型,对训练数据集进行数据处理,以确定目标数据处理模型,所述目标数据处理模型采用的模型参数为最优的模型参数组中的模型参数。10.一种数据处理装置,其特征在于,包括:获取单元,用于获取目标数据集,所述目标数据集包括h个时间段对应的数据,每个时间段对应的数据包括j个广告投放方式在所述每个时间段的收益信息,以及各个广告投放方式在所述每个时间段的投资信息,j为大于1的整数,h为大于1的整数,所述收益信息用于指示所述j个广告投放方式在所述每个时间段的收益额度,所述投资信息用于指示所述各个广告投放方式在所述每个时间段的投资额度;构建单元,用于调用目标数据处理模型对所述目标数据集进行处理,以构建m个决策树,m为正整数;确定单元,用于基于所述各个广告投放方式在每个决策树中的重要度,确定所述各个广告投放方式的投资效益信息,所述投资效益信息用于表征所述各个广告投放方式在单位投资额度下,所述各个广告投放方式产生的效益度。11.一种计算机设备,其特征在于,包括:存储器、处理器,其中,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现如权利要求1至9中任一项所述的方法。12.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至9中任一项所述的方法。
技术总结
本发明实施例公开了一种数据处理方法、装置、计算机设备及存储介质,其中数据处理方法包括:获取目标数据集,目标数据集包括H个时间段对应的数据,每个时间段对应的数据包括J个广告投放方式在所述每个时间段的收益信息,以及各个广告投放方式在所述每个时间段的投资信息;调用目标数据处理模型对所述目标数据集进行处理,以构建M个决策树;基于各个广告投放方式在每个决策树中的重要度,确定各个广告投放方式的投资效益信息。本申请实施例可以便捷地获取各个广告投放方式的投资效益信息。地获取各个广告投放方式的投资效益信息。地获取各个广告投放方式的投资效益信息。
技术研发人员:严杨扬
受保护的技术使用者:中国平安财产保险股份有限公司
技术研发日:2021.11.30
技术公布日:2022/3/8