1.本技术涉及人工智能领域,尤其涉及一种主题预测方法、装置、设备、存储介质及计算机程序产品。
背景技术:
2.随着互联网技术的飞速发展,业务人员可以通过互联网平台开展业务,例如进行产品销售、业务咨询等;在平台用户通过互联网平台向业务人员请求服务时,业务人员通常无法判断出平台用户偏好的业务主题,进而无法为该平台用户提供精准的个性化服务,使得用户体验降低。
技术实现要素:
3.本技术实施例提供一种主题预测方法、装置、设备、存储介质及计算机程序产品,可从预估的目标对象所关注的多个待预测主题中确定出目标对象所偏好的主题,进而可以基于该确定出的目标对象所偏好的主题向目标对象提供个性化服务,可提高对象体验。
4.一方面,本技术实施例提供了一种主题预测方法,包括:
5.通过训练后的主题预测模型,对目标对象的对象特征、所述目标对象所关注的目标产品的物料特征以及预估的所述目标对象所关注的多个待预测主题的主题特征进行特征交互处理,得到所述目标对象对应的目标交互向量;
6.基于所述多个待预测主题的主题特征以及所述目标对象对应的目标交互向量,确定所述多个待预测主题中各个待预测主题的主题预测概率,所述各个待预测主题的主题预测概率指示:预测得到的所述目标对象对所述各个待预测主题的偏好程度;
7.基于所述各个待预测主题的主题预测概率,将所述多个待预测主题中的目标待预测主题确定为所述目标对象所偏好的主题,所述目标待预测主题的主题预测概率大于所述多个待预测主题中除所述目标待预测主题以外的其他待预测主题的主题预测概率。
8.一方面,本技术实施例提供了一种主题预测装置,其特征在于,所述主题预测装置包括获取单元以及处理单元,所述获取单元以及所述处理单元用于执行上述主题预测方法。
9.一方面,本技术实施例提供了一种主题预测设备,其特征在于,所述主题预测设备包括输入接口和输出接口,还包括:
10.处理器,适于实现一条或多条指令;以及,
11.计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由所述处理器加载并执行上述主题预测方法。
12.一方面,本技术实施例提供了一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机程序指令,所述计算机程序指令被处理器执行时,用于执行上述主题预测方法。
13.一方面,本技术实施例提供了一种计算机程序产品或计算机程序,所述计算机程
序产品或所述计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中;主题预测设备的处理器从所述计算机可读存储介质中读取所述计算机指令,所述处理器执行所述计算机指令,所述计算机指令被处理器执行时,用于执行上述主题预测方法。
14.本技术实施例中,主题预测设备可以通过训练后的主题预测模型对目标对象的对象特征、目标对象所关注的目标产品的物料特征以及预估的目标对象所关注的多个待预测主题的主题特征的特征交互处理,确定出多个待预测主题中各个待预测主题的主题预测概率,其中,各个待预测主题的主题预测概率指示:预测得到的目标对象对各个待预测主题的偏好程度;然后基于各个待预测主题的主题预测概率,从多个待预测主题中确定出目标对象所偏好的主题。可以基于对目标对象的对象特征、目标对象所关注的目标产品的物料特征以及预估的目标对象所关注的多个待预测主题的主题特征的特征交互处理,从预估的目标对象所关注的多个待预测主题中确定出目标对象所偏好的主题,进而可以基于该确定出的目标对象所偏好的主题向目标对象提供个性化服务,可提高对象体验。
附图说明
15.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
16.图1是本技术实施例提供的一种主题预测系统的结构示意图;
17.图2是本技术实施例提供的一种主题预测方法的流程示意图;
18.图3是本技术实施例提供的一种训练后的主题预测模型的示意图;
19.图4是本技术实施例提供的一种训练得到训练后的主题预测模型的方法流程示意图;
20.图5是本技术实施例提供的一种基于初始辅助网络以及初始选择注意力机制模块构建的初始网络的示意图;
21.图6是本技术实施例提供的一种主题预测模型的示意图;
22.图7是本技术实施例提供的一种主题预测装置的结构示意图;
23.图8是本技术实施例提供的一种主题预测设备的结构示意图。
具体实施方式
24.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
25.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
26.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
27.本技术实施例主要涉及人工智能领域中的机器学习(machine learning,ml)领域,其专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。本技术实施例基于机器学习中的迁移学习技术,提供了一种主题预测方案,可以通过对主题预测模型进行训练得到的训练后的主题预测模型,对目标对象的对象特征、目标对象所关注的目标产品的物料特征以及预估的目标对象所关注的多个待预测主题的主题特征的特征交互处理,确定出多个待预测主题中各个待预测主题的主题预测概率,其中,各个待预测主题的主题预测概率指示:预测得到的目标对象对各个待预测主题的偏好程度;然后基于各个待预测主题的主题预测概率,从多个待预测主题中确定出目标对象所偏好的主题。
28.上述主题预测方案可以通过主题预测设备执行,其中,该主题预测设备可以包括智能手机、平板电脑、笔记本电脑、台式计算机、智能车载以及智能可穿戴设备中的任意一种或多种;也可以为服务器,例如可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
29.基于上述主题预测方案,本技术实施例提供了一种主题预测系统,参见图1,为本技术实施例提供的一种主题预测系统的结构示意图。图1所示的主题预测系统可以包括主题预测设备101以及一个或多个终端设备102。其中,主题预测设备101可以是服务器,例如可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器;终端设备102可以包括智能手机、平板电脑、笔记本电脑、台式计算机、智能车载以及智能可穿戴设备中的任意一种或多种。主题预测设备101以及终端设备102之间可以通过有线或无线通信方式进行直接或间接地通信连接,本技术在此不做限制。
30.在一个实施例中,终端设备102中运行有目标业务平台;目标业务平台可以为任意业务相关的业务平台,例如可以为与保险业务相关的保险业务平台;目标业务平台可以为提供目标业务的应用所对应的应用平台,也可以为提供同一目标业务的网站所对应的网站平台,也可以为提供同一目标业务的小程序所对应的小程序平台,例如,若目标业务平台为与保险业务相关的保险业务平台,若针对该保险业务开发了保险业务应用、保险业务网站以及保险业务小程序,则该保险业务平台可以为保险业务应用对应的应用平台,可以为保险业务网站对应的网站平台,也可以为保险业务小程序对应的小程序平台。
31.在一个实施例中,主题预测设备101与目标业务平台相对应,为目标业务平台提供服务支持,举例来说,若目标业务平台为与保险业务相关的保险业务平台,则主题预测设备
101为该保险业务平台对应的主题预测设备,为该保险业务平台提供服务支持,又如,若目标业务平台为与游戏业务相关的游戏业务平台,则主题预测设备101为该游戏业务平台对应的主题预测设备,为该游戏业务平台提供服务支持。
32.在一个实施例中,目标对象可以通过其终端设备102与目标业务平台进行交互,即目标对象可以通过其终端设备102使用目标业务平台提供的相应服务;例如,若目标业务平台为与保险业务相关的保险业务平台,则目标对象可以通过其终端设备102进行保险产品的购买,保险知识的学习等。进一步的,目标对象可以通过其终端设备102向目标业务平台中的业务人员请求服务,例如可以通过目标业务平台提供的会话功能向业务人员请求会话服务以用于业务咨询等;目标业务平台中的业务人员可以通过其终端设备102接收目标对象的服务请求,并向目标对象提供相应的服务,例如可以对目标对象的业务咨询进行解答。举例来说,若目标业务平台为与保险业务相关的保险业务平台,则目标对象可以通过其终端设备102向目标业务平台中的业务人员请求会话服务,例如可以向业务人员咨询保险产品的基本情况、保险产品的扣费情况以及保险的理赔流程等;业务人员接收到目标对象的服务请求之后,可以为目标对象提供相应的服务,例如为目标对象进行答疑、向目标对象推荐保险产品等。其中,目标对象为目标业务平台中的任意平台用户。
33.在一个实施例中,在目标对象向业务人员请求服务,业务人员向目标对象提供服务的过程中,为了提高服务质量,业务人员希望能够了解到目标对象所偏好的业务主题;基于此,主题预测设备可以获取目标对象的对象特征、目标对象所关注的目标产品的物料特征以及预估的目标对象所关注的多个待预测主题的主题特征;通过训练后的主题预测模型对目标对象的对象特征、目标产品的物料特征以及多个待预测主题的主题特征的特征交互处理,确定出多个待预测主题中各个待预测主题的主题预测概率,其中,各个待预测主题的主题预测概率指示:预测得到的目标对象对各个待预测主题的偏好程度;然后基于各个待预测主题的主题预测概率,从多个待预测主题中确定出目标对象所偏好的主题;并将目标对象所偏好的主题发送至业务人员的终端设备102中,以使业务人员可以基于该目标对象所偏好的主题向目标对象提供个性化服务,例如向目标对象介绍目标对象所偏好的主题的相关业务。
34.在一个实施例中,主题预测设备101在获取目标对象以及业务人员在目标业务平台中所产生的用户数据之前,例如获取目标对象的对象特征之前,可以向目标对象的终端设备102以及业务人员的终端设备102发送关于获取用户数据的授权协议;当目标对象以及业务人员同意该授权协议时,主题预测设备101才可以获取目标对象以及业务人员在目标业务平台中所产生的用户数据,否则,主题预测设备101并不能获取到目标对象以及业务人员在目标业务平台中所产生的用户数据。
35.基于上述主题预测方案以及主题预测系统,本技术实施例提供了一种主题预测方法。参见图2,为本技术实施例提供的一种主题预测方法的流程示意图。图2所示的主题预测方法可由主题预测设备执行。图2所示的主题预测方法可包括如下步骤:
36.s201,通过训练后的主题预测模型,对目标对象的对象特征、目标对象所关注的目标产品的物料特征以及预估的目标对象所关注的多个待预测主题的主题特征进行特征交互处理,得到目标对象对应的目标交互向量。
37.在一个实施例中,目标对象可以为目标业务平台中的任意平台用户;目标业务平
台可以为任意业务相关的业务平台,例如可以为与保险业务相关的保险业务平台。
38.在一个实施例中,目标对象的对象特征、目标对象所关注的目标产品的物料特征以及预估的目标对象所关注的多个待预测主题的主题特征为向量化处理之后的特征。目标对象的对象特征可以包括对象基础特征,对象基础特征用于描述目标对象的基本情况;例如可以包括用于描述目标对象的性别的性别特征,用于描述目标对象的年龄的年龄特征,用于描述目标对象的常驻城市的常驻城市特征以及用于描述目标对象的号码归属地的号码归属地特征等。进一步的,目标对象的对象特征还可以包括行为偏好特征,行为偏好特征用于描述预设时间段内,目标对象在目标业务平台中产生的用户行为;例如可以包括产品浏览历史特征,产品购买历史特征等。该产品浏览历史特征用于描述预设时间段内目标对象对目标业务平台所提供的产品的浏览情况,例如可以用于描述预设时间段内目标对象所浏览的各个产品的产品标识,预设时间段内目标对象所浏览的各个产品的产品类型,预设时间段内目标对象所浏览的各个产品的浏览次数,预设时间段内目标对象所浏览的各个产品的浏览时长等。该产品购买历史特征用于描述预设时间段内目标对象对目标业务平台所提供的产品的购买情况,例如可以用于描述预设时间段内目标对象所购买的各个产品的产品标识,预设时间段内目标对象所购买的各个产品的产品类型,预设时间段内目标对象所购买的各个产品的购买数量等。其中,预设时间段为主题预测设备获取目标对象的对象特征、目标对象所关注的目标产品的物料特征以及预估的目标对象所关注的多个待预测主题的主题特征之前的任意时长的时间段;可以根据不同的需求对预设时间段进行具体设定,本技术实施例不对预设时间段的开始时间以及结束时间等进行限定。
39.在一个实施例中,目标对象所关注的目标产品指的是目标业务平台所提供的产品中,目标对象感兴趣的产品。目标对象所关注的目标产品的物料特征可以包括目标产品的产品属性特征,产品属性特征用于描述目标产品的产品属性等基本情况;例如可以用于描述目标产品的产品标识,目标产品的产品类型,目标产品的产品价格等。进一步的,目标产品的物料特征还可以包括产品统计特征,产品统计特征用于描述预设时间段内,目标产品的曝光情况;例如可以用于描述预设时间段内目标产品的点击次数,预设时间段内目标产品的点击率等,其中预设时间段内目标产品的点击率指的是:预设时间段内,目标产品的点击次数占目标业务平台所提供的所有产品的点击次数总和的比例。可选的,若目标业务平台为与保险业务相关的保险业务平台,保险业务平台提供保险产品的销售,则目标产品为保险产品,目标产品的产品属性特征还可以用于描述目标产品的保障类型,目标产品的保障期限等;例如目标产品的保障类型为意外险,目标产品的保障期限为1年。
40.在一个实施例中,预估的目标对象所关注的多个待预测主题指的是目标业务平台所提供的业务主题中,预估的目标对象感兴趣的业务主题。待预测主题的主题特征可以包括待预测主题的主题属性特征,主题属性特征用于描述待预测主题的主题属性等基本情况;例如可以用于描述待预测主题的主题标识等。进一步的,待预测主题的主题特征还可以包括主题统计特征,主题统计特征用于描述预设时间段内,待预测主题的曝光情况;例如可以用于描述预设时间段内待预测主题的点击次数,预设时间段内待预测主题的点击率等;其中预设时间段内待预测主题的点击次数指的是:预设时间段内,待预测主题的内容页面入口被点击的次数,预设时间段内待预测主题的点击率指的是:预设时间段内,待预测主题的点击次数占目标业务平台所提供的所有的主题的点击次数总和的比例。进一步的,待预
测主题的主题特征还可以包括个性化统计特征,该个性化统计特征用于描述预设时间段内,待预测主题对目标对象的吸引情况;例如可以用于描述预设时间段内目标对象对待预测主题的点击次数,预设时间段内目标对象对待预测主题的浏览时长,预设时间段内目标对象对待预测主题的提及次数,其中目标对象对待预测主题的提及次数指的是目标对象请求业务人员的会话服务时,在会话过程中所提及待预测主题的次数。可选的,预估的目标对象所关注的多个待预测主题可以是主题预测设备预先从目标业务平台所提供的所有主题中确定出的,例如可以将预设时间段内目标对象所点击的主题确定为预估的目标对象所关注的待预测主题;例如可以将预设时间段内目标对象所点击的的主题中点击次数超过一定次数的主题确定为预估的目标对象所关注的待预测主题;例如可以将预设时间段内目标对象所点击的主题中浏览时长超过一定时长的主题确定为预估的目标对象所关注的待预测主题;例如可以将预设时间段内目标对象所提及的主题确定为预估的目标对象所关注的待预测主题;等等。
41.在一个实施例中,目标对象的对象特征、目标对象所关注的目标产品的物料特征以及预估的目标对象所关注的多个待预测主题的主题特征为向量化处理之后的特征;即目标对象的对象特征、目标产品的物料特征以及多个待预测主题的主题特征均为对原始特征数据进行离散化处理之后得到的特征向量。具体的,对于原始特征数据中的非数值型连续特征数据的离散化处理可以直接进行向量映射处理,例如对目标对象的性别、目标对象的常驻城市、目标对象的号码归属地、产品标识、产品类型以及主题标识等原始特征数据的处理可以是直接进行向量映射处理的;例如,当对目标对象的性别进行向量映射处理时,若向量元素的对应关系分别为{男、女},则可以将性别男处理为{1,0},将性别女处理为{0,1};当对产品标识进行向量映射处理时,若向量元素的对应关系分别为{产品1,产品2,产品3},则可以在产品标识代表产品1时将其处理为{1,0,0},在产品标识代表产品2时将其处理为{0,1,0},在产品标识代表产品3时将其处理为{0,0,1}。
42.对于原始特征数据中的数值型连续特征数据的离散化处理可以先将数值型连续特征数据进行分桶处理,然后再进行向量映射处理,例如对目标对象的年龄、预设时间段内目标对象所浏览的各个产品的浏览次数、预设时间段内目标对象所浏览的各个产品的浏览时长、预设时间段内目标对象所购买的各个产品的购买数量、预设时间段内目标产品的点击次数、预设时间段内目标产品的点击率、预设时间段内待预测主题的点击次数以及预设时间段内待预测主题的点击率等原始特征数据可以是基于该种方式进行离散化处理的。具体实现中,对于数值型连续特征数据的分桶处理可以是基于等距分桶得到的,也可以是基于等频分桶得到的;当基于等频分桶时,可以增强特征的统计显著性,避免等距分桶带来的极大值或极小值敏感的缺陷问题。举例来说,若某数值型连续特征数据属于10段桶的第7段,那么可以采用一个长度为10的向量来对该数值型连续特征数据进行映射,则将该数值型连续特征数据进行向量映射处理为{0,0,0,0,0,0,1,0,0,0}。进一步的,目标对象的对象特征是将向量化处理之后的特征向量进行拼接之后得到的;目标产品的物料特征是将向量化处理之后的特征向量进行拼接之后得到的;多个待预测主题的主题特征是将向量化处理之后的特征向量进行拼接之后得到的;例如若目标产品的产品标识对应向量1,目标产品的产品类型对应向量2,目标产品的产品价格对应向量3,预设时间段内目标产品的点击次数对应向量4,预设时间段内目标产品的点击率对应向量5,则目标产品的物料特征表示为{向
量1,向量2,向量3,向量4,向量5}。
43.在一个实施例中,训练后的主题预测模型可以用于从预估的目标对象所关注的多个待预测主题中预测目标对象所偏好的主题,训练后的主题预测模型是基于训练后的辅助网络、训练后的选择注意力机制模块以及训练后的主题网络构建的。其中,训练后的辅助网络用于提取目标对象的辅助特征,以使训练后的主题网络能够基于辅助特征辅助预测目标对象所偏好的主题,本技术实施例中从目标对象所关注的目标产品的物料特征中提取辅助特征来辅助预测目标对象所偏好的主题;训练后的选择注意力机制模块用于实现辅助特征对训练后的主题网络中所处理的数据的影响,即用于实现目标对象的对象特征、目标产品的产品特征以及多个待预测主题的主题特征之间的特征交互;训练后的主题网络用于预测目标对象对多个待预测主题中各个待预测主题的偏好程度,进而可以基于预测得到的目标对象对各个待预测主题的偏好程度,从多个待预测主题中确定目标对象所偏好的主题。
44.如图3所示,为本技术实施例提供的一种训练后的主题预测模型的示意图,该训练后的主题预测模型是一个基于双向注意力队列的迁移学习推荐网络(selective attentive transfer learning model,satl),该训练后的主题预测模型包括嵌入层(embeddinglayer);该训练后的辅助网络包括辅助特征交互层(也称辅助行为样本的交互层,interaction layers for auxiliary samples,il4as),其中,辅助特征交互层由多个多层感知器(multilayer perceptron,mlp)组成;训练后的选择注意力机制模块包括专家网络(expert network)以及双向注意力单元(dual attention unit,dau);训练后的主题网络包括主题特征交互层(也称主题推荐的交互层,interaction layers for topic recommendation,il4tr),级联层(concatenation)以及微调网络(fine-tune mlp),其中,主题特征交互层由多个多层感知器(mlp)组成,微调网络由多个多层感知器(mlp)组成。
45.在一个实施例中,主题预测设备通过训练后的主题预测模型,对目标对象的对象特征、目标对象所关注的目标产品的物料特征以及预估的目标对象所关注的多个待预测主题的主题特征进行特征交互处理,得到目标对象对应的目标交互向量时,可以包括:通过训练后的辅助网络对目标产品的物料特征以及目标对象的对象特征进行特征提取处理,得到目标对象对应的第一特征表示向量;通过训练后的主题网络对多个待预测主题的主题特征以及目标对象的对象特征进行特征提取处理,得到目标对象对应的第二特征表示向量;通过训练后的选择注意力机制模块对目标对象的对象特征进行特征提取处理,得到目标对象对应的对象特征表示向量;对目标对象对应的第一特征表示向量以及目标对象对应的第二特征表示向量进行注意力交互处理,得到目标对象对应的辅助交互向量;以及对目标对象对应的第二特征表示向量以及目标对象对应的对象特征表示向量进行注意力交互处理,得到目标对象对应的主题交互向量;并将目标对象对应的辅助交互向量与目标对象对应的主题交互向量进行组合,得到目标对象对应的目标交互向量。
46.具体实现中,主题预测设备通过训练后的辅助网络对目标产品的物料特征以及目标对象的对象特征进行特征提取处理,得到目标对象对应的第一特征表示向量时,可以先将目标产品的物料特征以及目标对象的对象特征输入至训练后的主题预测模型的嵌入层进行向量嵌入处理,得到目标对象对应的第一嵌入向量;然后将目标对象对应的第一嵌入向量输入至训练后的主题预测模型的辅助特征交互层进行特征提取处理,得到目标对象对应的第一特征表示向量。主题预测设备通过训练后的主题网络对多个待预测主题的主题特
征以及目标对象的对象特征进行特征提取处理,得到目标对象对应的第二特征表示向量时,可以先将多个待预测主题的主题特征以及目标对象的对象特征输入至训练后的主题预测模型的嵌入层进行向量嵌入处理,得到目标对象对应的第二嵌入向量;然后将目标对象对应的第二嵌入向量输入至训练后的主题预测模型的主题特征交互层进行特征提取处理,得到目标对象对应的第二特征表示向量。主题预测设备通过训练后的选择注意力机制模块对目标对象的对象特征进行特征提取处理,得到目标对象对应的对象特征表示向量时,可以先将目标对象的对象特征输入至训练后的主题预测模型的嵌入层进行向量嵌入处理,得到目标对象对应的对象特征嵌入向量;然后将目标对象对应的对象特征嵌入向量输入至训练后的主题预测模型的专家网络进行特征提取处理,得到目标对象对应的对象特征表示向量。
47.也就是说,主题预测设备可以先将目标对象的对象特征、目标产品的物料特征以及多个待预测主题的主题特征输入至训练后的主题预测模型的嵌入层;该嵌入层可以对目标产品的物料特征以及目标对象的对象特征进行向量嵌入处理,得到目标对象对应的第一嵌入向量,并将目标对象对应的第一嵌入向量输入至训练后的主题预测模型的辅助特征交互层;该嵌入层可以对多个待预测主题的主题特征以及目标对象的对象特征进行向量嵌入处理,得到目标对象对应的第二嵌入向量,并将目标对象对应的第二嵌入向量输入至训练后的主题预测模型的主题特征交互层;该嵌入层可以对目标对象的对象特征进行向量嵌入处理,得到目标对象对应的对象特征嵌入向量,并将目标对象对应的对象特征嵌入向量输入至训练后的主题预测模型的专家网络。
48.进一步的,可以通过训练后的主题预测模型的双向注意力单元对目标对象对应的第一特征表示向量以及目标对象对应的第二特征表示向量进行注意力交互处理,得到目标对象对应的辅助交互向量;以及对目标对象对应的第二特征表示向量以及目标对象对应的对象特征表示向量进行注意力交互处理,得到目标对象对应的主题交互向量;然后将目标对象对应的辅助交互向量与目标对象对应的主题交互向量进行组合,得到目标对象对应的目标交互向量。若目标对象的对象特征表示为u
′
,目标产品的物料特征表示为i
′
,多个待预测主题的主题特征表示为t
′
,目标对象对应的第一嵌入向量表示为q=emb([u
′
,i
′
]),目标对象对应的第二嵌入向量表示为x=emb([u
′
,t
′
]),目标对象对应的对象特征嵌入向量表示为u=emb(u
′
);目标对象对应的第一特征表示向量表示为h(q)=mlp
il4as
(q),目标对象对应的第二特征表示向量表示为g(x)=mlp
il4tp
(x),目标对象对应的对象特征表示向量表示为f(u)。
[0049]
那么,目标对象对应的目标交互向量可以由公式1给出:
[0050]
att
tp
(x,f,h)=ω
tp
f(u)+ωhhf(q)
ꢀꢀꢀ
(1)
[0051]
其中,att
tp
表示目标对象对应的目标交互向量,ω
tp
f(u)表示目标对象对应的主题交互向量,ωhhf(q)表示目标对象对应的辅助交互向量;ω
tp
=softmax(a
tp
),a
tp
=g(x)*w
tp
*f(u)
t
;ωh=softmax(ah),ah=g(x)*w
cross
*hf(q)。其中,hf(q)表示参数冻结(frozen)时目标对象对应的第一特征表示向量,即主题预测设备进行当前计算时用于计算目标对象对应的第一特征表示向量的参数没有更新,w
tp
表示用于计算目标对象对应的第二特征表示向量与目标对象对应的对象特征表示向量注意力的权重矩阵,w
cross
表示用于计算目标对象对应的第一特征表示向量与目标对象对应的第二特征表示向量注意力的权重矩阵;ω
tp
表示
主题网络为专家网络计算得到的注意力权重,ωh表示主题网络为辅助网络输出计算得到权重;若目标对象不存在辅助特征,即目标对象不存在目标产品的物料特征,则该目标对象对应的辅助交互向量ωhhf(q)为0。
[0052]
s202,基于多个待预测主题的主题特征以及目标对象对应的目标交互向量,确定多个待预测主题中各个待预测主题的主题预测概率。
[0053]
其中,各个待预测主题的主题预测概率指示:预测得到的目标对象对各个待预测主题的偏好程度。
[0054]
在一个实施例中,主题预测设备基于多个待预测主题的主题特征以及目标对象对应的目标交互向量,确定多个待预测主题中各个待预测主题的主题预测概率,可以包括:通过训练后的主题网络,将对多个待预测主题的主题特征以及目标对象的对象特征进行特征提取处理得到的目标对象对应的第二特征表示向量,与目标对象对应的目标交互向量进行拼接处理,得到目标对象对应的主题拼接向量;对目标对象对应的主题拼接向量进行概率预测处理,得到多个待预测主题中各个待预测主题的主题预测概率。具体实现中,可以通过训练后的主题预测模型中的级联层将目标对象对应的第二特征表示向量与目标对象对应的目标交互向量进行拼接处理,得到目标对象对应的主题拼接向量;可以通过训练后的主题网络中包括的微调网络对目标对象对应的主题拼接向量进行概率预测处理,得到多个待预测主题中各个待预测主题的主题预测概率。
[0055]
s203,基于各个待预测主题的主题预测概率,将多个待预测主题中的目标待预测主题确定为目标对象所偏好的主题。
[0056]
其中,目标待预测主题的主题预测概率大于多个待预测主题中除目标待预测主题以外的其他待预测主题的主题预测概率。
[0057]
在一个实施例中,主题预测设备可以将多个待预测主题中,主题预测概率大于主题概率阈值的目标待预测主题确定为目标对象所偏好的主题。其中,主题概率阈值可以是根据具体的需求进行设定的。可选的,主题预测设备可以将多个待预测主题中,一定数量的目标待预测主题确定为目标对象所偏好的主题,目标待预测主题的主题预测概率大于多个待预测主题中除目标待预测主题以外的其他待预测主题的主题预测概率。例如,可以将主题预测概率按照从大到小排列时,排列顺序处于前3的待预测主题确定为目标对象所偏好的主题,即将主题预测概率排名top3的待预测主题确定为目标对象所偏好的主题。举例来说,若各个待预测主题分别为主题1、主题2、主题3、主题4以及主题5,各个待预测主题的主题预测概率从大到小依次为主题5、主题3、主题1、主题2以及主题4;若将主题预测概率排名top3的待预测主题确定为目标对象所偏好的主题,则确定出的目标对象所偏好的主题分别为:主题5、主题3以及主题1。
[0058]
在一个实施例中,主题预测设备在得到目标对象所偏好的主题之后,可以将目标对象所偏好的主题发送至业务人员的终端设备中,以使业务人员可以基于接收到的目标对象所偏好的主题向目标对象提供个性化服务,例如向目标对象介绍目标对象所偏好的主题的相关业务。
[0059]
本技术实施例中,主题预测设备可以通过训练后的主题预测模型对目标对象的对象特征、目标对象所关注的目标产品的物料特征以及预估的目标对象所关注的多个待预测主题的主题特征的特征交互处理,确定出多个待预测主题中各个待预测主题的主题预测概
率,其中,各个待预测主题的主题预测概率指示:预测得到的目标对象对各个待预测主题的偏好程度;然后基于各个待预测主题的主题预测概率,从多个待预测主题中确定出目标对象所偏好的主题。可以基于对目标对象的对象特征、目标对象所关注的目标产品的物料特征以及预估的目标对象所关注的多个待预测主题的主题特征的特征交互处理,从预估的目标对象所关注的多个待预测主题中确定出目标对象所偏好的主题,进而可以基于该确定出的目标对象所偏好的主题向目标对象提供个性化服务,可提高对象体验。
[0060]
基于上述主题预测方法以及主题预测系统,训练后的主题预测模型是基于训练后的辅助网络、训练后的选择注意力机制模块以及训练后的主题网络构建的,同时也是基于第一训练样本对主题预测模型进行训练得到的;其中,主题预测模型是基于辅助网络、选择注意力机制模块以及主题网络构建的;辅助网络以及选择注意力机制模块是基于第二训练样本对初始辅助网络以及初始选择注意力机制模块进行训练得到的。基于此,本技术实施例提供了一种训练得到训练后的主题预测模型的方法。参见图4,为本技术实施例提供的一种训练得到训练后的主题预测模型的方法流程示意图。图4所示的训练得到训练后的主题预测模型的方法可由主题预测设备执行,也可以由其他电子设备执行,本技术实施例以主题预测设备展开介绍。图4所示的训练得到训练后的主题预测模型的方法可包括如下步骤:
[0061]
s401,获取第二训练样本。
[0062]
其中,第二训练样本包括第二训练对象的对象特征、第二训练对象所关注的多个第二产品的物料特征以及多个第二产品中各个第二产品的产品偏好标签,多个第二产品与目标产品属于同一产品集。其中,第二训练对象可以为目标业务平台中与目标对象不同的任意平台用户;第二训练对象的对象特征可以包括第二训练对象的对象基础特征以及行为偏好特征;第二训练对象所关注的第二产品指的是目标业务平台所提供的产品中,第二训练对象感兴趣的产品,第二训练对象所关注的第二产品的物料特征可以包括第二产品的产品属性特征以及产品统计特征;各个第二产品的产品偏好标签可以指示第二训练对象对各个第二产品的偏好程度。
[0063]
s402,通过初始辅助网络以及初始选择注意力机制模块,对第二训练对象的对象特征以及多个第二产品的物料特征进行特征交互处理,得到第二训练对象对应的产品交互向量。
[0064]
在一个实施例中,如图5所示,为本技术实施例提供的一种基于初始辅助网络以及初始选择注意力机制模块构建的初始网络的示意图,该初始网络可以用于确定第二训练对象对第二训练对象所关注的多个第二产品中,各个第二产品的产品预测概率,其中各个第二产品的产品预测概率指示:预测得到的第二训练对象对各个第二产品的偏好程度。该初始网络包括嵌入层(embeddinglayer)、初始辅助网络以及初始选择注意力机制模块;初始辅助网络包括辅助特征交互层(也称辅助行为样本的交互层,interaction layers for auxiliary samples,il4as),级联层(concatenation)以及微调网络(fine-tune mlp),其中,辅助特征交互层由多个多层感知器(multilayer perceptron,mlp)组成,微调网络由多个多层感知器(mlp)组成;初始选择注意力机制模块包括专家网络(expert network)以及双向注意力单元(dual attention unit,dau)。
[0065]
在一个实施例中,主题预测设备通过初始辅助网络以及初始选择注意力机制模块,对第二训练对象的对象特征以及多个第二产品的物料特征进行特征交互处理,得到第
二训练对象对应的产品交互向量,可以包括:通过初始辅助网络对多个第二产品的物料特征以及第二训练对象的对象特征进行特征提取处理,得到第二训练对象对应的第一特征表示向量;通过初始选择注意力机制模块对第二训练对象的对象特征进行特征提取处理,得到第二训练对象对应的对象特征表示向量;对第二训练对象对应的第一特征表示向量以及第二训练对象对应的对象特征表示向量进行注意力交互处理,得到第二训练对象对应的产品交互向量。
[0066]
具体实现中,主题预测设备通过初始辅助网络对多个第二产品的物料特征以及第二训练对象的对象特征进行特征提取处理,得到第二训练对象对应的第一特征表示向量时,可以先将第二产品的物料特征以及第二训练对象的对象特征输入至初始网络的嵌入层进行向量嵌入处理,得到第二训练对象对应的第一嵌入向量;然后将第二训练对象对应的第一嵌入向量输入至初始网络的辅助特征交互层进行特征提取处理,得到第二训练对象对应的第一特征表示向量;主题预测设备通过初始选择注意力机制模块对第二训练对象的对象特征进行特征提取处理,得到第二训练对象对应的对象特征表示向量时,可以先将第二训练对象的对象特征输入至初始网络的嵌入层进行向量嵌入处理,得到第二训练对象对应的对象特征嵌入向量;然后将第二训练对象对应的对象特征嵌入向量输入至初始网络的专家网络进行特征提取处理,得到第二训练对象对应的对象特征表示向量。
[0067]
进一步的,主题预测设备可以通过初始网络的双向注意力单元对第二训练对象对应的第一特征表示向量以及第二训练对象对应的对象特征表示向量进行注意力交互处理,得到第二训练对象对应的产品交互向量。若第二训练对象的对象特征表示为u
′2,多个第二产品的物料特征表示为i
′2,第二训练对象对应的第一嵌入向量表示为q2=emb([u
′2,i
′2]),第二训练对象对应的对象特征嵌入向量表示为u2=emb(u
′2);第二训练对象对应的第一特征表示向量表示为h2(q2)=mlp
il4as
(q2),第二训练对象对应的对象特征表示向量表示为f2(u2)。
[0068]
那么,第二训练对象对应的产品交互向量可以由公式2给出:
[0069][0070]
其中,表示第二训练对象对应的产品交互向量,其中,表示映射矩阵,表示计算出的权重向量。
[0071]
s403,基于多个第二产品的物料特征以及第二训练对象对应的产品交互向量,确定多个第二产品中各个第二产品的产品预测概率。
[0072]
其中,各个第二产品的产品预测概率指示:预测得到的第二训练对象对各个第二产品的偏好程度。
[0073]
在一个实施例中,主题预测设备基于多个第二产品的物料特征以及第二训练对象对应的产品交互向量,确定多个第二产品中各个第二产品的产品预测概率,可以包括:通过初始辅助网络,将对多个第二产品的物料特征以及第二训练对象的对象特征进行特征提取处理得到的第二训练对象对应的第一特征表示向量,与第二训练对象对应的产品交互向量进行拼接处理,得到第二训练对象对应的产品拼接向量;对第二训练对象对应的产品拼接
向量进行概率预测处理,得到多个第二产品中各个第二产品的产品预测概率。具体实现中,可以通过初始网络的级联层将第二训练对象对应的第一特征表示向量与第二训练对象对应的产品交互向量进行拼接处理,得到第二训练对象对应的产品拼接向量;可以通过初始网络中的微调网络对第二训练对象对应的产品拼接向量进行概率预测处理,得到多个第二产品中各个第二产品的产品预测概率。
[0074]
s404,基于各个第二产品的产品偏好标签以及各个第二产品的产品预测概率,对初始辅助网络以及初始选择注意力机制模块进行训练,得到辅助网络以及选择注意力机制模块。
[0075]
在一个实施例中,主题预测设备基于各个第二产品的产品偏好标签以及各个第二产品的产品预测概率,对初始辅助网络以及初始选择注意力机制模块进行训练,得到辅助网络以及选择注意力机制模块可以包括:基于各个第二产品的产品偏好标签以及各个第二产品的产品预测概率,确定第一损失函数的第一函数值,基于第一损失函数的第一函数值,对初始网络进行训练得到训练后的初始网络,即可以对初始网络的训练实现对初始辅助网络以及初始选择注意力机制模块进行训练,得到辅助网络以及选择注意力机制模块。进一步的,可以基于一个或多个第二训练样本,朝着减小第一损失函数的第一函数值的方向对初始网络进行训练,直至使得第一损失函数的第一函数值小于第一预设损失值或达到训练步数;其中,可以根据具体的训练需求对第一预设损失值或训练步数进行具体设定。第一损失函数可以由公式3给出:
[0076][0077]
其中,l
aux
表示第一损失函数,其中,i为自变量,ni为训练样本数量,yi为第i个训练样本中包括的多个产品的产品偏好标签,qi为第i个训练样本对应的第一嵌入向量,即第i个训练样本所指示的训练对象对应的第一嵌入向量,hi表示第i个训练样本对应的第一特征表示向量,即第i个训练样本所指示的训练对象对应的第一特征表示向量,表示第i个训练样本对应的产品交互向量,即第i个训练样本所指示的训练对象对应的产品交互向量,表示第i个训练样本中的多个产品的产品预测概率,ce表示交叉熵函数。当基于一个或多个第二训练样本计算第一损失函数的第一函数值时,该第一损失函数可以由公式4给出:
[0078][0079]
其中,i为自变量,n
2i
为第二训练样本数量,y
2i
为第i个第二训练样本中包括的多个第二产品的产品偏好标签,q
2i
为第i个第二训练样本对应的第一嵌入向量,即第i个第二训练样本所指示的第二训练对象对应的第一嵌入向量,h
2i
表示第i个第二训练样本对应的第一特征表示向量,即第i个第二训练样本所指示的第二训练对象对应的第一特征表示向量,表示第i个第二训练样本对应的产品交互向量,即第i个第二训练样本所指示的第二训练对象对应的产品交互向量;表示第i个第二训练样本中的多个第二产品的产品预测概率,ce表示交叉熵函数。
[0080]
进一步的,主题预测设备对初始网络进行训练,得到训练后的初始网络之后,可以
基于训练后的初始网络中包括的嵌入层、辅助网络、选择注意力机制模块以及主题网络构建主题预测模型;进而可以基于第一训练样本对主题预测模型进行训练,得到训练后的主题预测模型。其中,辅助网络用于提取第一训练样本所指示的第一训练对象的辅助特征,以使辅助网络能够确定第一训练对象对第一训练对象所关注的多个第一产品中,各个第一产品的产品预测概率,其中,各个第一产品的产品预测概率指示:预测得到的第一训练对象对各个第一产品的偏好程度;以及使得主题网络能够基于辅助特征辅助确定第一训练对象对第一训练对象所关注的多个训练主题中,各个训练主题的主题预测概率,其中,各个训练主题的主题预测概率指示:预测得到的第一训练对象对各个训练主题的偏好程度。选择注意力机制模块用于实现辅助特征对主题网络中所处理的数据的影响,即用于实现第一训练对象的对象特征、第一训练对象所关注的多个第一产品的产品特征以及第一训练对象所关注的多个训练主题的主题特征之间的特征交互;主题网络用于基于辅助特征辅助确定第一训练对象对第一训练对象所关注的多个训练主题中,各个训练主题的主题预测概率。进而可以基于各个第一产品的产品预测概率以及各个训练主题对应的主题预测概率对主题预测模型进行训练,得到训练后的主题预测模型。
[0081]
参见图6,为本技术实施例提供的一种主题预测模型的示意图,该主题预测模型包括嵌入层(embedding layer),该嵌入层是基于训练后的初始网络中的嵌入层构建的;该主题预测模型中包括的辅助网络包括辅助特征交互层(也称辅助行为样本的交互层,interaction layers for auxiliary samples,il4as),级联层(concatenation)以及微调网络(fine-tune mlp),其中,该辅助特征交互层由多个多层感知器(multilayer perceptron,mlp)组成;该微调网络由多个多层感知器(mlp)组成,该辅助网络是基于训练后的初始网络中包括的辅助网络构建的;该主题预测模型中包括的选择注意力机制模块包括专家网络(expert network)以及双向注意力单元(dual attention unit,dau),该选择注意力机制模块是基于训练后的初始网络中包括的选择注意力机制模块构建的;该主题预测模型中包括的主题网络包括主题特征交互层(也称主题推荐的交互层,interaction layers for topic recommendation,il4tr),级联层(concatenation)以及微调网络(fine-tune mlp),其中,该主题特征交互层由多个多层感知器(mlp)组成,微调网络由多个多层感知器(mlp)组成。
[0082]
s405,获取第一训练样本。
[0083]
其中,第一训练样本包括第一训练对象的对象特征、第一训练对象所关注的多个第一产品的物料特征、第一训练对象所关注的多个训练主题的主题特征、多个第一产品中各个第一产品的产品偏好标签以及多个训练主题中各个训练主题的主题偏好标签,多个第一产品与目标产品属于同一产品集,多个训练主题与多个待预测主题属于同一主题集。其中,第一训练对象可以为目标业务平台中与目标对象以及第二训练对象不同的任意平台用户;第一训练对象的对象特征可以包括第一训练对象的对象基础特征以及行为偏好特征;第一训练对象所关注的多个第一产品指的是目标业务平台所提供的产品中,第一训练对象感兴趣的产品,第一产品的物料特征可以包括第一产品的产品属性特征以及产品统计特征;第一训练对象所关注的多个训练主题指的是目标业务平台所提供的业务主题中,第一训练对象感兴趣的业务主题,训练主题的主题特征可以包括训练主题的主题属性特征、主题统计特征以及针对第一训练对象的个性化统计特征;各个第一产品的产品偏好标签可以
指示第一训练对象对各个第一产品的偏好程度,各个训练主题的主题偏好标签可以指示第一训练对象对各个训练主题的偏好程度。
[0084]
s406,通过主题预测模型,对第一训练对象的对象特征、多个第一产品的物料特征以及多个训练主题的主题特征进行特征交互处理,得到第一训练对象对应的产品交互向量以及第一训练对象对应的目标交互向量。
[0085]
具体实现中,主题预测设备通过主题预测模型,对第一训练对象的对象特征、多个第一产品的物料特征以及多个训练主题的主题特征进行特征交互处理,得到第一训练对象对应的产品交互向量以及第一训练对象对应的目标交互向量,可以包括:通过辅助网络对多个第一产品的物料特征以及第一训练对象的对象特征进行特征提取处理,得到第一训练对象对应的第一特征表示向量;通过主题网络对多个训练主题的主题特征以及第一训练对象的对象特征进行特征提取处理,得到第一训练对象对应的第二特征表示向量;通过选择注意力机制模块对第一训练对象的对象特征进行特征提取处理,得到第一训练对象对应的对象特征表示向量;对第一训练对象对应的第一特征表示向量以及第一训练对象对应的对象特征表示向量进行注意力交互处理,得到第一训练对象对应的产品交互向量;对第一训练对象对应的第一特征表示向量以及第一训练对象对应的第二特征表示向量进行注意力交互处理,得到第一训练对象对应的辅助交互向量;以及对第一训练对象对应的第二特征表示向量以及第一训练对象对应的对象特征表示向量进行注意力交互处理,得到第一训练对象对应的主题交互向量;并将第一训练对象对应的辅助交互向量与第一训练对象对应的主题交互向量进行组合,得到第一训练对象对应的目标交互向量。
[0086]
主题预测设备通过主题预测模型,对第一训练对象的对象特征、多个第一产品的物料特征以及多个训练主题的主题特征进行特征交互处理,得到第一训练对象对应的产品交互向量以及第一训练对象对应的目标交互向量与上述主题预测设备通过初始辅助网络以及初始选择注意力机制模块得到第二训练对象对应的产品交互向量,以及通过训练后的主题预测模型,得到目标对象对应的目标交互向量的处理过程类似,在此不再赘述。
[0087]
s407,基于多个第一产品的物料特征以及第一训练对象对应的产品交互向量,确定多个第一产品中各个第一产品的产品预测概率。
[0088]
其中,各个第一产品的产品预测概率指示:预测得到的第一训练对象对各个第一产品的偏好程度。
[0089]
具体实现中,主题预测设备基于多个第一产品的物料特征以及第一训练对象对应的产品交互向量,确定多个第一产品中各个第一产品的产品预测概率,可以包括:通过辅助网络,将对多个第一产品的物料特征以及第一训练对象的对象特征进行特征提取处理得到的第一训练对象对应的第一特征表示向量,与第一训练对象对应的产品交互向量进行拼接处理,得到第一训练对象对应的产品拼接向量;对第一训练对象对应的产品拼接向量进行概率预测处理,得到多个第一产品中各个第一产品的产品预测概率。主题预测设备基于多个第一产品的物料特征以及第一训练对象对应的产品交互向量,确定多个第一产品中各个第一产品的产品预测概率的处理过程与上述主题预测设备确定多个第二产品中各个第二产品的产品预测概率的处理过程类似,在此不再赘述。
[0090]
s408,基于多个训练主题的主题特征以及第一训练对象对应的目标交互向量,确定多个训练主题中各个训练主题的主题预测概率。
[0091]
其中,各个训练主题的主题预测概率指示:预测得到的第一训练对象对各个训练主题的偏好程度。
[0092]
其中,主题预测设备基于多个训练主题的主题特征以及第一训练对象对应的目标交互向量,确定多个训练主题中各个训练主题的主题预测概率与上述确定各个待预测主题的主题预测概率的处理过程类似,在此不再赘述。
[0093]
s409,基于各个第一产品的产品偏好标签、各个训练主题的主题偏好标签、各个第一产品的产品预测概率以及各个训练主题的主题预测概率,对主题预测模型进行训练,得到训练后的主题预测模型。
[0094]
在一个实施例中,主题预测设备基于各个第一产品的产品偏好标签、各个训练主题的主题偏好标签、各个第一产品的产品预测概率以及各个训练主题的主题预测概率,对主题预测模型进行训练,得到训练后的主题预测模型,可以包括:基于各个第一产品的产品偏好标签以及各个第一产品的产品预测概率,确定第一损失函数的函数值;基于各个训练主题的主题偏好标签以及各个训练主题的主题预测概率,确定第二损失函数的函数值;基于第一损失函数的函数值以及第二损失函数的函数值,确定目标损失函数的函数值;基于目标损失函数的函数值,对主题预测模型进行训练,得到训练后的主题预测模型。
[0095]
具体的,可以基于一个或多个第一训练样本,朝着减小目标损失函数的函数值的方向对主题预测模型进行训练,直至使得目标损失函数的函数值小于目标预设损失值;其中,可以根据具体的训练需求对目标预设损失值进行具体设定。当基于一个或多个第一训练样本对主题预测模型进行训练时,若第j个第一训练样本所指示的第一训练对象的对象特征表示为u
′
1j
,该第j个第一训练样本所指示的第一训练对象所关注的多个第一产品的物料特征表示为i
′
1j
,该第j个第一训练样本所指示的第一训练对象所关注的多个训练主题的主题特征表示为t
′
1j
;该第j个第一训练样本所指示的第一训练对象对应的第一嵌入向量表示为q
1j
=emb([u
′
1j
,i
′
1j
]),该第j个第一训练样本所指示的第一训练对象对应的对象特征嵌入向量表示为u
1j
=emb(u
′
1j
),该第j个第一训练样本所指示的第一训练对象对应的第二嵌入向量表示为x
1j
=emb([u
′
1j
,t
′
1j
]);该第j个第一训练样本所指示的第一训练对象对应的第一特征表示向量表示为h
1j
(q
1j
)=mlp
il4as
(q
1j
),该第j个第一训练样本所指示的第一训练对象对应的对象特征表示向量表示为f
1j
(u
1j
);该第j个第一训练样本所指示的第一训练对象对应的第二特征表示向量表示为g
1j
(x
1j
)=mlp
il4tp
(x
1j
);则第一损失函数可以由公式5.1给出:
[0096][0097]
其中,j为自变量,n
1j
为第一训练样本数量,y
1j
为第j个第一训练样本中包括的多个第一产品的产品偏好标签;表示第j个第一训练样本中包括的多个第一产品的产品预测概率,ce表示交叉熵函数。其中,表示第j个第一训练样本所指示的第一训练对象对应的产品交互向量;可由公式5.2给出:
[0098]
[0099]
其中,其中,表示处理第j个第一训练样本时对应的映射矩阵,表示处理第j个第一训练样本时计算出的权重向量。
[0100]
第二损失函数可以由公式6.1给出:
[0101][0102]
其中,l
tp
为第二损失函数,j为自变量,n
1j
为第一训练样本数量,y
′
1j
为第j个第一训练样本中包括的多个训练主题的主题偏好标签;表示第j个第一训练样本中包括的多个训练主题的主题预测概率,ce表示交叉熵函数。其中,表示第j个第一训练样本所指示的第一训练对象对应的目标交互向量;可由公式6.2给出:
[0103][0104]
其中,表示第j个第一训练样本所指示的第一训练对象对应的主题交互向量,表示第j个第一训练样本所指示的第一训练对象对应的辅助交互向量;向量;其中,表示参数冻结(frozen)时第j个第一训练样本所指示的第一训练对象对应的第一特征表示向量,即主题预测设备进行当前计算时用于计算该第一训练对象对应的第一特征表示向量的参数没有更新,表示用于计算第j个第一训练样本所指示的第一训练对象对应的第二特征表示向量与该第一训练对象对应的对象特征表示向量注意力的权重矩阵,表示用于计算第j个第一训练样本所指示的第一训练对象对应的第一特征表示向量与该第一训练对象对应的第二特征表示向量注意力的权重矩阵;表示处理第j个第一训练样本时主题网络为专家网络计算得到的注意力权重,表示处理第j个第一训练样本时主题网络为辅助网络输出计算得到权重;若第j个第一训练样本所指示的第一训练对象不存在辅助特征,即第j个第一训练样本所指示的第一训练对象不存在第一产品的物料特征,则该第j个第一训练样本所指示的第一对象对应的辅助交互向量为0。
[0105]
目标损失函数由公式7给出:
[0106]
l=αl
aux
+(1-α)l
tp
+λω
ꢀꢀꢀꢀ
(7)
[0107]
其中,l表示目标损失函数,α表示专家配置权重,用于控制第一损失函数和第二损失函数在目标损失函数中的占比;λ表示专家配置权重,ω为主题预测模型中所有模型参数的绝对值的总和,其用于控制主题预测模型的网络复杂度。
[0108]
在一个实施例中,基于模型评价指标将本技术实施例提出的训练后的主题预测模型与现有的能实现从预估的目标对象所关注的多个待预测主题中预测目标对象所偏好的主题的模型进行对比,发现本技术实施例提出的训练后的主题预测模型相较于现有模型在模型性能上有所提升。如表1所示,本技术实施例基于模型评价指标中的auc指标、ndcg指标以及recall指标,将本技术实施例提出的训练后的主题预测模型与现有模型中的lr模型(逻辑回归模型)、conet模型(一种基于特征分享的迁移学习模型,collaborative cross networks for cross-domain recommendation)以及ddtctr模型进行对比。其中,auc指标(areaunderthecurve of roc)是roc曲线下方的面积,auc指标越高表示越准确;ndcg指标(normalized discounted cumulative gain),是归一化折损累计增益,ndcg指标越高表示越准确;recall指标表示召回率。由对比结果可见:lr模型在auc指标、ndcg指标以及recall指标下的打分分别为:0.685
±
0.015、0.315以及0.692;conet模型在auc指标、ndcg指标以及recall指标下的打分分别为:0.75
±
0.009、0.3932以及0.7751;ddtctr模型在auc指标、ndcg指标以及recall指标下的打分分别为:0.77
±
0.019、0.4541、以及0.8381;本技术实施例所提出的训练后的主题预测模型在auc指标、ndcg指标以及recall指标下的打分分别为:0.80
±
0.014、0.5032以及0.8761;相比于现有模型中性能最优的ddtctr模型在auc指标、ndcg指标以及recall指标下的打分分别提升3.89%、10.8%以及4.5%,可知本技术实施例所提出的训练后的主题预测模型在性能上有显著提升。
[0109]
表1
[0110][0111]
本技术实施例中,主题预测设备可以基于第二训练样本对初始辅助网络以及初始选择注意力机制模块进行训练,得到辅助网络以及选择注意力机制模块;然后可以基于辅助网络、选择注意力机制模块以及主题网络构建主题预测模型,并基于第一训练样本对主题预测模型进行训练,得到训练后的主题预测模型。可以采用第二训练样本对初始辅助网络以及初始选择注意力机制进行训练,基于迁移学习利用在第二训练样本中学到的能力对主题预测模型进行训练,可以提升训练后的主题预测模型的预测准确性;并且可以提升数据稀疏场景下的预测准确性,即可以在由于主题特征少导致第一训练样本不充足的情况下提升对于目标对象所偏好的主题的预测准确性,即可以保证训练后的主题预测模型的预测准确性。
[0112]
基于上述主题预测方法实施例,本技术实施例提供了一种主题预测装置。参见图
7,为本技术实施例提供的一种主题预测装置的结构示意图,该主题预测装置可包括获取单元701以及处理单元702。图7所示的主题预测装置可运行如下单元:
[0113]
处理单元702,用于通过训练后的主题预测模型,对目标对象的对象特征、所述目标对象所关注的目标产品的物料特征以及预估的所述目标对象所关注的多个待预测主题的主题特征进行特征交互处理,得到所述目标对象对应的目标交互向量;
[0114]
所述处理单元702,还用于基于所述多个待预测主题的主题特征以及所述目标对象对应的目标交互向量,确定所述多个待预测主题中各个待预测主题的主题预测概率,所述各个待预测主题的主题预测概率指示:预测得到的所述目标对象对所述各个待预测主题的偏好程度;
[0115]
所述处理单元702,还用于基于所述各个待预测主题的主题预测概率,将所述多个待预测主题中的目标待预测主题确定为所述目标对象所偏好的主题,所述目标待预测主题的主题预测概率大于所述多个待预测主题中除所述目标待预测主题以外的其他待预测主题的主题预测概率。
[0116]
在一个实施例中,所述训练后的主题预测模型是基于训练后的辅助网络、训练后的选择注意力机制模块以及训练后的主题网络构建的;
[0117]
所述处理单元702通过训练后的主题预测模型,对目标对象的对象特征、所述目标对象所关注的目标产品的物料特征以及预估的所述目标对象所关注的多个待预测主题的主题特征进行特征交互处理,得到所述目标对象对应的目标交互向量时,具体执行如下操作:
[0118]
通过所述训练后的辅助网络对所述目标产品的物料特征以及所述目标对象的对象特征进行特征提取处理,得到所述目标对象对应的第一特征表示向量;
[0119]
通过所述训练后的主题网络对所述多个待预测主题的主题特征以及所述目标对象的对象特征进行特征提取处理,得到所述目标对象对应的第二特征表示向量;
[0120]
通过所述训练后的选择注意力机制模块对所述目标对象的对象特征进行特征提取处理,得到所述目标对象对应的对象特征表示向量;对所述目标对象对应的第一特征表示向量以及所述目标对象对应的第二特征表示向量进行注意力交互处理,得到所述目标对象对应的辅助交互向量;以及对所述目标对象对应的第二特征表示向量以及所述目标对象对应的对象特征表示向量进行注意力交互处理,得到所述目标对象对应的主题交互向量;并将所述目标对象对应的辅助交互向量与所述目标对象对应的主题交互向量进行组合,得到所述目标对象对应的目标交互向量。
[0121]
在一个实施例中,所述训练后的主题预测模型是基于训练后的主题网络构建的;
[0122]
所述处理单元702基于所述多个待预测主题的主题特征以及所述目标对象对应的目标交互向量,确定所述多个待预测主题中各个待预测主题的主题预测概率时,具体执行如下操作:
[0123]
通过所述训练后的主题网络,将对所述多个待预测主题的主题特征以及所述目标对象的对象特征进行特征提取处理得到的所述目标对象对应的第二特征表示向量,与所述目标对象对应的目标交互向量进行拼接处理,得到所述目标对象对应的主题拼接向量;
[0124]
对所述目标对象对应的主题拼接向量进行概率预测处理,得到所述多个待预测主题中各个待预测主题的主题预测概率。
[0125]
在一个实施例中,所述获取单元701,用于获取第一训练样本,所述第一训练样本包括第一训练对象的对象特征、所述第一训练对象所关注的多个第一产品的物料特征、所述第一训练对象所关注的多个训练主题的主题特征、所述多个第一产品中各个第一产品的产品偏好标签以及所述多个训练主题中各个训练主题的主题偏好标签,所述多个第一产品与所述目标产品属于同一产品集,所述多个训练主题与所述多个待预测主题属于同一主题集;
[0126]
所述处理单元702,还用于通过主题预测模型,对所述第一训练对象的对象特征、所述多个第一产品的物料特征以及所述多个训练主题的主题特征进行特征交互处理,得到所述第一训练对象对应的产品交互向量以及所述第一训练对象对应的目标交互向量;
[0127]
所述处理单元702,还用于基于所述多个第一产品的物料特征以及所述第一训练对象对应的产品交互向量,确定所述多个第一产品中各个第一产品的产品预测概率,所述各个第一产品的产品预测概率指示:预测得到的所述第一训练对象对所述各个第一产品的偏好程度;
[0128]
所述处理单元702,还用于基于所述多个训练主题的主题特征以及所述第一训练对象对应的目标交互向量,确定所述多个训练主题中各个训练主题的主题预测概率,所述各个训练主题的主题预测概率指示:预测得到的所述第一训练对象对所述各个训练主题的偏好程度;
[0129]
所述处理单元702,还用于基于所述各个第一产品的产品偏好标签、所述各个训练主题的主题偏好标签、所述各个第一产品的产品预测概率以及所述各个训练主题的主题预测概率,对所述主题预测模型进行训练,得到所述训练后的主题预测模型。
[0130]
在一个实施例中,所述主题预测模型是基于辅助网络、选择注意力机制模块以及主题网络构建的;
[0131]
所述处理单元702通过主题预测模型,对所述第一训练对象的对象特征、所述多个第一产品的物料特征以及所述多个训练主题的主题特征进行特征交互处理,得到所述第一训练对象对应的产品交互向量以及所述第一训练对象对应的目标交互向量时,具体执行如下操作:
[0132]
通过所述辅助网络对所述多个第一产品的物料特征以及所述第一训练对象的对象特征进行特征提取处理,得到所述第一训练对象对应的第一特征表示向量;
[0133]
通过所述主题网络对所述多个训练主题的主题特征以及所述第一训练对象的对象特征进行特征提取处理,得到所述第一训练对象对应的第二特征表示向量;
[0134]
通过所述选择注意力机制模块对所述第一训练对象的对象特征进行特征提取处理,得到所述第一训练对象对应的对象特征表示向量;对所述第一训练对象对应的第一特征表示向量以及所述第一训练对象对应的对象特征表示向量进行注意力交互处理,得到所述第一训练对象对应的产品交互向量;对所述第一训练对象对应的第一特征表示向量以及所述第一训练对象对应的第二特征表示向量进行注意力交互处理,得到所述第一训练对象对应的辅助交互向量;以及对所述第一训练对象对应的第二特征表示向量以及所述第一训练对象对应的对象特征表示向量进行注意力交互处理,得到所述第一训练对象对应的主题交互向量;并将所述第一训练对象对应的辅助交互向量与所述第一训练对象对应的主题交互向量进行组合,得到所述第一训练对象对应的目标交互向量。
[0135]
在一个实施例中,所述主题预测模型是基于辅助网络构建的;
[0136]
所述处理单元702基于所述多个第一产品的物料特征以及所述第一训练对象对应的产品交互向量,确定所述多个第一产品中各个第一产品的产品预测概率时,具体执行如下操作:
[0137]
通过所述辅助网络,将对所述多个第一产品的物料特征以及所述第一训练对象的对象特征进行特征提取处理得到的所述第一训练对象对应的第一特征表示向量,与所述第一训练对象对应的产品交互向量进行拼接处理,得到所述第一训练对象对应的产品拼接向量;
[0138]
对所述第一训练对象对应的产品拼接向量进行概率预测处理,得到所述多个第一产品中各个第一产品的产品预测概率。
[0139]
在一个实施例中,所述处理单元702基于所述各个第一产品的产品偏好标签、所述各个训练主题的主题偏好标签、所述各个第一产品的产品预测概率以及所述各个训练主题的主题预测概率,对所述主题预测模型进行训练,得到所述训练后的主题预测模型时,具体执行如下操作:
[0140]
基于所述各个第一产品的产品偏好标签以及所述各个第一产品的产品预测概率,确定第一损失函数的函数值;
[0141]
基于所述各个训练主题的主题偏好标签以及所述各个训练主题的主题预测概率,确定第二损失函数的函数值;
[0142]
基于所述第一损失函数的函数值以及所述第二损失函数的函数值,确定目标损失函数的函数值;
[0143]
基于所述目标损失函数的函数值,对所述主题预测模型进行训练,得到所述训练后的主题预测模型。
[0144]
在一个实施例中,所述主题预测模型是基于辅助网络、选择注意力机制模块以及主题网络构建的,所述辅助网络以及所述选择注意力机制模块是基于对初始辅助网络以及初始选择注意力机制模块进行训练得到的;
[0145]
所述获取单元701,还用于获取第二训练样本,所述第二训练样本包括第二训练对象的对象特征、所述第二训练对象所关注的多个第二产品的物料特征以及所述多个第二产品中各个第二产品的产品偏好标签,所述多个第二产品与所述目标产品属于同一产品集;
[0146]
所述处理单元702,还用于通过所述初始辅助网络以及所述初始选择注意力机制模块,对所述第二训练对象的对象特征以及所述多个第二产品的物料特征进行特征交互处理,得到所述第二训练对象对应的产品交互向量;
[0147]
所述处理单元702,还用于基于所述多个第二产品的物料特征以及所述第二训练对象对应的产品交互向量,确定所述多个第二产品中各个第二产品的产品预测概率,所述各个第二产品的产品预测概率指示:预测得到的所述第二训练对象对所述各个第二产品的偏好程度;
[0148]
所述处理单元702,还用于基于所述各个第二产品的产品偏好标签以及所述各个第二产品的产品预测概率,对所述初始辅助网络以及所述初始选择注意力机制模块进行训练,得到所述辅助网络以及所述选择注意力机制模块。
[0149]
根据本技术的一个实施例,图2以及图4所示的主题预测方法所涉及各个步骤可以
是由图7所示的主题预测装置中的各个单元来执行的。例如,图2所示的步骤s201至步骤s203可由图7所示的主题预测装置中的处理单元702来执行。又如图4所示的步骤s401以及步骤s405可由图7所示的主题预测装置中的获取单元701来执行,图4所示的步骤s402至步骤s404以及步骤s406至步骤s409可由图7所示的主题预测装置中的处理单元702来执行。
[0150]
根据本技术的另一个实施例,图7所示的主题预测装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本技术的实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本技术的其它实施例中,基于逻辑功能划分的主题预测装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
[0151]
根据本技术的另一个实施例,可以通过在包括中央处理单元(cpu)、随机存取存储介质(ram)、只读存储介质(rom)等处理元件和存储元件的例如计算机的通用计算设备上运行能够执行如图2以及图4所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图7中所示的主题预测装置,以及来实现本技术实施例主题预测方法。所述计算机程序可以记载于例如计算机可读存储介质上,并通过计算机可读存储介质装载于上述计算设备中,并在其中运行。
[0152]
本技术实施例中,处理单元702可以通过训练后的主题预测模型对目标对象的对象特征、目标对象所关注的目标产品的物料特征以及预估的目标对象所关注的多个待预测主题的主题特征的特征交互处理,确定出多个待预测主题中各个待预测主题的主题预测概率,其中,各个待预测主题的主题预测概率指示:预测得到的目标对象对各个待预测主题的偏好程度;然后基于各个待预测主题的主题预测概率,从多个待预测主题中确定出目标对象所偏好的主题。可以基于对目标对象的对象特征、目标对象所关注的目标产品的物料特征以及预估的目标对象所关注的多个待预测主题的主题特征的特征交互处理,从预估的目标对象所关注的多个待预测主题中确定出目标对象所偏好的主题,进而可以基于该确定出的目标对象所偏好的主题向目标对象提供个性化服务,可提高对象体验。
[0153]
基于上述的主题预测方法实施例以及主题预测装置实施例,本技术还提供了一种主题预测设备。参见图8,为本技术实施例提供的一种主题预测设备的结构示意图。图8所示的主题预测设备可至少包括处理器801、输入接口802、输出接口803以及计算机存储介质804。其中,处理器801、输入接口802、输出接口803以及计算机存储介质804可通过总线或其他方式连接。
[0154]
计算机存储介质804可以存储在主题预测设备的存储器中,计算机存储介质804用于存储计算机程序,计算机程序包括程序指令,处理器801用于执行计算机存储介质804存储的程序指令。处理器801(或称cpu(central processing unit,中央处理器))是主题预测设备的计算核心以及控制核心,其适于实现一条或多条指令,具体适于加载并执行一条或多条指令从而实现上述主题预测方法流程或相应功能。
[0155]
本技术实施例还提供了一种计算机存储介质(memory),计算机存储介质是主题预测设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机存储介质既可以包括终端中的内置存储介质,当然也可以包括终端所支持的扩展存储介质。计算机存储介
质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器801加载并执行的一条或多条的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机存储介质可以是高速随机存取存储器(random access memory,ram)存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器;可选的还可以是至少一个位于远离前述处理器的计算机存储介质。
[0156]
在一个实施例中,可由处理器801以及输入接口802加载并执行计算机存储介质中存放的一条或多条指令,以实现上述有关图2以及图4的主题预测方法实施例中的方法的相应步骤,具体实现中,计算机存储介质中的一条或多条指令由处理器801以及输入接口802加载并执行如下步骤:
[0157]
处理器801,用于通过训练后的主题预测模型,对目标对象的对象特征、所述目标对象所关注的目标产品的物料特征以及预估的所述目标对象所关注的多个待预测主题的主题特征进行特征交互处理,得到所述目标对象对应的目标交互向量;
[0158]
所述处理器801,还用于基于所述多个待预测主题的主题特征以及所述目标对象对应的目标交互向量,确定所述多个待预测主题中各个待预测主题的主题预测概率,所述各个待预测主题的主题预测概率指示:预测得到的所述目标对象对所述各个待预测主题的偏好程度;
[0159]
所述处理器801,还用于基于所述各个待预测主题的主题预测概率,将所述多个待预测主题中的目标待预测主题确定为所述目标对象所偏好的主题,所述目标待预测主题的主题预测概率大于所述多个待预测主题中除所述目标待预测主题以外的其他待预测主题的主题预测概率。
[0160]
在一个实施例中,所述训练后的主题预测模型是基于训练后的辅助网络、训练后的选择注意力机制模块以及训练后的主题网络构建的;
[0161]
所述处理器801通过训练后的主题预测模型,对目标对象的对象特征、所述目标对象所关注的目标产品的物料特征以及预估的所述目标对象所关注的多个待预测主题的主题特征进行特征交互处理,得到所述目标对象对应的目标交互向量时,具体执行如下操作:
[0162]
通过所述训练后的辅助网络对所述目标产品的物料特征以及所述目标对象的对象特征进行特征提取处理,得到所述目标对象对应的第一特征表示向量;
[0163]
通过所述训练后的主题网络对所述多个待预测主题的主题特征以及所述目标对象的对象特征进行特征提取处理,得到所述目标对象对应的第二特征表示向量;
[0164]
通过所述训练后的选择注意力机制模块对所述目标对象的对象特征进行特征提取处理,得到所述目标对象对应的对象特征表示向量;对所述目标对象对应的第一特征表示向量以及所述目标对象对应的第二特征表示向量进行注意力交互处理,得到所述目标对象对应的辅助交互向量;以及对所述目标对象对应的第二特征表示向量以及所述目标对象对应的对象特征表示向量进行注意力交互处理,得到所述目标对象对应的主题交互向量;并将所述目标对象对应的辅助交互向量与所述目标对象对应的主题交互向量进行组合,得到所述目标对象对应的目标交互向量。
[0165]
在一个实施例中,所述训练后的主题预测模型是基于训练后的主题网络构建的;
[0166]
所述处理器801基于所述多个待预测主题的主题特征以及所述目标对象对应的目
标交互向量,确定所述多个待预测主题中各个待预测主题的主题预测概率时,具体执行如下操作:
[0167]
通过所述训练后的主题网络,将对所述多个待预测主题的主题特征以及所述目标对象的对象特征进行特征提取处理得到的所述目标对象对应的第二特征表示向量,与所述目标对象对应的目标交互向量进行拼接处理,得到所述目标对象对应的主题拼接向量;
[0168]
对所述目标对象对应的主题拼接向量进行概率预测处理,得到所述多个待预测主题中各个待预测主题的主题预测概率。
[0169]
在一个实施例中,所述输入接口802,用于获取第一训练样本,所述第一训练样本包括第一训练对象的对象特征、所述第一训练对象所关注的多个第一产品的物料特征、所述第一训练对象所关注的多个训练主题的主题特征、所述多个第一产品中各个第一产品的产品偏好标签以及所述多个训练主题中各个训练主题的主题偏好标签,所述多个第一产品与所述目标产品属于同一产品集,所述多个训练主题与所述多个待预测主题属于同一主题集;
[0170]
所述处理器801,还用于通过主题预测模型,对所述第一训练对象的对象特征、所述多个第一产品的物料特征以及所述多个训练主题的主题特征进行特征交互处理,得到所述第一训练对象对应的产品交互向量以及所述第一训练对象对应的目标交互向量;
[0171]
所述处理器801,还用于基于所述多个第一产品的物料特征以及所述第一训练对象对应的产品交互向量,确定所述多个第一产品中各个第一产品的产品预测概率,所述各个第一产品的产品预测概率指示:预测得到的所述第一训练对象对所述各个第一产品的偏好程度;
[0172]
所述处理器801,还用于基于所述多个训练主题的主题特征以及所述第一训练对象对应的目标交互向量,确定所述多个训练主题中各个训练主题的主题预测概率,所述各个训练主题的主题预测概率指示:预测得到的所述第一训练对象对所述各个训练主题的偏好程度;
[0173]
所述处理器801,还用于基于所述各个第一产品的产品偏好标签、所述各个训练主题的主题偏好标签、所述各个第一产品的产品预测概率以及所述各个训练主题的主题预测概率,对所述主题预测模型进行训练,得到所述训练后的主题预测模型。
[0174]
在一个实施例中,所述主题预测模型是基于辅助网络、选择注意力机制模块以及主题网络构建的;
[0175]
所述处理器801通过主题预测模型,对所述第一训练对象的对象特征、所述多个第一产品的物料特征以及所述多个训练主题的主题特征进行特征交互处理,得到所述第一训练对象对应的产品交互向量以及所述第一训练对象对应的目标交互向量时,具体执行如下操作:
[0176]
通过所述辅助网络对所述多个第一产品的物料特征以及所述第一训练对象的对象特征进行特征提取处理,得到所述第一训练对象对应的第一特征表示向量;
[0177]
通过所述主题网络对所述多个训练主题的主题特征以及所述第一训练对象的对象特征进行特征提取处理,得到所述第一训练对象对应的第二特征表示向量;
[0178]
通过所述选择注意力机制模块对所述第一训练对象的对象特征进行特征提取处理,得到所述第一训练对象对应的对象特征表示向量;对所述第一训练对象对应的第一特
征表示向量以及所述第一训练对象对应的对象特征表示向量进行注意力交互处理,得到所述第一训练对象对应的产品交互向量;对所述第一训练对象对应的第一特征表示向量以及所述第一训练对象对应的第二特征表示向量进行注意力交互处理,得到所述第一训练对象对应的辅助交互向量;以及对所述第一训练对象对应的第二特征表示向量以及所述第一训练对象对应的对象特征表示向量进行注意力交互处理,得到所述第一训练对象对应的主题交互向量;并将所述第一训练对象对应的辅助交互向量与所述第一训练对象对应的主题交互向量进行组合,得到所述第一训练对象对应的目标交互向量。
[0179]
在一个实施例中,所述主题预测模型是基于辅助网络构建的;
[0180]
所述处理器801基于所述多个第一产品的物料特征以及所述第一训练对象对应的产品交互向量,确定所述多个第一产品中各个第一产品的产品预测概率时,具体执行如下操作:
[0181]
通过所述辅助网络,将对所述多个第一产品的物料特征以及所述第一训练对象的对象特征进行特征提取处理得到的所述第一训练对象对应的第一特征表示向量,与所述第一训练对象对应的产品交互向量进行拼接处理,得到所述第一训练对象对应的产品拼接向量;
[0182]
对所述第一训练对象对应的产品拼接向量进行概率预测处理,得到所述多个第一产品中各个第一产品的产品预测概率。
[0183]
在一个实施例中,所述处理器801基于所述各个第一产品的产品偏好标签、所述各个训练主题的主题偏好标签、所述各个第一产品的产品预测概率以及所述各个训练主题的主题预测概率,对所述主题预测模型进行训练,得到所述训练后的主题预测模型时,具体执行如下操作:
[0184]
基于所述各个第一产品的产品偏好标签以及所述各个第一产品的产品预测概率,确定第一损失函数的函数值;
[0185]
基于所述各个训练主题的主题偏好标签以及所述各个训练主题的主题预测概率,确定第二损失函数的函数值;
[0186]
基于所述第一损失函数的函数值以及所述第二损失函数的函数值,确定目标损失函数的函数值;
[0187]
基于所述目标损失函数的函数值,对所述主题预测模型进行训练,得到所述训练后的主题预测模型。
[0188]
在一个实施例中,所述主题预测模型是基于辅助网络、选择注意力机制模块以及主题网络构建的,所述辅助网络以及所述选择注意力机制模块是基于对初始辅助网络以及初始选择注意力机制模块进行训练得到的;
[0189]
所述输入接口802,还用于获取第二训练样本,所述第二训练样本包括第二训练对象的对象特征、所述第二训练对象所关注的多个第二产品的物料特征以及所述多个第二产品中各个第二产品的产品偏好标签,所述多个第二产品与所述目标产品属于同一产品集;
[0190]
所述处理器801,还用于通过所述初始辅助网络以及所述初始选择注意力机制模块,对所述第二训练对象的对象特征以及所述多个第二产品的物料特征进行特征交互处理,得到所述第二训练对象对应的产品交互向量;
[0191]
所述处理器801,还用于基于所述多个第二产品的物料特征以及所述第二训练对
象对应的产品交互向量,确定所述多个第二产品中各个第二产品的产品预测概率,所述各个第二产品的产品预测概率指示:预测得到的所述第二训练对象对所述各个第二产品的偏好程度;
[0192]
所述处理器801,还用于基于所述各个第二产品的产品偏好标签以及所述各个第二产品的产品预测概率,对所述初始辅助网络以及所述初始选择注意力机制模块进行训练,得到所述辅助网络以及所述选择注意力机制模块。
[0193]
本技术实施例提供了一种计算机程序产品或计算机程序,计算机程序产品包括计算机程序,该计算机程序存储在计算机存储介质中;主题预测设备的处理器从计算机存储介质中读取该计算机程序,处理器执行该计算机程序,使得主题预测设备执行上述如图2以及图4所示的方法实施例。其中,计算机可读存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)或随机存储记忆体(random access memory,ram)等。
[0194]
以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。
技术特征:
1.一种主题预测方法,其特征在于,包括:通过训练后的主题预测模型,对目标对象的对象特征、所述目标对象所关注的目标产品的物料特征以及预估的所述目标对象所关注的多个待预测主题的主题特征进行特征交互处理,得到所述目标对象对应的目标交互向量;基于所述多个待预测主题的主题特征以及所述目标对象对应的目标交互向量,确定所述多个待预测主题中各个待预测主题的主题预测概率,所述各个待预测主题的主题预测概率指示:预测得到的所述目标对象对所述各个待预测主题的偏好程度;基于所述各个待预测主题的主题预测概率,将所述多个待预测主题中的目标待预测主题确定为所述目标对象所偏好的主题,所述目标待预测主题的主题预测概率大于所述多个待预测主题中除所述目标待预测主题以外的其他待预测主题的主题预测概率。2.如权利要求1所述的方法,其特征在于,所述训练后的主题预测模型是基于训练后的辅助网络、训练后的选择注意力机制模块以及训练后的主题网络构建的;所述通过训练后的主题预测模型,对目标对象的对象特征、所述目标对象所关注的目标产品的物料特征以及预估的所述目标对象所关注的多个待预测主题的主题特征进行特征交互处理,得到所述目标对象对应的目标交互向量,包括:通过所述训练后的辅助网络对所述目标产品的物料特征以及所述目标对象的对象特征进行特征提取处理,得到所述目标对象对应的第一特征表示向量;通过所述训练后的主题网络对所述多个待预测主题的主题特征以及所述目标对象的对象特征进行特征提取处理,得到所述目标对象对应的第二特征表示向量;通过所述训练后的选择注意力机制模块对所述目标对象的对象特征进行特征提取处理,得到所述目标对象对应的对象特征表示向量;对所述目标对象对应的第一特征表示向量以及所述目标对象对应的第二特征表示向量进行注意力交互处理,得到所述目标对象对应的辅助交互向量;以及对所述目标对象对应的第二特征表示向量以及所述目标对象对应的对象特征表示向量进行注意力交互处理,得到所述目标对象对应的主题交互向量;并将所述目标对象对应的辅助交互向量与所述目标对象对应的主题交互向量进行组合,得到所述目标对象对应的目标交互向量。3.如权利要求1所述的方法,其特征在于,所述训练后的主题预测模型是基于训练后的主题网络构建的;所述基于所述多个待预测主题的主题特征以及所述目标对象对应的目标交互向量,确定所述多个待预测主题中各个待预测主题的主题预测概率,包括:通过所述训练后的主题网络,将对所述多个待预测主题的主题特征以及所述目标对象的对象特征进行特征提取处理得到的所述目标对象对应的第二特征表示向量,与所述目标对象对应的目标交互向量进行拼接处理,得到所述目标对象对应的主题拼接向量;对所述目标对象对应的主题拼接向量进行概率预测处理,得到所述多个待预测主题中各个待预测主题的主题预测概率。4.如权利要求1所述的方法,其特征在于,所述方法还包括:获取第一训练样本,所述第一训练样本包括第一训练对象的对象特征、所述第一训练对象所关注的多个第一产品的物料特征、所述第一训练对象所关注的多个训练主题的主题特征、所述多个第一产品中各个第一产品的产品偏好标签以及所述多个训练主题中各个训
练主题的主题偏好标签,所述多个第一产品与所述目标产品属于同一产品集,所述多个训练主题与所述多个待预测主题属于同一主题集;通过主题预测模型,对所述第一训练对象的对象特征、所述多个第一产品的物料特征以及所述多个训练主题的主题特征进行特征交互处理,得到所述第一训练对象对应的产品交互向量以及所述第一训练对象对应的目标交互向量;基于所述多个第一产品的物料特征以及所述第一训练对象对应的产品交互向量,确定所述多个第一产品中各个第一产品的产品预测概率,所述各个第一产品的产品预测概率指示:预测得到的所述第一训练对象对所述各个第一产品的偏好程度;基于所述多个训练主题的主题特征以及所述第一训练对象对应的目标交互向量,确定所述多个训练主题中各个训练主题的主题预测概率,所述各个训练主题的主题预测概率指示:预测得到的所述第一训练对象对所述各个训练主题的偏好程度;基于所述各个第一产品的产品偏好标签、所述各个训练主题的主题偏好标签、所述各个第一产品的产品预测概率以及所述各个训练主题的主题预测概率,对所述主题预测模型进行训练,得到所述训练后的主题预测模型。5.如权利要求4所述的方法,其特征在于,所述主题预测模型是基于辅助网络、选择注意力机制模块以及主题网络构建的;所述通过主题预测模型,对所述第一训练对象的对象特征、所述多个第一产品的物料特征以及所述多个训练主题的主题特征进行特征交互处理,得到所述第一训练对象对应的产品交互向量以及所述第一训练对象对应的目标交互向量,包括:通过所述辅助网络对所述多个第一产品的物料特征以及所述第一训练对象的对象特征进行特征提取处理,得到所述第一训练对象对应的第一特征表示向量;通过所述主题网络对所述多个训练主题的主题特征以及所述第一训练对象的对象特征进行特征提取处理,得到所述第一训练对象对应的第二特征表示向量;通过所述选择注意力机制模块对所述第一训练对象的对象特征进行特征提取处理,得到所述第一训练对象对应的对象特征表示向量;对所述第一训练对象对应的第一特征表示向量以及所述第一训练对象对应的对象特征表示向量进行注意力交互处理,得到所述第一训练对象对应的产品交互向量;对所述第一训练对象对应的第一特征表示向量以及所述第一训练对象对应的第二特征表示向量进行注意力交互处理,得到所述第一训练对象对应的辅助交互向量;以及对所述第一训练对象对应的第二特征表示向量以及所述第一训练对象对应的对象特征表示向量进行注意力交互处理,得到所述第一训练对象对应的主题交互向量;并将所述第一训练对象对应的辅助交互向量与所述第一训练对象对应的主题交互向量进行组合,得到所述第一训练对象对应的目标交互向量。6.如权利要求4所述的方法,其特征在于,所述主题预测模型是基于辅助网络构建的;所述基于所述多个第一产品的物料特征以及所述第一训练对象对应的产品交互向量,确定所述多个第一产品中各个第一产品的产品预测概率,包括:通过所述辅助网络,将对所述多个第一产品的物料特征以及所述第一训练对象的对象特征进行特征提取处理得到的所述第一训练对象对应的第一特征表示向量,与所述第一训练对象对应的产品交互向量进行拼接处理,得到所述第一训练对象对应的产品拼接向量;对所述第一训练对象对应的产品拼接向量进行概率预测处理,得到所述多个第一产品
中各个第一产品的产品预测概率。7.如权利要求4所述的方法,其特征在于,所述基于所述各个第一产品的产品偏好标签、所述各个训练主题的主题偏好标签、所述各个第一产品的产品预测概率以及所述各个训练主题的主题预测概率,对所述主题预测模型进行训练,得到所述训练后的主题预测模型,包括:基于所述各个第一产品的产品偏好标签以及所述各个第一产品的产品预测概率,确定第一损失函数的函数值;基于所述各个训练主题的主题偏好标签以及所述各个训练主题的主题预测概率,确定第二损失函数的函数值;基于所述第一损失函数的函数值以及所述第二损失函数的函数值,确定目标损失函数的函数值;基于所述目标损失函数的函数值,对所述主题预测模型进行训练,得到所述训练后的主题预测模型。8.如权利要求4所述的方法,其特征在于,所述主题预测模型是基于辅助网络、选择注意力机制模块以及主题网络构建的,所述辅助网络以及所述选择注意力机制模块是基于对初始辅助网络以及初始选择注意力机制模块进行训练得到的;所述方法还包括:获取第二训练样本,所述第二训练样本包括第二训练对象的对象特征、所述第二训练对象所关注的多个第二产品的物料特征以及所述多个第二产品中各个第二产品的产品偏好标签,所述多个第二产品与所述目标产品属于同一产品集;通过所述初始辅助网络以及所述初始选择注意力机制模块,对所述第二训练对象的对象特征以及所述多个第二产品的物料特征进行特征交互处理,得到所述第二训练对象对应的产品交互向量;基于所述多个第二产品的物料特征以及所述第二训练对象对应的产品交互向量,确定所述多个第二产品中各个第二产品的产品预测概率,所述各个第二产品的产品预测概率指示:预测得到的所述第二训练对象对所述各个第二产品的偏好程度;基于所述各个第二产品的产品偏好标签以及所述各个第二产品的产品预测概率,对所述初始辅助网络以及所述初始选择注意力机制模块进行训练,得到所述辅助网络以及所述选择注意力机制模块。9.一种主题预测装置,其特征在于,包括:所述主题预测装置包括获取单元以及处理单元,所述获取单元以及所述处理单元用于执行如权利要求1-8任一项所述的主题预测方法。10.一种主题预测设备,其特征在于,所述主题预测设备包括输入接口和输出接口,还包括:处理器,适于实现一条或多条指令;以及,计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由所述处理器加载并执行如权利要求1-8任一项所述的主题预测方法。11.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机程序指令,所述计算机程序指令被处理器执行时,用于执行如权利要求1-8任一项所述的主题预测
方法。12.一种计算机程序产品或计算机程序,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时,用于加载并执行如权利要求1-8任一项所述的主题预测方法。
技术总结
本申请实施例涉及人工智能领域,公开一种主题预测方法包括:通过训练后的主题预测模型,对目标对象的对象特征、目标对象所关注的目标产品的物料特征以及预估的目标对象所关注的多个待预测主题的主题特征进行特征交互处理,得到目标对象对应的目标交互向量;基于多个待预测主题的主题特征以及目标对象对应的目标交互向量,确定多个待预测主题中各个待预测主题的主题预测概率;基于各个待预测主题的主题预测概率,将多个待预测主题中的目标待预测主题确定为目标对象所偏好的主题,目标待预测主题的主题预测概率大于多个待预测主题中除目标待预测主题以外的其他待预测主题的主题预测概率;可从预估的多个待预测主题中确定出目标对象所偏好的主题。定出目标对象所偏好的主题。定出目标对象所偏好的主题。
技术研发人员:张懿 吴伟佳 李羽
受保护的技术使用者:微民保险代理有限公司
技术研发日:2021.11.30
技术公布日:2022/3/8