信息推荐方法、装置及存储介质与流程

专利查询2023-1-4  144



1.本技术涉及互联网信息处理技术领域,尤其涉及一种信息推荐方法、装置及存储介质。


背景技术:

2.相关技术中,在进行信息推荐时,信息标签通常为信息内容的描述性标签,并没有考虑用户的兴趣画像标签,用于下游的推荐系统算法中时通常存在偏差;例如,在推荐系统中,可能存在两个信息的描述性标签完全相同,但由于质量不同、内容细节的不同等差异存在,导致受众不同;且在确立的标签体系下,领域内各个信息的标签需要人工标定,成本高,周期长,需要大量领域知识专家,并且由于主观因素,标定过程会有不可避免的偏差;
3.因此,有必要提供一种信息推荐方法、装置及存储介质,从而向目标对象推荐符合其兴趣画像标签的信息,提高待推荐信息的转化率。


技术实现要素:

4.本技术提供了一种信息推荐方法、装置及存储介质,可以向目标对象推荐符合其兴趣画像标签的信息,提高待推荐信息的转化率。
5.一方面,本技术提供了一种信息推荐方法,所述方法包括:
6.基于目标领域的第一信息集以及第二信息集,确定原始标签集中每个原始标签的第一权重;所述原始标签集基于所述第一信息集确定;所述第二信息集为所述目标领域内的对象数据集对应的信息集,所述对象数据集包括至少两个对象的数据;所述至少两个对象包括目标对象;
7.基于所述每个原始标签的第一权重,从所述原始标签集中筛选出有效标签集;所述有效标签集包括目标有效标签;
8.确定所述目标对象对应的目标有效标签以及所述目标有效标签对应的至少两个第一目标信息;
9.确定所述目标有效标签在对应的每个第一目标信息中的第二权重;
10.基于所述每个第一目标信息中所述目标有效标签对应的第一权重以及第二权重,确定所述每个第一目标信息中所述目标有效标签的综合权重;
11.基于所述每个第一目标信息中所述目标有效标签的综合权重,确定所述目标对象的待推荐信息。
12.另一方面提供了一种信息推荐装置,所述装置包括:
13.第一权重确定模块,用于基于目标领域的第一信息集以及第二信息集,确定原始标签集中每个原始标签的第一权重;所述原始标签集基于所述第一信息集确定;所述第二信息集为所述目标领域内的对象数据集对应的信息集,所述对象数据集包括至少两个对象的数据;所述至少两个对象包括目标对象;
14.有效标签集确定模块,用于基于所述每个原始标签的第一权重,从所述原始标签
集中筛选出有效标签集;所述有效标签集包括目标有效标签;
15.第二目标信息确定模块,用于确定所述目标对象对应的目标有效标签以及所述目标有效标签对应的至少两个第一目标信息;
16.第二权重确定模块,用于确定所述目标有效标签在对应的每个第一目标信息中的第二权重;
17.综合权重确定模块,用于基于所述每个第一目标信息中所述目标有效标签对应的第一权重以及第二权重,确定所述每个第一目标信息中所述目标有效标签的综合权重;
18.待推荐信息确定模块,用于基于所述每个第一目标信息中所述目标有效标签的综合权重,确定所述目标对象的待推荐信息。
19.另一方面提供了一种信息推荐设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上所述的信息推荐方法。
20.另一方面提供了一种计算机存储介质,所述计算机存储介质存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由处理器加载并执行以实现如上所述的信息推荐方法。
21.另一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行以实现如上所述的信息推荐方法。
22.本技术提供的信息推荐方法、装置及存储介质,具有如下技术效果:
23.本技术基于目标领域的第一信息集以及第二信息集,确定原始标签集中每个原始标签的第一权重;基于所述每个原始标签的第一权重,从所述原始标签集中筛选出有效标签集;从而可以得到各个对象的兴趣画像标签;确定所述目标对象对应的目标有效标签以及所述目标有效标签对应的至少两个第一目标信息;确定所述目标有效标签在对应的每个第一目标信息中的第二权重;基于所述每个第一目标信息中所述目标有效标签对应的第一权重以及第二权重,确定所述每个第一目标信息中所述目标有效标签的综合权重;基于所述每个第一目标信息中所述目标有效标签的综合权重,确定所述目标对象的待推荐信息;实现了根据目标对象对应的目标有效标签相对于对象数据集的第一权重,以及在各个第一目标信息中的第二权重,确定出每个第一目标信息的综合权重,从而向目标对象推荐符合其兴趣画像标签的信息,提高了待推荐信息的转化率。
附图说明
24.为了更清楚地说明本技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
25.图1是本技术实施例提供的一种信息推荐系统的示意图;
26.图2是本技术实施例提供的一种信息推荐方法的流程示意图;
27.图3是本技术实施例提供的一种确定第二信息集的方法的流程示意图;
28.图4是本技术实施例提供的一种确定所述每个原始标签的第一权重的方法的流程示意图;
29.图5是本技术实施例提供的一种基于排序结果,确定所述有效标签集的方法的流程示意图;
30.图6是本技术实施例提供的一种确定每个第一目标信息中目标有效标签的第二权重的方法的流程示意图;
31.图7是本技术实施例提供的一种确定每个第一目标信息中目标有效标签的综合权重的方法的流程示意图;
32.图8是本技术实施例提供的一种信息推荐方法涉及的有效标签的生成方法的流程示意图;
33.图9是本技术实施例提供的一种区块链系统的结构示意图;
34.图10是本技术实施例提供的区块结构示意图;
35.图11是本技术实施例提供的一种信息推荐装置的结构示意图;
36.图12是本技术实施例提供的一种服务器的结构示意图。
具体实施方式
37.云技术(cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
38.云技术(cloud technology)基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。
39.大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临,大数据也吸引了越来越多的关注,大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。本实施例基于目标领域的第一信息集以及第二信息集等大数据,进行数据分析处理后,实现信息的精准推荐。
40.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。
41.具体地,本技术实施例提供的方案中,相似度计算模型涉及人工智能的机器学习领域。机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。
42.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
43.本实施例涉及的专业术语解释如下:
44.tf-idf(term frequency

inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。tf是词频(term frequency),idf是逆文本频率指数(inverse document frequency)。
45.内容描述性标签:传统的内容标签,包含内容的描述性信息,如类目、要素等。
46.内容兴趣标签:针对内容受众的兴趣构建的标签,不直接表述内容的信息,而是对该内容的受众的兴趣点进行描述。
47.威尔逊置信区间:一种置信区间计算方法,其下界通常用于衡量推荐系统中转化率或点击率的排名得分,同时考虑置信度和转化比例,可以有效避免样本稀疏造成的结果不置信。
48.因子分解机(factorization machines,fm):一种有监督线性模型,将输入的特征映射到隐向量空间后两两求点积后按权重累加输出预测值。
49.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
50.请参阅图1,图1是本技术实施例提供的一种信息推荐系统的示意图,如图1所示,该信息推荐系统可以至少包括服务器01和客户端02。
51.具体的,本技术实施例中,所述服务器01可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。服务器01可以包括有网络通信单元、处理器和存储器等等。具体的,所述服务器01可以用于基于目标领域的第一信息集以及第二信息集,确定原始标签集中每个原始标签的第一权重;以及基于所述每个原始标签的第一权重,从所述原始标签集中筛选出有效标签集;以及确定所述目标对象对应的目标有效标签以及所述目标有效标签对应的至少两个第一目标信息;以及确定所述目标有效标签在对应的每个第一目标信息中的第二权重;以及基
于所述每个第一目标信息中所述目标有效标签对应的第一权重以及第二权重,确定所述每个第一目标信息中所述目标有效标签的综合权重;以及基于所述每个第一目标信息中所述目标有效标签的综合权重,确定所述目标对象的待推荐信息;以及向所述客户端02发送所述待推荐信息。
52.具体的,本技术实施例中,所述客户端02可以包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备、智能音箱、车载终端、智能电视等类型的实体设备,也可以包括运行于实体设备中的软体,例如一些服务商提供给用户的网页页面,也可以为该些服务商提供给用户的应用。具体的,所述客户端02可以用于显示所述待推荐信息。
53.以下介绍本技术的一种信息推荐方法,图2是本技术实施例提供的一种信息推荐方法的流程示意图,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图2所示,所述方法可以包括:
54.s201:基于目标领域的第一信息集以及第二信息集,确定原始标签集中每个原始标签的第一权重;所述原始标签集基于所述第一信息集确定;所述第二信息集为所述目标领域内的对象数据集对应的信息集,所述对象数据集包括至少两个对象的数据;所述至少两个对象包括目标对象。
55.在本技术实施例中,如图3所示,所述基于目标领域的第一信息集以及第二信息集,确定原始标签集中每个原始标签的第一权重之前,所述方法还包括:
56.s301:获取所述目标领域的第一信息集;
57.在本技术实施例中,目标领域可以包括但不限于教育领域、医学领域、美食领域、育儿领域、美妆领域等;第一信息集可以为目标领域内可被推荐、搜索引擎中可被搜索的信息。目标领域可以对应一个应用程序,一个应用程序中可以包括一个或多个目标领域。
58.s303:对所述第一信息集中每个第一信息进行分词处理,得到每个第一信息的单词集;
59.在本技术实施例中,可以对第一信息的标题、文本进行分词处理,得到每个第一信息的单词集。
60.s305:基于所述每个第一信息的单词集,构建原始标签集;
61.在本技术实施例中,所述基于所述每个第一信息的单词集,构建原始标签集可以包括:
62.计算所述单词集中每个单词的词权重;
63.将词权重大于预设阈值的单词确定为原始标签。
64.在本技术实施例中,可以对第一信息的标题、文本进行分词和tf-idf词权重计算,并设定阈值过滤,分词过程将第一信息的文本属性转化为词集合,tf-idf过程计算各词的权重,并按一定的阈值对低权重词进行剔除,保留的高权重词作为第一信息的原始标签,此时的原始标签仍含有大量语义区分性较低的词,且标签不具备在推荐系统和搜索引擎中与所表示内容的相关性权重。
65.s307:获取所述目标领域内的所述对象数据集;
66.在本技术实施例中,对象数据集可以为目标领域内的用户的转化行为对应的数据集。用户的转化行为可以包括但不限于用户对第二信息的点赞、收藏、购买等行为。
67.s309:基于所述对象数据集,确定所述第二信息集。
68.在本技术实施例中,第二信息集为目标领域内的对象数据集对应的信息集,第二信息集可以为所述第一信息集的部分或全部;第二信息集可以为用户的转化行为对应的信息;例如第二信息可以为商品的购买链接,那么用户的转化行为可以为用户的购买行为,对象数据集中可以包括用户购买商品的记录。
69.在本技术实施例中,如图4所示,所述基于目标领域的第一信息集以及第二信息集,确定原始标签集中每个原始标签的第一权重,包括:
70.s20101:确定所述每个原始标签在所述第一信息集中的第一覆盖度以及所述每个原始标签在所述第二信息集中的第二覆盖度;
71.在本技术实施例中,原始标签在所述第一信息集中的第一覆盖度可以为原始标签在所述第一信息集中出现的概率;原始标签在所述第二信息集中的第二覆盖度可以为原始标签在所述第二信息集中出现的概率。
72.s20103:基于所述每个原始标签对应的第一覆盖度与第二覆盖度,确定所述每个原始标签的第一权重。
73.在本技术实施例中,可以将每个原始标签对应的第二覆盖度与第一覆盖度的比值,作为所述每个原始标签的第一权重。
74.在一个具体的实施例中,可以计算原始标签在领域内所有内容上的出现概率(覆盖度),原始标签x的在所有内容上的覆盖度记为p(x);根据推荐和搜索场景内用户的转化行为(如点击、收藏、购买等)记录用户u的所有转化内容的集合s(u),计算原始标签x在内容集合s(u)上的覆盖度记为c(u,x),对于用户u的每一个原始标签x,计算c(u,x)与p(x)的比值记为r(u,x),即为第一权重。
75.s203:基于所述每个原始标签的第一权重,从所述原始标签集中筛选出有效标签集;所述有效标签集包括目标有效标签。
76.在本技术实施例中,如图5所示,所述基于所述每个原始标签的第一权重,从所述原始标签集中筛选出有效标签集,包括:
77.s2031:将所述原始标签集中第一权重大于预设权重阈值的原始标签,确定为候选有效标签集;
78.在本技术实施例中,可以根据实际应用需求,设置预设权重阈值,并根据预设权重阈值对原始标签进行初步筛选。
79.s2033:基于所述候选有效标签集每个候选有效标签对应的第一权重,对所述候选有效标签集中各个候选有效标签进行排序;
80.在本技术实施例中,可以将候选有效标签集中各个候选有效标签按照对应的第一权重由大到小进行排序,得到第一排序结果;也可以将候选有效标签集中各个候选有效标签按照对应的第一权重由小到大进行排序,得到第二排序结果。
81.s2035:基于排序结果,确定所述有效标签集。
82.在本技术实施例中,可以将第一排序结果中排序靠前的预设数量个候选有效标签确定为有效标签;也可以将第二排序结果中排序靠后的预设数量个候选有效标签确定为有
效标签。
83.在本技术实施例中,可以基于预设权重阈值以及排序结果,筛选出有效标签集,从而提高有效标签的语义区分度;且筛选出的有效标签能够准确地表征对应对象的兴趣画像,可以作为对象的兴趣画像标签,从而可以提高推荐信息的转化率。
84.在本技术实施例中,可以将原始标签集中第一权重大于预设权重阈值的原始标签确定为有效标签,或者将原始标签集中原始标签按照第一权重由大到小进行排序,并将排序靠前的预设数量个原始标签确定为有效标签。
85.在本技术实施例中,所述基于所述每个原始标签的第一权重,从所述原始标签集中筛选出有效标签集,包括:
86.基于所述原始标签集每个原始标签对应的第一权重,对所述原始标签集中各个原始标签进行排序;
87.基于排序结果,确定初始有效标签集;
88.将所述初始有效标签集中第一权重大于预设权重阈值的初始有效标签,确定为有效标签,得到有效标签集。
89.在本技术实施例中,可以将原始标签集中各个原始标签按照对应的第一权重由大到小进行排序,得到第一排序结果;也可以将原始标签集中各个原始标签按照对应的第一权重由小到大进行排序,得到第二排序结果。
90.在本技术实施例中,可以将第一排序结果中排序靠前的预设数量个原始标签确定为初始有效标签;也可以将第二排序结果中排序靠后的预设数量个原始标签确定为初始有效标签。
91.在一个具体的实施例中,r(u,x)越大时,领域内容子集s(u)中携带原始标签x概率与领域内容全集相比差异越大,这表明用户u对于携带原始标签x的内容兴趣更强,转化可能性更大,因此对于每个用户u,保留其r(u,x)最大k个原始标签,且每个保留的原始标签x对应的r(u,x)大于阈值t,其中k、t为可调节参数,所有用户保留的原始标签集合具有较强的语义区分性,作为领域内的有效标签。
92.s205:确定所述目标对象对应的目标有效标签以及所述目标有效标签对应的至少两个第一目标信息。
93.在本技术实施例中,当信息为内容时,目标对象对应的目标有效标签即为内容兴趣标签,也可以理解为用户兴趣画像标签;而每个第一目标信息中目标有效标签即为内容描述性标签。目标对象可以为一个或多个,目标对象可以为终端对应的用户。其中,第一目标信息为第一信息集中信息。
94.s207:确定所述目标有效标签在对应的每个第一目标信息中的第二权重。
95.在本技术实施例中,如图6所示,所述确定所述目标有效标签在对应的每个第一目标信息中的第二权重,包括:
96.s2071:确定每个第一目标信息中目标有效标签的曝光数以及转化率;
97.在本技术实施例中,第一目标信息中目标有效标签的曝光数是指展示第一目标信息的终端的数量;第一目标信息中目标有效标签的转化率是指基于该标签对应的第一目标信息,得到的信息转化率,例如转化率可以包括但不限于对第一目标信息对应的商品的点击率、收藏率、购买率等;转化率可以基于曝光数确定,例如,可以根据目标有效标签对应的
第一目标信息的点击数以及曝光数,得到点击率(点击数/曝光数),并将点击率作为转化率。
98.s2073:基于每个第一目标信息中目标有效标签的曝光数以及转化率,得到所述每个第一目标信息对应的威尔逊置信区间下限值;
99.s2075:将所述每个第一目标信息对应的威尔逊置信区间下限值,确定为所述每个第一目标信息中目标有效标签的第二权重。
100.在本技术实施例中,威尔逊置信区间下限值的计算公式如下:
[0101][0102]
其中,为转化率,n为曝光数,z为置信水平,该参数的数值可以根据实际情况进行设置,例如,当曝光数达到一定数量时,可以将z设置为0.95;从而根据上述公式计算得到每个第一目标信息中目标有效标签的第二权重。例如,一件商品曝光100次,有60人点击,这60人具有共同的有效标签,可以计算这件商品对于具有共同标签的人群的吸引力。
[0103]
在一个具体的实施例中,第一目标信息为内容,领域内的用户转化行为的置信区间计算:根据推荐和搜索场景内用户的转化行为(如点击、收藏、购买等),记录每一个可推荐、可搜索内容i的转化的用户集合t(i),按集合中各有效标签x《出现的次数》和《集合t大小》,集合t的大小即为集合中用户数量,即曝光数,从而计算标签x对于内容i的威尔逊置信区间下限,此下限为内容i中标签x的权重。
[0104]
在本技术实施例中,所述确定所述目标有效标签在对应的每个第一目标信息中的第二权重,包括:
[0105]
s20701:基于相似度计算模型,将所述目标有效标签转换成第一特征向量,将所述目标有效标签对应的各个第一目标信息转换成第二特征向量;
[0106]
在本技术实施例中,相似度计算模型可以为因子分解机模型,也可以为深度神经网络(deep neural networks,dnn)模型;当相似度计算模型为因子分解机模型时,可以将目标有效标签的标识(id)转换成第一特征向量,将目标有效标签对应的各个第一目标信息的标识(id)转换成第二特征向量。
[0107]
s20703:计算每个第二特征向量与所述第一特征向量之间的相似度,得到所述目标有效标签在对应的每个第一目标信息中的第二权重。
[0108]
在本技术实施例中,可以将每个第二特征向量对应的相似度,作为所述每个第二特征向量对应的每个第二目标信息中目标有效标签;可以通过计算两个特征向量之间的余弦相似度,得到目标有效标签在对应的每个第一目标信息中的第二权重。
[0109]
s209:基于所述每个第一目标信息中所述目标有效标签对应的第一权重以及第二权重,确定所述每个第一目标信息中所述目标有效标签的综合权重。
[0110]
在本技术实施例中,如图7所示,所述目标有效标签为至少两个,所述基于所述每个第一目标信息中所述目标有效标签对应的第一权重以及第二权重,确定所述每个第一目标信息中所述目标有效标签的综合权重,包括:
[0111]
s2091:计算所述每个第一目标信息中每个目标有效标签对应的第一权重与第二权重的乘积,得到所述每个第一目标信息中每个目标有效标签的初始权重;
[0112]
在本技术实施例中,可以计算每个目标有效标签对应的第一权重与第二权重的乘积,得到每个目标有效标签在对应的第一目标信息中的初始权重。
[0113]
s2093:计算所述每个第一目标信息中各个目标有效标签的初始权重之和,得到所述每个第一目标信息中目标有效标签的综合权重。
[0114]
在本技术实施例中,可以将目标对象和第一目标信息中相同标签对应的权重求乘积,再相加求和得到该标签的综合权重。
[0115]
s2011:基于所述每个第一目标信息中所述目标有效标签的综合权重,确定所述目标对象的待推荐信息。
[0116]
在本技术实施例中,所述基于所述每个第一目标信息中所述目标有效标签的综合权重,确定所述目标对象的待推荐信息,包括:
[0117]
基于所述每个第一目标信息中所述目标有效标签的综合权重,对所述至少两个第一目标信息进行排序,得到排序结果;
[0118]
在本技术实施例中,可以对所述至少两个第一目标信息按照对应的综合权重由大到小进行排序,得到第一排序结果;也可以对所述至少两个第一目标信息按照对应的综合权重由小到大进行排序,得到第二排序结果。
[0119]
基于所述排序结果,确定所述目标对象的待推荐信息。
[0120]
在本技术实施例中,可以将第一排序结果中排序靠前的目标数量个第一目标信息,确定为目标对象的待推荐信息;或者将第二排序结果中排序靠后的目标数量个第一目标信息,确定为目标对象的待推荐信息;其中,目标数量可以为一个,也可以为多个;具体可以根据实际情况进行设置。
[0121]
在本技术实施例中,所述基于所述每个第一目标信息中所述目标有效标签的综合权重,确定所述目标对象的待推荐信息,包括:
[0122]
确定所述目标有效标签的综合权重阈值;
[0123]
将综合权重大于所述综合权重阈值的目标有效标签对应的第一目标信息,确定为所述目标对象的待推荐信息。
[0124]
在本技术实施例中,可以根据综合权重阈值,快速筛选出目标对象的待推荐信息;从而向目标对象进行推荐。
[0125]
在本技术实施例中,所述基于所述每个第一目标信息中所述目标有效标签的综合权重,确定所述目标对象的待推荐信息之后,所述方法还可以包括:
[0126]
向目标对象对应的终端发送所述待推荐信息,以使所述终端显示所述待推荐信息。
[0127]
在本技术实施例中,若目标对象对待推荐信息实施了点击、收藏、购买等转化行为,则确定待推荐信息转化成功。
[0128]
在本说明书实施例中,所述方法还可以包括:
[0129]
基于区块链系统存储目标领域的第一信息集以及第二信息集,所述区块链系统包括多个节点,所述多个节点之间形成点对点网络。
[0130]
在一些实施例中,所述区块链系统可以为图9所示的结构,多个节点之间形成组成的点对点(p2p,peer to peer)网络,p2p协议是一个运行在传输控制协议(tcp,transmission control protocol)协议之上的应用层协议。在区块链系统中,任何机器如
服务器、终端都可以加入而成为节点,节点包括硬件层、中间层、操作系统层和应用层。
[0131]
图9示出的区块链系统中各节点的功能,涉及的功能包括:
[0132]
1)路由,节点具有的基本功能,用于支持节点之间的通信。
[0133]
节点除具有路由功能外,还可以具有以下功能:
[0134]
2)应用,用于部署在区块链中,根据实际业务需求而实现特定业务,记录实现功能相关的数据形成记录数据,在记录数据中携带数字签名以表示任务数据的来源,将记录数据发送到区块链系统中的其他节点,供其他节点在验证记录数据来源以及完整性成功时,将记录数据添加到临时区块中。
[0135]
3)区块链,包括一系列按照产生的先后时间顺序相互接续的区块(block),新区块一旦加入到区块链中就不会再被移除,区块中记录了区块链系统中节点提交的记录数据。
[0136]
在一些实施例中,区块结构(block structure)可以为图10所示的结构,每个区块中包括本区块存储交易记录的哈希值(本区块的哈希值)、以及前一区块的哈希值,各区块通过哈希值连接形成区块链。另外,区块中还可以包括有区块生成时的时间戳等信息。区块链(block chain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了相关的信息,用于验证其信息的有效性(防伪)和生成下一个区块。
[0137]
在一个具体的实施例中,目标领域为教育领域,如图8所示,信息推荐方法涉及的有效标签的生成方法包括:
[0138]
s801:将教育领域中可推荐、可搜索的内容进行分词处理,并基于词权重,筛选得到原始标签;
[0139]
s802:基于教育领域中用户的行为流水(对象数据集),对原始标签进行过滤,得到有效标签;
[0140]
s803:基于每个用户对应的有效标签,构建每个用户的兴趣画像标签;即将有效标签作为用户的兴趣画像标签;
[0141]
s804:基于有效标签以及用户的行为流水,协同生成内容兴趣标签;内容兴趣标签即为用户兴趣画像与内容描述信息的共同标签。
[0142]
本实施例的标签来源于内容的文本信息分词和基于协同用户行为的标签过滤,标签体系的生成不需要人工参与,在数据驱动下即可完成在领域内的有语义区分性的有效标签的抽取和筛选;
[0143]
本实施例针对内容受众的兴趣构建标签,不直接描述内容本身的兴趣,可以更加直接的用于下游的推荐系统;用户兴趣画像的生成来自于用户在领域内的转化行为序列的原始标签,通过计算用户各原始标签权重与大盘均值的差异,在数据驱动下对无意义标签进行过滤;内容标签在选定的标签体系下,通过有监督的用户行为建模或标签置信区间计算的方法,确定各个内容的有效标签,避免认为打标的主观偏差;全过程不需要人工参与,且新标签会在分词阶段被发现,有效的新标签会在用户兴趣画像计算的阶段被保留,从而实现全流程的自动化、例行化扩展和更新。
[0144]
本实施例综合利用在线教育网站沉淀的教育内容和用户行为数据,在无需引入外部预料信息、领域专家知识和人工标注的前提下,通过内容文本分词、用户行为信息协同分析的方法,准确的生成领域内用户兴趣画像和内容兴趣标签。本方案实施成本低,不需要涉
及大量的人力标注工作,同时也避免了传统的依赖人工标注方案的偏差性。本方案所构建的用户兴趣画像和教育领域内容标签,可以有效提升在线教育场景下的推荐系统、搜索引擎的用户使用体验和平台运作效率。
[0145]
由以上本技术实施例提供的技术方案可见,本技术实施例基于目标领域的第一信息集以及第二信息集,确定原始标签集中每个原始标签的第一权重;基于所述每个原始标签的第一权重,从所述原始标签集中筛选出有效标签集;从而可以得到各个对象的兴趣画像标签;确定所述目标对象对应的目标有效标签以及所述目标有效标签对应的至少两个第一目标信息;确定所述目标有效标签在对应的每个第一目标信息中的第二权重;基于所述每个第一目标信息中所述目标有效标签对应的第一权重以及第二权重,确定所述每个第一目标信息中所述目标有效标签的综合权重;基于所述每个第一目标信息中所述目标有效标签的综合权重,确定所述目标对象的待推荐信息;实现了根据目标对象对应的目标有效标签相对于对象数据集的第一权重,以及在各个第一目标信息中的第二权重,确定出每个第一目标信息的综合权重,从而向目标对象推荐符合其兴趣画像标签的信息,提高了待推荐信息的转化率。
[0146]
本技术实施例还提供了一种信息推荐装置,如图11所示,所述装置包括:
[0147]
第一权重确定模块1110,用于基于目标领域的第一信息集以及第二信息集,确定原始标签集中每个原始标签的第一权重;所述原始标签集基于所述第一信息集确定;所述第二信息集为所述目标领域内的对象数据集对应的信息集,所述对象数据集包括至少两个对象的数据;所述至少两个对象包括目标对象;
[0148]
有效标签集确定模块1120,用于基于所述每个原始标签的第一权重,从所述原始标签集中筛选出有效标签集;所述有效标签集包括目标有效标签;
[0149]
第二目标信息确定模块1130,用于确定所述目标对象对应的目标有效标签以及所述目标有效标签对应的至少两个第一目标信息;
[0150]
第二权重确定模块1140,用于确定所述目标有效标签在对应的每个第一目标信息中的第二权重;
[0151]
综合权重确定模块1150,用于基于所述每个第一目标信息中所述目标有效标签对应的第一权重以及第二权重,确定所述每个第一目标信息中所述目标有效标签的综合权重;
[0152]
待推荐信息确定模块1160,用于基于所述每个第一目标信息中所述目标有效标签的综合权重,确定所述目标对象的待推荐信息。
[0153]
在一些实施例中,所述目标有效标签为至少两个,所述综合权重确定模块可以包括:
[0154]
初始权重确定单元,用于计算所述每个第一目标信息中每个目标有效标签对应的第一权重与第二权重的乘积,得到所述每个第一目标信息中每个目标有效标签的初始权重;
[0155]
综合权重确定单元,用于计算所述每个第一目标信息中各个目标有效标签的初始权重之和,得到所述每个第一目标信息中目标有效标签的综合权重。
[0156]
在一些实施例中,所述第一权重确定模块可以包括:
[0157]
第二覆盖度确定单元,用于确定所述每个原始标签在所述第一信息集中的第一覆
盖度以及所述每个原始标签在所述第二信息集中的第二覆盖度;
[0158]
第一权重确定单元,用于基于所述每个原始标签对应的第一覆盖度与第二覆盖度,确定所述每个原始标签的第一权重。
[0159]
在一些实施例中,所述装置还可以包括:
[0160]
第一信息集获取模块,用于获取所述目标领域的第一信息集;
[0161]
单词集确定模块,用于对所述第一信息集中每个第一信息进行分词处理,得到每个第一信息的单词集;
[0162]
原始标签集确定模块,用于基于所述每个第一信息的单词集,构建原始标签集;
[0163]
对象数据集获取模块,用于获取所述目标领域内的所述对象数据集;
[0164]
第二信息集确定模块,用于基于所述对象数据集,确定所述第二信息集。
[0165]
在一些实施例中,所述第二权重确定模块可以包括:
[0166]
转化率确定单元,用于确定每个第一目标信息中目标有效标签的曝光数以及转化率;
[0167]
下限值确定单元,用于基于每个第一目标信息中目标有效标签的曝光数以及转化率,得到所述每个第一目标信息对应的威尔逊置信区间下限值;
[0168]
第二权重确定单元,用于将所述每个第一目标信息对应的威尔逊置信区间下限值,确定为所述每个第一目标信息中目标有效标签的第二权重。
[0169]
在一些实施例中,所述装置还可以包括:
[0170]
向量转换模块,用于基于相似度计算模型,将所述目标有效标签转换成第一特征向量,将所述目标有效标签对应的各个第一目标信息转换成第二特征向量;
[0171]
第二权重确定模块,用于计算每个第二特征向量与所述第一特征向量之间的相似度,得到所述目标有效标签在对应的每个第一目标信息中的第二权重。
[0172]
在一些实施例中,所述有效标签集确定模块可以包括:
[0173]
候选有效标签集确定单元,用于将所述原始标签集中第一权重大于预设权重阈值的原始标签,确定为候选有效标签集;
[0174]
排序单元,用于基于所述候选有效标签集每个候选有效标签对应的第一权重,对所述候选有效标签集中各个候选有效标签进行排序;
[0175]
有效标签集确定单元,用于基于排序结果,确定所述有效标签集。
[0176]
在一些实施例中,所述待推荐信息确定模块可以包括:
[0177]
排序结果确定单元,用于基于所述每个第一目标信息中所述目标有效标签的综合权重,对所述至少两个第一目标信息进行排序,得到排序结果;
[0178]
第一推荐信息确定单元,用于基于所述排序结果,确定所述目标对象的待推荐信息。
[0179]
在一些实施例中,所述待推荐信息确定模块可以包括:
[0180]
综合权重阈值确定单元,用于确定所述目标有效标签的综合权重阈值;
[0181]
第二推荐信息确定单元,用于将综合权重大于所述综合权重阈值的目标有效标签对应的第一目标信息,确定为所述目标对象的待推荐信息。
[0182]
所述的装置实施例中的装置与方法实施例基于同样地发明构思。
[0183]
本技术实施例提供了一种信息推荐设备,该设备包括处理器和存储器,该存储器
中存储有至少一条指令或至少一段程序,该至少一条指令或至少一段程序由该处理器加载并执行以实现如上述方法实施例所提供的信息推荐方法。
[0184]
本技术的实施例还提供了一种计算机存储介质,所述存储介质可设置于终端之中以保存用于实现方法实施例中一种信息推荐方法相关的至少一条指令或至少一段程序,该至少一条指令或至少一段程序由该处理器加载并执行以实现上述方法实施例提供的信息推荐方法。
[0185]
本技术的实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行以实现上述方法实施例提供的信息推荐方法。
[0186]
可选地,在本技术实施例中,存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0187]
本技术实施例所述存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、功能所需的应用程序等;存储数据区可存储根据所述设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。
[0188]
本技术实施例所提供的信息推荐方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例,图12是本技术实施例提供的一种信息推荐方法的服务器的硬件结构框图。如图12所示,该服务器1200可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,cpu)1210(中央处理器1210可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器1230,一个或一个以上存储应用程序1223或数据1222的存储介质1220(例如一个或一个以上海量存储设备)。其中,存储器1230和存储介质1220可以是短暂存储或持久存储。存储在存储介质1220的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1210可以设置为与存储介质1220通信,在服务器1200上执行存储介质1220中的一系列指令操作。服务器1200还可以包括一个或一个以上电源1260,一个或一个以上有线或无线网络接口1250,一个或一个以上输入输出接口1240,和/或,一个或一个以上操作系统1221,例如windows servertm,mac os xtm,unixtm,linuxtm,freebsdtm等等。
[0189]
输入输出接口1240可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器1200的通信供应商提供的无线网络。在一个实例中,输入输出接口1240包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,输入输出接口1240可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
[0190]
本领域普通技术人员可以理解,图12所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,服务器1200还可包括比图12中所示更多或者更少的组件,或者具有与图12所示不同的配置。
[0191]
由上述本技术提供的信息推荐方法、装置、设备或存储介质的实施例可见,本技术基于目标领域的第一信息集以及第二信息集,确定原始标签集中每个原始标签的第一权重;基于所述每个原始标签的第一权重,从所述原始标签集中筛选出有效标签集;从而可以得到各个对象的兴趣画像标签;确定所述目标对象对应的目标有效标签以及所述目标有效标签对应的至少两个第一目标信息;确定所述目标有效标签在对应的每个第一目标信息中的第二权重;基于所述每个第一目标信息中所述目标有效标签对应的第一权重以及第二权重,确定所述每个第一目标信息中所述目标有效标签的综合权重;基于所述每个第一目标信息中所述目标有效标签的综合权重,确定所述目标对象的待推荐信息;实现了根据目标对象对应的目标有效标签相对于对象数据集的第一权重,以及在各个第一目标信息中的第二权重,确定出每个第一目标信息的综合权重,从而向目标对象推荐符合其兴趣画像标签的信息,提高了待推荐信息的转化率。
[0192]
需要说明的是:上述本技术实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0193]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0194]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0195]
以上所述仅为本技术的较佳实施例,并不用以限制本技术,凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。

技术特征:
1.一种信息推荐方法,其特征在于,所述方法包括:基于目标领域的第一信息集以及第二信息集,确定原始标签集中每个原始标签的第一权重;所述原始标签集基于所述第一信息集确定;所述第二信息集为所述目标领域内的对象数据集对应的信息集,所述对象数据集包括至少两个对象的数据;所述至少两个对象包括目标对象;基于所述每个原始标签的第一权重,从所述原始标签集中筛选出有效标签集;所述有效标签集包括目标有效标签;确定所述目标对象对应的目标有效标签以及所述目标有效标签对应的至少两个第二目标信息;确定所述目标有效标签在对应的每个第一目标信息中的第二权重;基于所述每个第一目标信息中所述目标有效标签对应的第一权重以及第二权重,确定所述每个第一目标信息中所述目标有效标签的综合权重;基于所述每个第一目标信息中所述目标有效标签的综合权重,确定所述目标对象的待推荐信息。2.根据权利要求1所述的方法,其特征在于,所述目标有效标签为至少两个,所述基于所述每个第一目标信息中所述目标有效标签对应的第一权重以及第二权重,确定所述每个第一目标信息中所述目标有效标签的综合权重,包括:计算所述每个第一目标信息中每个目标有效标签对应的第一权重与第二权重的乘积,得到所述每个第一目标信息中每个目标有效标签的初始权重;计算所述每个第一目标信息中各个目标有效标签的初始权重之和,得到所述每个第一目标信息中目标有效标签的综合权重。3.根据权利要求1所述的方法,其特征在于,所述基于目标领域的第一信息集以及第二信息集,确定原始标签集中每个原始标签的第一权重,包括:确定所述每个原始标签在所述第一信息集中的第一覆盖度以及所述每个原始标签在所述第二信息集中的第二覆盖度;基于所述每个原始标签对应的第一覆盖度与第二覆盖度,确定所述每个原始标签的第一权重。4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于目标领域的第一信息集以及第二信息集,确定原始标签集中每个原始标签的第一权重之前,所述方法还包括:获取所述目标领域的第一信息集;对所述第一信息集中每个第一信息进行分词处理,得到每个第一信息的单词集;基于所述每个第一信息的单词集,构建原始标签集;获取所述目标领域内的所述对象数据集;基于所述对象数据集,确定所述第二信息集。5.根据权利要求1-3任一项所述的方法,其特征在于,所述确定所述目标有效标签在对应的每个第一目标信息中的第二权重,包括:确定每个第一目标信息中目标有效标签的曝光数以及转化率;基于每个第一目标信息中目标有效标签的曝光数以及转化率,得到所述每个第一目标信息对应的威尔逊置信区间下限值;
将所述每个第一目标信息对应的威尔逊置信区间下限值,确定为所述每个第一目标信息中目标有效标签的第二权重。6.根据权利要求1-3任一项所述的方法,其特征在于,所述确定所述目标有效标签在对应的每个第一目标信息中的第二权重,包括:基于相似度计算模型,将所述目标有效标签转换成第一特征向量,将所述目标有效标签对应的各个第一目标信息转换成第二特征向量;计算每个第二特征向量与所述第一特征向量之间的相似度,得到所述目标有效标签在对应的每个第一目标信息中的第二权重。7.根据权利要求1-3中任一项所述的方法,其特征在于,所述基于所述每个原始标签的第一权重,从所述原始标签集中筛选出有效标签集,包括:将所述原始标签集中第一权重大于预设权重阈值的原始标签,确定为候选有效标签集;基于所述候选有效标签集每个候选有效标签对应的第一权重,对所述候选有效标签集中各个候选有效标签进行排序;基于排序结果,确定所述有效标签集。8.根据权利要求1-3中任一项所述的方法,其特征在于,所述基于所述每个第一目标信息中所述目标有效标签的综合权重,确定所述目标对象的待推荐信息,包括:基于所述每个第一目标信息中所述目标有效标签的综合权重,对所述至少两个第一目标信息进行排序,得到排序结果;基于所述排序结果,确定所述目标对象的待推荐信息。9.根据权利要求1-3中任一项所述的方法,其特征在于,所述基于所述每个第一目标信息中所述目标有效标签的综合权重,确定所述目标对象的待推荐信息,包括:确定所述目标有效标签的综合权重阈值;将综合权重大于所述综合权重阈值的目标有效标签对应的第一目标信息,确定为所述目标对象的待推荐信息。10.一种信息推荐装置,其特征在于,所述装置包括:第一权重确定模块,用于基于目标领域的第一信息集以及第二信息集,确定原始标签集中每个原始标签的第一权重;所述原始标签集基于所述第一信息集确定;所述第二信息集为所述目标领域内的对象数据集对应的信息集,所述对象数据集包括至少两个对象的数据;所述至少两个对象包括目标对象;有效标签集确定模块,用于基于所述每个原始标签的第一权重,从所述原始标签集中筛选出有效标签集;所述有效标签集包括目标有效标签;第二目标信息确定模块,用于确定所述目标对象对应的目标有效标签以及所述目标有效标签对应的至少两个第一目标信息;第二权重确定模块,用于确定所述目标有效标签在对应的每个第一目标信息中的第二权重;综合权重确定模块,用于基于所述每个第一目标信息中所述目标有效标签对应的第一权重以及第二权重,确定所述每个第一目标信息中所述目标有效标签的综合权重;待推荐信息确定模块,用于基于所述每个第一目标信息中所述目标有效标签的综合权
重,确定所述目标对象的待推荐信息。11.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1-9任一所述的信息推荐方法。12.一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被处理器执行时实现如权利要求1-9任一所述的信息推荐方法。

技术总结
本申请公开了一种信息推荐方法、装置及存储介质,可以应用于云技术、人工智能、智慧交通、车联网等各种场景,所述方法包括:基于目标领域的第一信息集以及第二信息集,确定原始标签集中每个原始标签的第一权重;从原始标签集中筛选出有效标签集;确定目标对象对应的目标有效标签以及目标有效标签对应的至少两个第一目标信息;确定目标有效标签在对应的每个第一目标信息中的第二权重;基于每个第一目标信息中目标有效标签对应的第一权重以及第二权重,确定每个第一目标信息中目标有效标签的综合权重;最后确定目标对象的待推荐信息;本申请实现了信息的精准推荐,提高了待推荐信息的转化率。转化率。转化率。


技术研发人员:王丹磊
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2021.12.03
技术公布日:2022/3/8

最新回复(0)