本技术涉及网络通信,尤其涉及一种终端漫游引导方法、装置、电子设备及存储介质。
背景技术:
1、在无线通信网络中,在无线通信网络中,无线访问接入点(英文:access point,缩写:ap)设备的信号覆盖范围内,终端设备可一直保持网络通讯。但由于单个ap设备的信号覆盖范围都是有限的,因此终端设备在移动的过程中,通常会出现从一个ap的服务区跨越到另一个ap的服务区的情况。
2、为了避免终端设备在不同的ap之间切换时,终端设备的网络通讯发生中断,因此,在终端设备上引入了无线漫游技术,其中,无线漫游就是指终端设备在移动到两个ap覆盖范围的临界区域时,该终端设备与新的ap进行关联并与原有ap断开关联,且在此过程中,保持不间断的网络连接。这种无线漫游方式必须是由终端设备主动发起的。
3、然而对于有些漫游主动性较差的终端设备(例如,低端的手机和平板等),它们会坚持在最初关联的ap上,即使随着终端设备的移动,与最初关联的ap距离很远、信号很弱,还是不会漫游到信号好的ap上去。这类终端设备被称为粘性终端设备。
4、针对这类粘性终端设备,依靠终端设备主动漫游是无法解决的。在这种情况下,智能漫游方式的出现,很好地解决了这一类问题。它能够以终端设备理解的方式引导该终端设备进行漫游,相较于终端设备主动漫游而言,这种方式更加智能化。
5、目前,采取智能漫游的方式引导终端设备进行漫游,主要是通过在ap侧配置触发终端设备漫游的阈值,当ap检测到终端设备的参数(例如,信噪比或通信速率)低于该阈值时,ap会主动向该终端设备发送解除关联报文,使该终端设备关联到信号更好、通信速率更快的ap上。然而,不同类型的终端设备,甚至同一类型下的不同终端设备均会存在网络通信能力的差异性,因此,在触发阶段过程中,不同类型的终端设备,甚至同一类型下的不同终端设备触发漫游的阈值是不一样的。若采用设置阈值方式来引导终端设备漫游,阈值设定较为关键,固定阈值确定过程相对简单,但漫游效果不好,阈值可变的话,确定过程则较为复杂,因此,这种设置阈值引导终端设备漫游的方式适用性较低。
技术实现思路
1、本技术提供了一种终端漫游引导方法,用以提高终端设备漫游时的适用性。
2、第一方面,提供一种终端漫游引导方法,包括:
3、获取目标终端在第一目标漫游策略下的历史漫游数据,并根据所述历史漫游数据确定所述目标终端的漫游评估结果;其中,所述第一目标漫游策略是所述目标终端进入ap网络环境中时所分配的漫游策略;若所述漫游评估结果不符合期望要求,则调节所述第一目标漫游策略中的策略参数直至符合所述期望要求,得到所述目标终端的第二目标漫游策略;根据所述第二目标漫游策略,引导所述目标终端漫游到所述ap网络环境中的目标ap。
4、可选的,所述ap网络环境中包括n个ap,以及终端画像库,所述终端画像库中包括至少一种终端各自在所述n个ap中的漫游策略,所述n为大于0的整数;所述获取目标终端在第一目标漫游策略下的历史漫游数据之前,还包括:
5、识别所述目标终端所属的终端类型,若根据所述目标终端所属的终端类型,在所述终端画像库中找到与所述终端类型相匹配的第一终端,则将所述第一终端在所述n个ap中当前关联的第一ap的漫游策略作为所述目标终端的第一目标漫游策略;若根据所述目标终端所属的终端类型,在所述终端画像库中未找到与所述终端类型相匹配的第一终端,则根据所述ap网络环境中所述n个ap的互扫信息和所述目标终端的漫游信息,确定所述目标终端的初始漫游策略,将所述目标终端的初始漫游策略作为所述目标终端的第一目标漫游策略。
6、本技术实施例中,基于构建的终端画像库,使新入网的目标终端能够复用同类型终端的漫游策略,提高了漫游的快速性。
7、可选的,所述方法,还包括:
8、获取所述ap网络环境中n个ap的网络信息,所述n为大于0的整数;根据所述n个ap的网络信息,确定所述ap网络环境的网络环境特征;根据所述ap网络环境的网络环境特征,构建所述ap网络环境的ap网络画像,并存储至网络画像库中。
9、本技术实施例中,通过构建上述网络画像库可将各种ap网络环境进行归纳和区分,当后续在构建新ap网络环境时,能够基于该网络画像库复用相似ap网络环境的漫游策略,因此可以省略重新制定漫游策略的过程,优化了漫游体验。
10、可选的,根据所述n个ap的网络信息,确定所述ap网络环境的网络环境特征,包括:
11、根据所述n个ap的网络信息中的覆盖信息,确定所述ap网络环境的网络环境特征;或者根据所述n个ap的网络信息中的分布信息,确定所述ap网络环境的网络环境特征;或者根据所述n个ap的网络信息中的抖降点区域,确定所述ap网络环境的网络环境特征。
12、本技术实施例中,可从多个维度进行提取ap网络环境中的网络环境特征,使后续构建的网络画像库更具准确性。
13、可选的,所述方法还包括:
14、获取新ap网络环境中m个ap的互扫信息,所述m为大于0的整数;根据所述m个ap的互扫信息,对所述m个ap进行重要度排序;根据所述重要度排序中所述m个ap各自的互扫信号强度值,构建所述新ap网络环境的互扫矩阵;根据所述新ap网络环境的互扫矩阵,生成所述新ap网络环境的新ap网络画像;若所述新ap网络环境的新ap网络画像,与所述网络画像库中所述ap网络环境的ap网络画像满足相似度要求,则将所述ap网络环境中的终端画像库复用给所述新ap网络环境。
15、本技术实施例中,在构建ap网络环境时,可基于该网络画像库实现快速冷启动。
16、可选的,所述调节所述第一目标漫游策略中的策略参数直至符合所述期望要求,包括:
17、基于所述目标终端在的第一漫游状态下,执行选定的第一漫游动作后,得到期望奖励以及下一时刻的第二漫游状态;根据q函数,确定所述目标终端在所述第二漫游状态下执行的第二漫游动作;根据所述第二漫游状态、所述第二漫游动作,以及所述期望奖励,更新所述q函数,直至更新后的q函数符合所述期望要求;其中,所述q函数满足以下表达式:q(s,a)=q(s,a)+α(r+γq(s′,a′)-q(s,a));所述s为所述第一漫游状态,所述a为所述第一漫游动作,所述r为所述期望奖励,所述α为设定的学习率,所述γ为设定的折扣率,所述s’为所述第二漫游状态,所述a’为所述第二漫游动作。
18、第二方面,提供一种终端漫游引导装置,包括:
19、评估模块,用于获取目标终端在第一目标漫游策略的历史漫游数据,并根据所述历史漫游数据确定所述目标终端的漫游评估结果;其中,所述第一目标漫游策略是所述目标终端进入ap网络环境中时所分配的漫游策略;调节模块,用于若所述漫游评估结果不符合期望要求,则调节所述第一目标漫游策略中的策略参数直至符合所述期望要求,得到所述目标终端的第二目标漫游策略;引导模块,用于根据所述第二目标漫游策略,引导所述目标终端漫游到所述ap网络环境中的目标ap。
20、可选的,所述ap网络环境中包括n个ap,以及终端画像库,所述终端画像库中包括至少一种终端各自在所述n个ap中的漫游策略,所述n为大于0的整数;所述装置还包括分配模块;所述分配模块,具体用于:
21、识别所述目标终端所属的终端类型;若根据所述目标终端所属的终端类型,在所述终端画像库中找到与所述终端类型相匹配的第一终端,则将所述第一终端在所述n个ap中当前关联的第一ap的漫游策略作为所述目标终端的第一目标漫游策略;若根据所述目标终端所属的终端类型,在所述终端画像库中未找到与所述终端类型相匹配的第一终端,则根据所述ap网络环境中所述n个ap的互扫信息和所述目标终端的漫游信息,确定所述目标终端的初始漫游策略,将所述目标终端的初始漫游策略作为所述目标终端的第一目标漫游策略。
22、可选的,所述装置还包括网络图像构建模块;所述网络图像构建模块,用于获取所述ap网络环境中n个ap的网络信息,所述n为大于0的整数;根据所述n个ap的网络信息,确定所述ap网络环境的网络环境特征;根据所述ap网络环境的网络环境特征,构建所述ap网络环境的ap网络画像,并存储至网络画像库中。
23、可选的,所述网络图像构建模块,具体用于:
24、根据所述n个ap的网络信息中的覆盖信息,确定所述ap网络环境的网络环境特征;或者根据所述n个ap的网络信息中的分布信息,确定所述ap网络环境的网络环境特征;或者根据所述n个ap的网络信息中的抖降点区域,确定所述ap网络环境的网络环境特征。
25、可选的,所述网络图像构建模块,还用于:获取新ap网络环境中m个ap的互扫信息,所述m为大于0的整数;根据所述m个ap的互扫信息,对所述m个ap进行重要度排序;根据所述重要度排序中所述m个ap各自的互扫信号强度值,构建所述新ap网络环境的互扫矩阵;根据所述新ap网络环境的互扫矩阵,生成所述新ap网络环境的新ap网络画像;若所述新ap网络环境的新ap网络画像,与所述网络画像库中所述ap网络环境的ap网络画像满足相似度要求,则将所述ap网络环境的终端画像库复用给所述新ap网络环境。
26、第三方面,提供一种电子设备,包括:
27、存储器,用于存放计算机程序;处理器,用于执行所述存储器上所存放的计算机程序时,实现第一方面中任一项所述的方法步骤。
28、第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面中任一项中所述的方法步骤。
29、本技术实施例中,由于获取目标终端在该第一目标漫游策略的历史漫游数据进行分析,该第一目标漫游策略是该目标终端进入ap网络环境中时所分配的漫游策略,确定该目标终端采用该第一目标漫游策略进行漫游是否符合期望要求,若不符合,则对该第一目标漫游策略中的策略参数进行调优后,再引导目标终端进行漫游,因此相较于采用阈值方式来引导终端设备漫游,考虑到了不同终端设备之间的差异性,可以在漫游过程中针对不同的终端设备所采用的漫游策略进行适应性调整,使漫游收益最大化,从而提高了终端设备漫游时的适用性。
30、上述第二方面至第四方面中的各个方面以及各个方面可能达到的技术效果请参照上述针对第一方面或第一方面中的各种可能方案可以达到的技术效果说明,这里不再重复赘述。
1.一种终端漫游引导方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述ap网络环境中包括n个ap,以及终端画像库,所述终端画像库中包括至少一种终端各自在所述n个ap中的漫游策略,所述n为大于0的整数;
3.如权利要求1所述的方法,其特征在于,所述方法,还包括:
4.如权利要求3所述的方法,其特征在于,所述根据所述n个ap的网络信息,确定所述ap网络环境的网络环境特征,包括:
5.如权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:
6.如权利要求1至4任一所述的方法,其特征在于,所述调节所述第一目标漫游策略中的策略参数直至符合所述期望要求,包括:
7.一种终端漫游引导装置,其特征在于,包括:
8.如权利要求7所述的装置,其特征在于,所述ap网络环境中包括n个ap,以及终端画像库,所述终端画像库中包括至少一种终端各自在所述n个ap中的漫游策略,所述n为大于0的整数;所述装置还包括分配模块;所述分配模块,具体用于:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6中任一项中所述的方法步骤。
