【专利下载】【专利代理】【商标和版权申请】Tel:18215660330

故障排查方法、装置、存储介质及计算机设备与流程

专利查询10月前  45

【专利下载】【专利代理】【商标和版权申请】Tel:18215660330



1.本发明涉及网络运维技术领域,尤其涉及一种故障排查方法、装置、存储介质及计算机设备。


背景技术:

2.目前,当数据中心出现服务器之间通信异常时,现有的网络故障排查方法一般分为如下4个步骤:
3.步骤1、利用traceroute工具,查找互相通信的服务器之间经过的ip;
4.步骤2、查询步骤1中的ip对应的网络设备;
5.步骤3、利用线下的端口连接表或者网管工具的lldp表,查找步骤2中各网络设备之间的互联接口;
6.步骤4、查询步骤3中的互联接口对应的crc、discard等,并根据查询结果进行故障排查。
7.由上述内容可知,现有的网络故障排查方法需要多个排查工具一起操作,并需要大量的人工查询操作,该过程耗费的时间较长,且操作较为复杂,导致故障排查的准确率较低。


技术实现要素:

8.本发明的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中的网络故障排查方法耗费的时间较长,且操作较为复杂,导致故障排查的准确率较低的技术缺陷。
9.本发明提供了一种故障排查方法,其特征在于,所述方法包括:
10.获取数据包从源地址传输至目标地址的路由追踪结果;
11.基于所述路由追踪结果确定所述数据包从所述源地址传输至所述目标地址时途径的网络设备,并生成相应的网络拓扑图,所述网络拓扑图包含各网络设备之间的端口连接关系,及各端口的指标数据;
12.根据预设的故障指标阈值对所述网络拓扑图中各端口的指标数据进行排查,确定所述网络拓扑图中各端口的指标数据是否异常,并将排查结果进行显示。
13.可选地,所述获取数据包从源地址传输至目标地址的路由追踪结果的步骤之前,还包括:
14.从数据中心交换机处采集网络中所有的交换机信息;
15.利用采集到的所述网络中所有的交换机信息构建网络设备互联信息,并确定所述网络设备互联信息中各个网络设备之间的层级关系。
16.可选地,所述获取数据包从源地址传输至目标地址的路由追踪结果的步骤,包括:
17.接收用户输入的源地址和目标地址;
18.确定与所述源地址对应的服务器中是否安装有远程指令探针;
19.若有,则向所述源地址对应的服务器发送路由追踪指令,所述路由追踪指令用于
供所述源地址对应的服务器中的远程指令探针通过操作系统指令向所述目标地址发送携带有数据包的路由追踪请求,并由所述目标地址对应的服务器操作系统向所述源地址对应的服务器返回路由追踪结果;
20.从所述源地址对应的服务器中获取所述数据包从所述源地址传输至所述目标地址的路由追踪结果。
21.可选地,若确定与所述源地址对应的服务器中未安装远程指令探针,所述方法还包括:
22.通过远程控制指令调用与所述源地址对应的服务器的登录界面;
23.在检测到用户登录所述源地址对应的服务器,并执行向所述目标地址发送携带有数据包的路由追踪请求后,获取所述目标地址对应的服务器返回的所述数据包从所述源地址传输至所述目标地址的路由追踪结果。
24.可选地,基于所述路由追踪结果确定所述数据包从所述源地址传输至所述目标地址时途径的网络设备的步骤,包括:
25.按照所述路由追踪结果中的源地址和目标地址,从数据库中查找与所述源地址对应的服务器的第一接入交换机,以及与所述目标地址对应的服务器的第二接入交换机;
26.按照所述路由追踪结果中的途径地址,从所述数据库中查找所述数据包从所述第一接入交换机传输至所述第二接入交换机时途径的中间交换机;
27.将所述第一接入交换机、所述第二接入交换机以及所述中间交换机作为所述数据包从所述源地址传输至所述目标地址时途径的网络设备。
28.可选地,所述生成相应的网络拓扑图的步骤,包括:
29.在数据库中查找所述数据包从所述源地址传输至所述目标地址时途径的网络设备之间的端口连接关系;
30.获取所述数据包从所述源地址传输至所述目标地址时,各端口的指标数据;
31.根据所述端口连接关系及各端口的指标数据生成对应的网络拓扑图。
32.可选地,所述根据预设的故障指标阈值对所述网络拓扑图中各端口的指标数据进行排查,确定所述网络拓扑图中各端口的指标数据是否异常的步骤,包括:
33.确定与预设查询时段对应的所述网络拓扑图中各端口的指标数据;
34.将预设的故障指标阈值与所述网络拓扑图中各端口的指标数据进行比对,根据比对结果确定所述网络拓扑图中各端口的指标数据是否异常。
35.本发明还提供了一种故障排查装置,包括:
36.结果获取模块,用于获取数据包从源地址传输至目标地址的路由追踪结果;
37.拓扑生成模块,用于基于所述路由追踪结果确定所述数据包从所述源地址传输至所述目标地址时途径的网络设备,并生成相应的网络拓扑图,所述网络拓扑图包含各网络设备之间的端口连接关系,及各端口的指标数据;
38.故障排查模块,用于根据预设的故障指标阈值对所述网络拓扑图中各端口的指标数据进行排查,确定所述网络拓扑图中各端口的指标数据是否异常,并将排查结果进行显示。
39.本发明还提供了一种存储介质,所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任
一项所述故障排查方法的步骤。
40.本发明还提供了一种计算机设备,所述计算机设备中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任一项所述故障排查方法的步骤。
41.从以上技术方案可以看出,本发明实施例具有以下优点:
42.本发明提供的故障排查方法、装置、存储介质及计算机设备,在进行故障排查时,首先可以获取数据包从源地址传输至目标地址的路由追踪结果,然后基于该路由追踪结果来确定数据包从源地址传输至目标地址时途径的网络设备,并生成相应的网络拓扑图,由于网络拓扑图中包含各网络设备之间的端口连接关系,及各端口的指标数据,因此,可以根据预设的故障指标阈值来对网络拓扑图中各端口的指标数据进行排查,以确定网络拓扑图中各端口的指标数据是否异常,并将排查结果进行展示;与现有技术相比,本技术中数据包从源地址传输至目标地址时途径的网络设备、网络拓扑图的生成以及故障排查均可以自动完成,无需人工干预,可快速提升运维效率,降低运维成本,并且,本技术后续可以通过增加采集其他设备指标的方式,来增加故障分析的维度,从而进一步提高本技术的可扩展性。
附图说明
43.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
44.图1为本发明实施例提供的一种故障排查方法的流程示意图;
45.图2为本发明实施例提供的端口指标趋势数据的页面展示图;
46.图3为本发明实施例提供的一种源地址到目标地址的traceroute查询页面展示图;
47.图4为本发明实施例提供的另一种源地址到目标地址的traceroute查询页面展示图;
48.图5为本发明实施例提供的服务器10.224.1.23与服务器10.141.75.37之间的网络拓扑图;
49.图6为本发明实施例提供的一种故障排查装置的结构示意图;
50.图7为本发明实施例提供的一种计算机设备的内部结构示意图。
具体实施方式
51.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
52.目前,现有的网络故障排查方法需要多个排查工具一起操作,并需要大量的人工查询操作,该过程耗费的时间较长,且操作较为复杂,导致故障排查的准确率较低。
53.基于此,本技术提出如下技术方案,具体参加下文所示:
54.在一个实施例中,如图1所示,图1为本发明实施例提供的一种故障排查方法的流程示意图;本发明提供了一种故障排查方法,所述方法可以包括:
55.s110:获取数据包从源地址传输至目标地址的路由追踪结果。
56.本步骤中,当需要对两个服务器之间的通信异常进行具体的故障排查与定位时,可以先获取数据包从源地址传输至目标地址的路由追踪结果,接着根据该路由追踪结果来进行故障排查。
57.需要说明的是,这里的源地址指的是发送数据包的服务器对应的ip地址;这里的目标地址指的是接收数据包的服务器对应的ip地址;这里的路由追踪结果指的是数据包从源地址传输至目标地址的过程中途径的网络设备及其对应的ip地址;可以理解的是,在互联网中,信息的传送是通过互联网中许多段的传输介质和网络设备(如路由器,交换机,服务器,网关等)从一端到达另一端,每一个连接在internet上的网络设备,如主机、路由器、接入服务器等一般情况下都会有一个独立的ip地址。
58.进一步地,本技术在获取数据包从源地址传输至目标地址的路由追踪结果时,可以使用traceroute命令来获取路由追踪结果。可以理解的是,traceroute命令主要是利用icmp协议定位源地址和目标地址之间的所有路由器,通过执行traceroute命令可以知道信息从一端主机到互联网另一端主机走的怎样路径。在linux系统中一般称为traceroute命令,而在ms windows中称之为tracert命令。traceroute命令通过发送小的数据包到目的设备直到其返回,来测量其需要多长时间,输出结果中包括每次测试的时间(ms)、网络设备的名称及其ip地址。
59.例如,当检测到服务器10.224.1.23到服务器10.141.75.37之间有通信异常,需要快速定位网络故障位置时,可以用服务器拓扑展示的输入模块,单独查看服务器所在机房的网络拓扑结构,如查看服务器10.224.1.23与服务器10.141.75.37两台服务器中各自的网络情况。接着,可以在服务器10.224.1.23中执行traceroute命令来获取服务器10.224.1.23与服务器10.141.75.37之间的路由追踪结果,以便根据获取到的路由追踪结果来进行故障排查。
60.s120:基于路由追踪结果确定数据包从源地址传输至目标地址时途径的网络设备,并生成相应的网络拓扑图。
61.本步骤中,通过s110获取到数据包从源地址传输至目标地址的路由追踪结果后,可以根据该路由追踪结果来确定数据包从源地址传输至目标地址时途径的网络设备,并生成网络拓扑图。
62.由上述内容可知,本技术获取到的路由追踪结果中包含有数据包从源地址传输至目标地址的过程中途径的网络设备及其对应的ip地址,因此,当获取到路由追踪结果后,可以根据该路由追踪结果来确定数据包从源地址传输至目标地址时途径的网络设备。并且,系统预先采集获得了网络设备各端口的邻居信息,依据该信息提前构建了网络设备之间的端口互联关系。如此通过路由追踪结果的ip地址对应到网络设备,再由网络设备的端口互联关系共同构建生成了路径拓扑图,接着再结合各个端口的指标数据,即生成了最终附带指标数据的网络拓扑图。
63.可以理解的是,本技术为了构建不同网络设备之间的网络拓扑关系,进而通过数据中心交换机等来获取整个互联网中各个网络设备的连接关系信息,即设备互联信息;并
且,本技术为了构建具有层次感的网络拓扑关系,预先为每一类网络设备在网络拓扑中设置对应的层级,以及各个网络设备之间的层级关系;另外,本技术为了能够分析异常,并查看趋势数据,预先采集各个网络设备的端口对应的历史指标数据和实时指标数据,从而为后续进行故障排查进行数据基础。
64.进一步地,本技术中各个端口的指标数据包括但不限于crc、discard、接收数据包数/字节数、发送数据包数/字节数、接口收发光功率、接口收发速率、接口协商速率,还可以包括cpu利用率、内存利用率、syslog告警、trap告警等,具体可以依据实际情况进行设置,并可以实时更新。
65.s130:根据预设的故障指标阈值对网络拓扑图中各端口的指标数据进行排查,确定网络拓扑图中各端口的指标数据是否异常,并将排查结果进行显示。
66.本步骤中,通过s120确定数据包从源地址传输至目标地址时途径的网络设备,并生成相应的网络拓扑图后,可以根据预设的故障指标阈值对网络拓扑图中各个端口的指标数据进行排查,确定网络拓扑图中各个端口的指标数据是否异常,并将最终的排查结果进行显示。
67.具体地,在判断网络拓扑图中各个端口的端口指标是否异常时,可以根据预设的故障指标阈值来进行判断,而这里的故障指标阈值可以是不同类型的指标数据对应的故障指标阈值,例如针对接口收发光功率、接口收发速率、接口协商速率等指标数据,可以设置与接口收发光功率对应的故障指标阈值、与接口收发速率对应的故障指标阈值,以及与接口协商速率对应的故障指标阈值。
68.当确定不同类型的指标数据对应的故障指标阈值后,可以将该故障指标阈值与对应端口的指标数据进行比对,从而确定网络拓扑图中各端口的指标数据是否异常,并将排查结果进行显示。
69.示意性地,如图2所示,图2为本发明实施例提供的端口指标趋势数据的页面展示图;图2中的端口指标趋势图的横坐标为时间,纵坐标为指标值,通过查看横纵坐标的趋势数据,运维人员可以很清晰地查看某一时间范围内所选定的指标的波动,通过这些波动即可判断异常情况。
70.进一步地,本技术在选择了指标项的前提下,点击网络拓扑图中任意的网络设备与连接,都可以查看网络设备或者连接中包含的端口指标趋势数据,方便对异常影响进行判断。
71.上述实施例中,在进行故障排查时,首先可以获取数据包从源地址传输至目标地址的路由追踪结果,然后基于该路由追踪结果来确定数据包从源地址传输至目标地址时途径的网络设备,并生成相应的网络拓扑图,由于网络拓扑图中包含各网络设备之间的端口连接关系,及各端口的指标数据,因此,可以根据预设的故障指标阈值来对网络拓扑图中各端口的指标数据进行排查,以确定网络拓扑图中各端口的指标数据是否异常,并将排查结果进行展示;与现有技术相比,本技术中数据包从源地址传输至目标地址时途径的网络设备、网络拓扑图的生成以及故障排查均可以自动完成,无需人工干预,可快速提升运维效率,降低运维成本,并且,本技术后续可以通过增加采集其他设备指标的方式,来增加故障分析的维度,从而进一步提高本技术的可扩展性。
72.在一个实施例中,s110获取数据包从源地址传输至目标地址的路由追踪结果的步
骤之前,还可以包括:
73.s101:从数据中心交换机处采集网络中所有的交换机信息。
74.s102:利用采集到的所述网络中所有的交换机信息构建网络设备互联信息,并确定所述网络设备互联信息中各个网络设备之间的层级关系。
75.本实施例中,为了构建不同网络设备之间的网络拓扑关系,可以从数据中心交换机处采集网络中所有的交换机信息,并利用采集到的网络中所有的交换机信息构建网络设备互联信息;并且,本技术为了构建具有层次感的网络拓扑关系,预先为每一类网络设备在网络拓扑中设置对应的层级,并确定网络设备互联信息中各个网络设备之间的层级关系。
76.具体地,本技术中,采集器可以定期通过snmp/cli从数据中心交换机处采集如下交换机信息,并写入相关数据库:
77.i.接入交换机的arp/mac表;
78.ii.所有交换机的接口ip;
79.iii.所有交换机lldp邻居表;
80.iv.所有交换机接口指标,包括:crc、discard、接收数据包数/字节数、发送数据包数/字节数、接口收发光功率、接口收发速率、接口协商速率等。
81.当采集到上述交换机信息后,可以通过arp/mac、lldp、接口ip等数据来构建设备互联信息,并通过前端配置页面,配置每一类网络设备所处的层级,以及各个网络设备之间的层级关系,从而构建具有层次感的网络拓扑关系。
82.在一个实施例中,s110中获取数据包从源地址传输至目标地址的路由追踪结果的步骤,可以包括:
83.s111:接收用户输入的源地址和目标地址。
84.s112:确定与所述源地址对应的服务器中是否安装有远程指令探针。
85.s113:若有,则向所述源地址对应的服务器发送路由追踪指令,所述路由追踪指令用于供所述源地址对应的服务器中的远程指令探针通过操作系统指令向所述目标地址发送携带有数据包的路由追踪请求,并由所述目标地址对应的服务器操作系统向所述源地址对应的服务器返回路由追踪结果。
86.s114:从所述源地址对应的服务器中获取所述数据包从所述源地址传输至所述目标地址的路由追踪结果。
87.本实施例中,在获取数据包从源地址传输至目标地址的路由追踪结果时,首先可以根据用户输入的源地址来确定源地址对应的服务器中是否安装有远程指令探针,若服务器中安装有远程指令探针,则可以向源地址对应的服务器发送路由追踪指令,当源地址对应的服务器中的远程指令探针接收到该路由追踪指令后,可以根据该路由追踪指令向目标地址发送携带有数据包的路由追踪请求,当目标地址对应的服务器操作系统接收到该路由追踪请求后,可以响应于该路由追踪请求,向源地址对应的服务器返回路由追踪结果,接着,系统可以从源地址对应的服务器中获取数据包从所述源地址传输至目标地址的路由追踪结果。
88.在一种具体的实现方式中,本技术为了能够进行traceroute查询,系统可以预先在每一台服务器上安装有远程指令系统,允许其他系统通过远程指令系统调用每一台服务器的指令,并进行汇总操作。接着,本技术可以使用服务器至服务器的traceroute展示的源
地址、目标地址输入模块来输入源地址和目标地址。如图3所示,图3为本发明实施例提供的一种源地址到目标地址的traceroute查询页面展示图,通过该页面展示图中的相应输入框可以输入源地址和目标地址,并点击traceroute查询进行查询操作,进行traceroute查询时,系统会通过部署在每一台服务器上的探针,向源地址对应的服务器请求路由追踪结果,源地址对应的服务器中的探针收到请求后,会向目标地址发送traceroute请求,目标地址对应的服务器根据该traceroute请求返回相应的路由追踪结果,当源地址对应的服务器获得路由追踪结果后,可以通过探针返回给系统,系统再通过路由追踪结果来结合现有的设备连接关系数据,分析路径的网络情况。
89.进一步地,如图3所示,在进行traceroute查询时,还可以输入相应的查询时间和查询指标,以便更为精准的进行故障排查。
90.在一个实施例中,若确定与所述源地址对应的服务器中未安装远程指令探针,所述方法还可以包括:
91.s115:通过远程控制指令调用与所述源地址对应的服务器的登录界面。
92.s116:在检测到用户登录所述源地址对应的服务器,并手动执行向所述目标地址发送携带有数据包的路由追踪请求后,获取所述目标地址对应的服务器返回的所述数据包从所述源地址传输至所述目标地址的路由追踪结果。
93.本实施例中,当源地址对应的服务器中未安装有远程指令探针,本技术可以通过远程控制指令调用与所述源地址对应的服务器的登录界面,用户可以在该登录界面中登录源地址对应的服务器,当系统检测到用户登录源地址对应的服务器,并手动执行向目标地址发送携带有数据包的路由追踪请求后,系统可以获取目标地址对应的服务器返回的路由追踪结果,并根据该路由追踪结果来生成相应的网络拓扑图。
94.具体地,如图4所示,图4为本发明实施例提供的另一种源地址到目标地址的traceroute查询页面展示图;当用户自行登陆到源地址对应的服务器10.224.1.23,并向目标地址对应的服务器10.141.75.37执行路由追踪请求后,可以得到目标地址对应的服务器返回的路由追踪结果,接着,用户可以将该路由追踪结果复制粘贴至图4中的文本框中,当系统获取到路由追踪结果、源地址、目标地址后,可以根据用户点击的查询操作进行traceroute查询,并自动生成traceroute的拓扑路径,以及分析traceroute路径的网络情况。
95.进一步地,如图4所示,在进行traceroute查询时,还可以输入相应的查询时间和查询指标,以便更为精准的进行故障排查。
96.在一个实施例中,s120中基于所述路由追踪结果确定所述数据包从所述源地址传输至所述目标地址时途径的网络设备的步骤,可以包括:
97.s121:按照所述路由追踪结果中的源地址和目标地址,从数据库中查找与所述源地址对应的服务器的第一接入交换机,以及与所述目标地址对应的服务器的第二接入交换机。
98.s122:按照所述路由追踪结果中的途径地址,从所述数据库中查找所述数据包从所述第一接入交换机传输至所述第二接入交换机时途径的中间交换机。
99.s123:将所述第一接入交换机、所述第二接入交换机以及所述中间交换机作为所述数据包从所述源地址传输至所述目标地址时途径的网络设备。
100.本实施例中,当获取到路由追踪结果后,可以将该路由追踪结果录入到分析器中,分析器可以自动按照路由追踪结果中的源地址、目标地址,在“arp/mac”数据库中进行检索,定位出源地址对应的服务器的第一接入交换机,以及目标地址对应的服务器的第二交换机。
101.接着,分析器可以自动按照路由追踪结果中的途经地址,从“接口ip”数据库中查找对应的中间交换机,并依据设备互联信息与设备层级数据,可得出途经的逐跳的所有网络设备,从而生成相应的网络拓扑图。
102.在一个实施例中,s120中生成相应的网络拓扑图的步骤,可以包括:
103.s210:在数据库中查找所述数据包从所述源地址传输至所述目标地址时途径的网络设备之间的端口连接关系。
104.s211:获取所述数据包从所述源地址传输至所述目标地址时,各端口的指标数据。
105.s212:根据所述端口连接关系及各端口的指标数据生成对应的网络拓扑图。
106.本实施例中,当获取到路由追踪结果后,可以将该路由追踪结果录入到分析器中,分析器可以自动按照途经的逐跳的所有网络设备,从“设备互联信息”数据库中查找各个网络设备之间的端口连接关系,并获取数据包从源地址传输至目标地址时,各端口的指标数据,接着根据端口连接关系及各端口的指标数据来生成对应的网络拓扑图。
107.如图5所示,图5为本发明实施例提供的服务器10.224.1.23与服务器10.141.75.37之间的网络拓扑图;图5中,服务器10.224.1.23中的数据包首先经过idc-接入交换机10.204.122.42到达idc-汇聚交换机10.204.122.6,接着数据包分别经过两路中间交换机后到达idc-接入交换机10.204.123.198,最终通过idc-接入交换机10.204.123.198到达服务器10.141.75.37。
108.在一个实施例中,s130中根据预设的故障指标阈值对所述网络拓扑图中各端口的指标数据进行排查,确定所述网络拓扑图中各端口的指标数据是否异常的步骤,可以包括:
109.s131:确定与预设查询时段对应的所述网络拓扑图中各端口的指标数据。
110.s132:将预设的故障指标阈值与所述网络拓扑图中各端口的指标数据进行比对,根据比对结果确定所述网络拓扑图中各端口的指标数据是否异常。
111.本实施例中,当生成网络拓扑图后,可以确定与预设查询时段对应的网络拓扑图中各端口的指标数据,并将预设的故障指标阈值与网络拓扑图中各端口的指标数据进行比对,再根据比对结果来判断网络拓扑图中各端口的指标数据是否异常。
112.例如,运维人员可以定义故障指标阈值,如“crc》=1”、“discard》=1”等,分析器获取到该故障指标阈值后,可以自动将网络拓扑图中所有的链路对应的端口的指标数据与该故障指标阈值进行比对,并将符合故障指标阈值定义条件的线路标红色,方便用户查看。
113.下面对本技术实施例提供的故障排查装置进行描述,下文描述的故障排查装置与上文描述的故障排查方法可相互对应参照。
114.在一个实施例中,如图6所示,图6为本发明实施例提供的一种故障排查装置的结构示意图;本发明还提供了一种故障排查装置,包括结果获取模块210、拓扑生成模块220、故障排查模块230,具体包括如下:
115.结果获取模块210,用于获取数据包从源地址传输至目标地址的路由追踪结果。
116.拓扑生成模块220,用于基于所述路由追踪结果确定所述数据包从所述源地址传
输至所述目标地址时途径的网络设备,并生成相应的网络拓扑图,所述网络拓扑图包含各网络设备之间的端口连接关系,及各端口的指标数据。
117.故障排查模块230,用于根据预设的故障指标阈值对所述网络拓扑图中各端口的指标数据进行排查,确定所述网络拓扑图中各端口的指标数据是否异常,并将排查结果进行显示。
118.上述实施例中,在进行故障排查时,首先可以获取数据包从源地址传输至目标地址的路由追踪结果,然后基于该路由追踪结果来确定数据包从源地址传输至目标地址时途径的网络设备,并生成相应的网络拓扑图,由于网络拓扑图中包含各网络设备之间的端口连接关系,及各端口的指标数据,因此,可以根据预设的故障指标阈值来对网络拓扑图中各端口的指标数据进行排查,以确定网络拓扑图中各端口的指标数据是否异常,并将排查结果进行展示;与现有技术相比,本技术中数据包从源地址传输至目标地址时途径的网络设备、网络拓扑图的生成以及故障排查均可以自动完成,无需人工干预,可快速提升运维效率,降低运维成本,并且,本技术后续可以通过增加采集其他设备指标的方式,来增加故障分析的维度,从而进一步提高本技术的可扩展性。
119.在一个实施例中,所述装置还可以包括:
120.信息获取模块,用于从数据中心交换机处采集网络中所有的交换机信息。
121.层级关系确定模块,用于利用采集到的所述网络中所有的交换机信息构建网络设备互联信息,并确定所述网络设备互联信息中各个网络设备之间的层级关系。
122.在一个实施例中,所述结果获取模块210可以包括:
123.地址接收模块,用于接收用户输入的源地址和目标地址。
124.探针确定模块,用于确定与所述源地址对应的服务器中是否安装有远程指令探针。
125.路由追踪模块,用于若有,则向所述源地址对应的服务器发送路由追踪指令,所述路由追踪指令用于供所述源地址对应的服务器中的远程指令探针通过操作系统指令向所述目标地址发送携带有数据包的路由追踪请求,并由所述目标地址对应的服务器中的操作系统向所述源地址对应的服务器返回路由追踪结果。
126.第一结果获取子模块,用于从所述源地址对应的服务器中获取所述数据包从所述源地址传输至所述目标地址的路由追踪结果。
127.在一个实施例中,若确定与所述源地址对应的服务器中未安装远程指令探针,所述装置还可以包括:
128.登录模块,用于通过远程控制指令调用与所述源地址对应的服务器的登录界面。
129.第二结果获取子模块,用于在检测到用户登录所述源地址对应的服务器,并手动执行向所述目标地址发送携带有数据包的路由追踪请求后,获取所述目标地址对应的服务器返回的所述数据包从所述源地址传输至所述目标地址的路由追踪结果。
130.在一个实施例中,所述拓扑生成模块220可以包括:
131.第一查找模块,用于按照所述路由追踪结果中的源地址和目标地址,从数据库中查找与所述源地址对应的服务器的第一接入交换机,以及与所述目标地址对应的服务器的第二接入交换机。
132.第二查找模块,用于按照所述路由追踪结果中的途径地址,从所述数据库中查找
所述数据包从所述第一接入交换机传输至所述第二接入交换机时途径的中间交换机。
133.设备确定模块,用于将所述第一接入交换机、所述第二接入交换机以及所述中间交换机作为所述数据包从所述源地址传输至所述目标地址时途径的网络设备。
134.在一个实施例中,所述拓扑生成模块220可以包括:
135.第三查找模块,用于在数据库中查找所述数据包从所述源地址传输至所述目标地址时途径的网络设备之间的端口连接关系。
136.指标数据获取模块,用于获取所述数据包从所述源地址传输至所述目标地址时,各端口的指标数据。
137.拓扑生成子模块,用于根据所述端口连接关系及各端口的指标数据生成对应的网络拓扑图。
138.在一个实施例中,所述故障排查模块230可以包括:
139.指标确定模块,用于确定与预设查询时段对应的所述网络拓扑图中各端口的指标数据。
140.指标比对模块,用于将预设的故障指标阈值与所述网络拓扑图中各端口的指标数据进行比对,根据比对结果确定所述网络拓扑图中各端口的指标数据是否异常。
141.在一个实施例中,本发明还提供了一种存储介质,所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任一项所述故障排查方法的步骤。
142.在一个实施例中,本发明还提供了一种计算机设备,所述计算机设备中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任一项所述故障排查方法的步骤。
143.示意性地,如图7所示,图7为本发明实施例提供的一种计算机设备的内部结构示意图,该计算机设备300可以被提供为一服务器。参照图7,计算机设备300包括处理组件302,其进一步包括一个或多个处理器,以及由存储器301所代表的存储器资源,用于存储可由处理组件302的执行的指令,例如应用程序。存储器301中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件302被配置为执行指令,以执行上述任意实施例的故障排查方法。
144.计算机设备300还可以包括一个电源组件303被配置为执行计算机设备300的电源管理,一个有线或无线网络接口304被配置为将计算机设备300连接到网络,和一个输入输出(i/o)接口305。计算机设备300可以操作基于存储在存储器301的操作系统,例如windows server tm、mac os xtm、unix tm、linux tm、free bsdtm或类似。
145.本领域技术人员可以理解,图7中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
146.最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者
设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
147.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
148.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术特征:
1.一种故障排查方法,其特征在于,所述方法包括:获取数据包从源地址传输至目标地址的路由追踪结果;基于所述路由追踪结果确定所述数据包从所述源地址传输至所述目标地址时途径的网络设备,并生成相应的网络拓扑图,所述网络拓扑图包含各网络设备之间的端口连接关系,及各端口的指标数据;根据预设的故障指标阈值对所述网络拓扑图中各端口的指标数据进行排查,确定所述网络拓扑图中各端口的指标数据是否异常,并将排查结果进行显示。2.根据权利要求1所述的故障排查方法,其特征在于,所述获取数据包从源地址传输至目标地址的路由追踪结果的步骤之前,还包括:从数据中心交换机处采集网络中所有的交换机信息;利用采集到的所述网络中所有的交换机信息构建网络设备互联信息,并确定所述网络设备互联信息中各个网络设备之间的层级关系。3.根据权利要求1所述的故障排查方法,其特征在于,所述获取数据包从源地址传输至目标地址的路由追踪结果的步骤,包括:接收用户输入的源地址和目标地址;确定与所述源地址对应的服务器中是否安装有远程指令探针;若有,则向所述源地址对应的服务器发送路由追踪指令,所述路由追踪指令用于供所述源地址对应的服务器中的远程指令探针通过操作系统指令向所述目标地址发送携带有数据包的路由追踪请求,并由所述目标地址对应的服务器操作系统向所述源地址对应的服务器返回路由追踪结果;从所述源地址对应的服务器中获取所述数据包从所述源地址传输至所述目标地址的路由追踪结果。4.根据权利要求3所述的故障排查方法,其特征在于,若确定与所述源地址对应的服务器中未安装远程指令探针,所述方法还包括:通过远程控制指令调用与所述源地址对应的服务器的登录界面;在检测到用户登录所述源地址对应的服务器,并执行向所述目标地址发送携带有数据包的路由追踪请求后,获取所述目标地址对应的服务器返回的所述数据包从所述源地址传输至所述目标地址的路由追踪结果。5.根据权利要求1所述的故障排查方法,其特征在于,基于所述路由追踪结果确定所述数据包从所述源地址传输至所述目标地址时途径的网络设备的步骤,包括:按照所述路由追踪结果中的源地址和目标地址,从数据库中查找与所述源地址对应的服务器的第一接入交换机,以及与所述目标地址对应的服务器的第二接入交换机;按照所述路由追踪结果中的途径地址,从所述数据库中查找所述数据包从所述第一接入交换机传输至所述第二接入交换机时途径的中间交换机;将所述第一接入交换机、所述第二接入交换机以及所述中间交换机作为所述数据包从所述源地址传输至所述目标地址时途径的网络设备。6.根据权利要求1所述的故障排查方法,其特征在于,所述生成相应的网络拓扑图的步骤,包括:在数据库中查找所述数据包从所述源地址传输至所述目标地址时途径的网络设备之
间的端口连接关系;获取所述数据包从所述源地址传输至所述目标地址时,各端口的指标数据;根据所述端口连接关系及各端口的指标数据生成对应的网络拓扑图。7.根据权利要求1所述的故障排查方法,其特征在于,所述根据预设的故障指标阈值对所述网络拓扑图中各端口的指标数据进行排查,确定所述网络拓扑图中各端口的指标数据是否异常的步骤,包括:确定与预设查询时段对应的所述网络拓扑图中各端口的指标数据;将预设的故障指标阈值与所述网络拓扑图中各端口的指标数据进行比对,根据比对结果确定所述网络拓扑图中各端口的指标数据是否异常。8.一种故障排查装置,其特征在于,包括:结果获取模块,用于获取数据包从源地址传输至目标地址的路由追踪结果;拓扑生成模块,用于基于所述路由追踪结果确定所述数据包从所述源地址传输至所述目标地址时途径的网络设备,并生成相应的网络拓扑图,所述网络拓扑图包含各网络设备之间的端口连接关系,及各端口的指标数据;故障排查模块,用于根据预设的故障指标阈值对所述网络拓扑图中各端口的指标数据进行排查,确定所述网络拓扑图中各端口的指标数据是否异常,并将排查结果进行显示。9.一种存储介质,其特征在于:所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项所述故障排查方法的步骤。10.一种计算机设备,其特征在于:所述计算机设备中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项所述故障排查方法的步骤。

技术总结
本发明提供的故障排查方法、装置、存储介质及计算机设备,可以依据获取到的路由追踪结果来确定数据包从源地址传输至目标地址时途径的网络设备,并生成网络拓扑图,由于网络拓扑图中包含各网络设备之间的端口连接关系,及各端口的指标数据,因此,可以根据预设的故障指标阈值来对网络拓扑图中各端口的指标数据进行排查,以确定网络拓扑图中各端口的指标数据是否异常,并将排查结果进行展示;上述过程中,数据包从源地址传输至目标地址时途径的网络设备、网络拓扑图的生成以及故障排查均可以自动完成,无需人工干预,可快速提升运维效率,降低运维成本。降低运维成本。降低运维成本。


技术研发人员:王志伟 吉文海
受保护的技术使用者:唯品会(广州)软件有限公司
技术研发日:2021.12.21
技术公布日:2022/3/8

最新回复(0)