本技术涉及运维管理,尤其是涉及一种基于知识图谱的自动化运维管理系统及方法。
背景技术:
1、现代系统日益复杂,涉及多种技术栈和大量的设备与服务,在这样的背景下,传统的运维管理面临着效率低下和响应时间长等挑战,基于知识图谱的自动化运维管理技术能够有效减少运维过程中的人工干预,提高运维工作的自动化程度,进而保障系统稳定性。
2、但现有基于知识图谱的自动化运维管理技术依赖于基于大量现有运维资料构建的知识图谱,该知识图谱随着系统规模和运行时间的增长,存在数据冗余和缺乏对新威胁或漏洞的快速响应能力的问题,导致系统安全风险增加,难以维持良好的系统稳定性。
技术实现思路
1、本技术提供一种基于知识图谱的自动化运维管理系统及方法,以解决上述技术问题。
2、第一方面,本技术提供一种基于知识图谱的自动化运维管理方法,所述方法包括:
3、获取运维资料,根据所述运维资料,构建预留节点型通用知识图谱;
4、获取故障检测信息,分析所述故障检测信息和所述预留节点型通用知识图谱,确定事件驱动型自生长节点;
5、获取性能监测信息,分析所述性能监测信息和所述预留节点型通用知识图谱,确定周期驱动型自生长节点;
6、基于所述预留节点型通用知识图谱,根据所述事件驱动型自生长节点和所述周期驱动型自生长节点,构建系统适应型知识图谱;
7、获取持续运行信息,根据所述持续运行信息,对所述事件驱动型自生长节点和所述周期驱动型自生长节点进行浮动调整,确定高适应型知识图谱;
8、根据所述高适应型知识图谱,实施自动化运维措施,并输出运维报告。
9、通过本方案,根据运维资料,构建预留节点型通用知识图谱,为后续对知识图谱的变化和扩展提供基础框架,通过分析故障检测信息,构建事件驱动型自生长节点,提高自动化运维工作对不同系统故障的适应性,通过分析性能监测信息,构建周期驱动型自生长节点,使自动化运维工作可以根据周期驱动型自生长节点对系统进行精准的周期性调优,根据事件驱动型自生长节点和周期驱动型自生长节点,构建系统适应型知识图谱,自动完成知识图谱的更新和迭代,为基于知识图谱的自动化运维工作在多变的系统运维需求中保持稳定和高效,根据持续运行信息,对知识图谱进行进一步调整,得到高适应型知识图谱,提高知识图谱与系统个性化运维需求的匹配程度,进而提高运维效果,最终根据高适应型知识图谱,确定并实施自动化运维措施,实现基于知识图谱的自动化运维工作。
10、可选的,所述根据所述运维资料,构建预留节点型通用知识图谱,包括:
11、分析所述运维资料,对所述运维资料进行实体识别,确定运维实体节点集;
12、基于所述运维实体节点集,对所述运维资料进行实体关系分析抽取,确定运维实体关系集;
13、根据所述运维实体节点集,对每一运维实体节点添加事件驱动分支节点和周期驱动分支节点,形成预留节点型实体节点集;
14、根据所述预留节点型实体节点集和所述运维实体关系集,构建所述预留节点型通用知识图谱。
15、通过本方案,对运维资料进行实体识别,得到运维实体节点集,并在此基础上,对运维资料进行实体关系抽取,得到运维实体关系集,以实现对运维资料的结构化处理,进而通过为每一运维实体节点添加事件驱动分支节点和周期驱动分支节点,以使预留节点型通用知识图谱后续能够轻松添加新节点和关系,而无需对现有知识图谱结构进行重大的修改,这种灵活性有助于适应快速变化或不确定的运维需求。
16、可选的,所述故障检测信息包括时间戳、故障实体、异常参数和维护记录,所述分析所述故障检测信息和所述预留节点型通用知识图谱,确定事件驱动型自生长节点,包括:
17、根据所述故障实体,分析所述预留节点型通用知识图谱,确定故障运维实体节点;
18、根据所述故障实体和所述异常参数,分别确定实体特征向量和参数特征向量;
19、根据所述实体特征向量和所述参数特征向量,构建故障特征向量;
20、基于所述故障特征向量,对所述预留节点型通用知识图谱中的所述故障运维实体节点进行故障相似度分析,判断是否存在高相似故障;
21、若不存在所述高相似故障,则基于所述故障实体,根据所述时间戳、所述故障特征向量、所述维护记录,构建所述事件驱动型自生长节点。
22、通过本方案,根据故障对应的故障实体和异常参数,确定实体特征向量和参数特征向量,并在此基础上,构建用于描述故障特征的故障特征向量,根据故障特征向量,从故障检测信息中捕捉系统中出现的特殊故障,并根据用于描述特殊故障的故障实体、时间戳、故障特征向量和维护记录,构建所述事件驱动型自生长节点,以便于后续知识图谱根据特殊故障做出灵活扩展,增强知识图谱在运维工作中的适应性。
23、可选的,所述基于所述故障实体,根据所述时间戳、所述故障特征向量、所述维护记录,构建所述事件驱动型自生长节点,具体为以下公式:
24、;
25、其中,为所述故障实体,为所述时间戳,为所述实体特征向量,为所述参数特征向量,为所述维护记录,为节点构造函数,为所述故障运维实体节点,为所述故障运维实体节点下对应的第个故障特征向量,为所述故障特征向量,为预设故障相似度阈值。
26、通过本方案,利用数学分析手段,构建事件驱动型自生长节点的构造条件,并在满足构造条件的基础上,通过节点构造函数,根据故障实体、时间戳、故障特征向量和维护记录,对事件驱动型自生长节点进行构建,以实现对事件驱动型自生长节点的科学自动化构建,使事件驱动型自生长节点更加精准,同时提高后续知识图谱的节点更新速度。
27、可选的,所述性能监测信息包括单位时间周期、负载实体和负载波动信息,所述分析所述性能监测信息和所述预留节点型通用知识图谱,确定周期驱动型自生长节点,包括:
28、根据所述负载波动信息,确定起始负载、波动幅度和平均负载;
29、根据所述负载实体,分析所述预留节点型通用知识图谱,确定负载运维实体节点;
30、基于所述单位时间周期,根据所述起始负载、所述波动幅度和所述平均负载,确定资源调度信息;
31、根据所述负载运维实体节点和所述资源调度信息,构建所述周期驱动型自生长节点。
32、通过本方案,根据负载波动信息,提取反映负载波动特征的起始负载、波动幅度和平均负载,在此基础上,分析得出负载波动周期内的资源调度信息,同时根据负载实体,检索预留节点型通用知识图谱中对应的负载运维实体节点,并根据负载运维实体节点和资源调度信息,构建周期驱动型自生长节点,使该节点包含负载波动的特征和对应的调度手段,进一步提高后续基于知识图谱的自动化运维的效率和效果。
33、可选的,所述基于所述单位时间周期,根据所述起始负载、所述波动幅度和所述平均负载,确定资源调度信息,包括:
34、根据所述单位时间周期、所述起始负载、所述波动幅度和所述平均负载,确定不同时间点下对所述负载运维实体节点的资源调配值,具体为以下公式:
35、;
36、其中,为时间点下的所述资源调配值,为预设调整系数,为所述平均负载,为所述起始负载,为所述单位时间周期,为所述波动幅度,为预设调整阈值;
37、将不同时间点下对所述负载运维实体节点的所述资源调配值作为所述资源调度信息。
38、通过本方案,利用数学分析手段,根据单位时间周期、起始负载、波动幅度和平均负载,对系统负载波动进行数学建模,并对资源调度介入条件进行约束,以对资源调度值进行精准量化,通过波动模型与阈值判断相结合,针对性地调整和分配维护资源,以使周期驱动型自生长节点满足实际的负载需求和保障运维的稳定性。
39、可选的,所述基于所述预留节点型通用知识图谱,根据所述事件驱动型自生长节点和所述周期驱动型自生长节点,构建系统适应型知识图谱,包括:
40、根据所述事件驱动型自生长节点内对应的所述故障实体,确定所述预留节点型通用知识图谱中的对应的所述运维实体节点;
41、根据所述运维实体节点,确定所述运维实体节点内的所述事件驱动分支节点和所述周期驱动分支节点;
42、根据将所述事件驱动型自生长节点和所述周期驱动型自生长节点分别连接至所述事件驱动分支节点和所述周期驱动分支节点下,确定所述系统适应型知识图谱。
43、通过本方案,事件驱动型自生长节点和周期驱动型自生长节点分别连接至预留节点型通用知识图谱中的对应运维实体节点下预留的事件驱动分支节点和周期驱动分支节点,实现对事件驱动型自生长节点和周期驱动型自生长节点的持久化处理,得出系统适应型知识图谱,完成对知识图谱的动态更新。
44、可选的,所述持续运行信息包括故障节点调整频率、周期节点调整频率,所述根据所述持续运行信息,对所述事件驱动型自生长节点和所述周期驱动型自生长节点进行浮动调整,确定高适应型知识图谱,包括:
45、根据所述故障节点调整频率,控制所述系统适应型知识图谱内的所述事件驱动型自生长节点在对应所述事件驱动分支节点下向上浮动,确定所述事件驱动型自生长节点的浮动后事件分支层数;
46、根据所述周期节点调整频率,控制所述系统适应型知识图谱内的所述周期驱动型自生长节点在对应所述周期驱动分支节点下向上浮动,确定所述周期驱动型自生长节点的浮动后周期分支层数;
47、根据所述浮动后事件分支层数和所述浮动后周期分支层数,分别确定事件节点转换策略和周期节点转换策略;
48、根据所述事件节点转换策略和所述周期节点转换策略,调整所述系统适应型知识图谱,确定所述高适应型知识图谱。
49、通过本方案,根据故障节点调整频率,对被触发频率过高的事件驱动型自生长节点和周期事件驱动型自生长节点进行性质转换,并将完成节点性质转换的知识图谱作为高适应型知识图谱,以使高适应型知识图谱能够向维护人员明确展示需要单独进行针对性处理的事件驱动型自生长节点或周期驱动型事件驱动型自生长节点,进一步优化对系统的整体运维效果,减少自动化运维工作的持续资源占用,进而提高整个系统的响应速度。
50、可选的,所述根据所述浮动后事件分支层数和所述浮动后周期分支层数,分别确定事件节点转换策略和周期节点转换策略,包括:
51、将所述浮动后事件分支层数与预设事件层数阈值进行对比,若所述浮动后事件分支层数小于所述预设事件层数阈值,则所述事件节点转换策略确定为将对应所述事件驱动型自生长节点转换为故障排除节点;
52、将所述浮动后周期分支层数与预设周期层数阈值进行对比,若所述浮动后周期分支层数小于所述预设周期层数阈值,则所述周期节点转换策略确定为将对应所述周期驱动型自生长节点转换为常态优化节点。
53、通过本方案,根据浮动后事件层数和浮动后周期层数分别与其对应层数阈值的对比结果,将对应事件驱动型自生长节点转换为故障排除节点,或将对应周期驱动型自生长节点转换为常态优化节点,以提醒专业维护人员针对故障排除节点和常态优化节点进行系统底层优化,以释放自动化运维工作所占用的系统资源,提高系统的整体稳定性。
54、第二方面,本技术提供一种基于知识图谱的自动化运维管理系统,所述系统包括:
55、通用构建模块,用于获取运维资料,根据所述运维资料,构建预留节点型通用知识图谱;
56、事件分析模块,用于获取故障检测信息,分析所述故障检测信息和所述预留节点型通用知识图谱,确定事件驱动型自生长节点;
57、周期分析模块,用于获取性能监测信息,分析所述性能监测信息和所述预留节点型通用知识图谱,确定周期驱动型自生长节点;
58、适应构建模块,用于基于所述预留节点型通用知识图谱,根据所述事件驱动型自生长节点和所述周期驱动型自生长节点,构建系统适应型知识图谱;
59、适应调整模块,用于获取持续运行信息,根据所述持续运行信息,对所述事件驱动型自生长节点和所述周期驱动型自生长节点进行浮动调整,确定高适应型知识图谱;
60、实施模块,用于根据所述高适应型知识图谱,实施自动化运维措施,并输出运维报告。
1.一种基于知识图谱的自动化运维管理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述运维资料,构建预留节点型通用知识图谱,包括:
3.根据权利要求2所述的方法,其特征在于,所述故障检测信息包括时间戳、故障实体、异常参数和维护记录,所述分析所述故障检测信息和所述预留节点型通用知识图谱,确定事件驱动型自生长节点,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述故障实体,根据所述时间戳、所述故障特征向量、所述维护记录,构建所述事件驱动型自生长节点,具体为以下公式:
5.根据权利要求3所述的方法,其特征在于,所述性能监测信息包括单位时间周期、负载实体和负载波动信息,所述分析所述性能监测信息和所述预留节点型通用知识图谱,确定周期驱动型自生长节点,包括:
6.根据权利要求5所述的方法,其特征在于,所述基于所述单位时间周期,根据所述起始负载、所述波动幅度和所述平均负载,确定资源调度信息,包括:
7.根据权利要求5所述的方法,其特征在于,所述基于所述预留节点型通用知识图谱,根据所述事件驱动型自生长节点和所述周期驱动型自生长节点,构建系统适应型知识图谱,包括:
8.根据权利要求7所述的方法,其特征在于,所述持续运行信息包括故障节点调整频率、周期节点调整频率,所述根据所述持续运行信息,对所述事件驱动型自生长节点和所述周期驱动型自生长节点进行浮动调整,确定高适应型知识图谱,包括:
9.根据权利要求8所述的方法,其特征在于,所述根据所述浮动后事件分支层数和所述浮动后周期分支层数,分别确定事件节点转换策略和周期节点转换策略,包括:
10.一种基于知识图谱的自动化运维管理系统,其特征在于,包括: