本发明涉及知识图谱,具体为一种基于知识图谱的多分支多节点比对计算方法。
背景技术:
1、在职位招聘中,不同的公司可能会使用不同的术语和描述来描述相同的职位,不同职位对求职者的要求千差万别,不仅涉及专业技能、工作经验等硬性条件,还包括性格特点、团队合作能力、创新思维等软性能力,而知识图谱技术则可以将复杂的岗位要求通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示岗位要求的规律,为职位招聘提供切实的、有价值的参考。
2、传统的招聘方式很难全面、准确地评估求职者与的匹配度,而知识图谱技术能够将职位需求与求职者的各项能力进行精细化匹配,因此,如何设定多个关键技能节点和评价指标,通过知识图谱中的多分支多节点比对计算,全面评估求职者在各个技能节点上的匹配程度,是我们要解决的问题,为此,现提出一种基于知识图谱的多分支多节点比对计算方法。
技术实现思路
1、为实现以上目的,本发明通过以下技术方案予以实现:一种基于知识图谱的多分支多节点比对计算方法,包括以下步骤:
2、步骤一、收集职位数据和求职者数据,并对数据进行预处理后,构建职位与求职者知识图谱;
3、步骤二、根据职位数据分析职位需求,确定关键技能节点,为每个技能节点设定相应的评价指标,并建立比对节点预设体系,允许用户在知识图谱中建立需求的比对节点体系,其中,比对节点包括单选节点、复选节点以及文本节点;
4、步骤三、标记职位数据和求职者数据以训练节点比对模型,提取文本中的关键信息,并与知识图谱中的节点匹配;
5、步骤四、利用知识图谱和节点比对模型,对求职者数据与职位数据进行比对,并根据比对结果,计算求职者在各个技能节点上的匹配程度;
6、步骤五、根据比对结果,为求职者提供个性化的职业发展建议,向用户直观展示比对结果,并根据相似度由高到低的顺序对求职者进行排序,向招聘方推荐匹配度高的求职者。
7、优选的,所述步骤一中,职位与求职者知识图谱的构建过程包括:
8、收集职位数据和求职者数据,其中,职位数据包括职位描述、要求的技能、经验年限、教育背景、工作职责信息,求职者数据包括求职者的教育背景、工作经验、技能、证书、个人兴趣信息,使用网络爬虫技术从招聘网站、公司网站、职位发布平台等渠道收集职位数据,并从求职者提交的简历、在线职业档案、社交媒体渠道收集求职者数据,确保数据的全面性和时效性,并且对于网站数据的抓取,需要遵守相关法律法规和网站的robots协议,确保收集过程符合隐私保护原则,避免非法采集数据;
9、对收集职位数据和求职者数据进行预处理,采用数据清洗去除重复数据、修正错误信息、填补缺失值,比对职位数据和求职者数据中的关键信息,去除完全重复及高度相似的数据,并将不同来源的数据中的术语标准化;
10、进行职位数据和求职者数据的实体识别,识别出职位实体、技能实体和经验实体,其中,职位实体包括职位名称、公司名称、工作地点,技能实体包括职位要求的技能和求职者简历的技能,经验实体包括求职者的工作经验和职位要求的经验年限,并分析实体之间的关系,包括职位与公司的关联、职位与技能的关联、求职者与职位的匹配度、求职者与技能的掌握情况,如“求职者-拥有-技能”、“职位-要求-技能”、“求职者-毕业于-教育机构”等;
11、定义图谱架构,并设计知识图谱的节点和边,确定实体类型和关系类型,将预处理后的数据填充到知识图谱中,形成节点和边,使用图数据库(如neo4j)存储构建好的知识图谱;
12、使用自然语言处理技术将不同来源的实体链接到同一实体上,增强图谱的连通性,通过自然语言处理技术从非结构化文本中抽取新的关系,丰富图谱内容,并将来自不同来源的数据融合,确保知识图谱的一致性和准确性。
13、优选的,所述步骤二中,为每个技能节点设定相应评价指标的过程包括:
14、对收集到的职位数据进行分类和整理,识别出不同职位的共性和差异性,并分析各职位对技能、经验、教育背景方面的需求;
15、根据职位需求分析的结果,结合技能的重要性和普遍性,识别出频繁出现的技能要求作为关键技能节点,关键技能节点为职位履行中不可或缺的技能,且在不同职位中具有一定的通用性,并为每个关键技能节点设定评价指标,评价指标包括熟练度等级、相关项目经验年限、认证证书、培训经历等,熟练度等级为初级、中级和高级;
16、建立节点预设体系,允许用户在知识图谱中建立需求的节点体系,与其他相似节点体系进行比对,并通过节点相似度计算匹配结果,其中,比对方式分为单一图谱比对和多图谱比对,若用户建立单选节点,则下一个分支建立的节点具有以下特点:用户点击同一个分支的其中一个节点,该节点将处于选中状态,其他节点会处于未被选中状态,用户多次点击同一选项节点会切换选中状态,在对比开始后系统将会记录用户选中选项的路径;
17、若用户建立复选节点,则下一个分支建立节点具有以下特点:用户点击同一个分支的其中一个节点,该节点将处于选中状态,其他节点状态不改变,用户多次点击同一选项节点会切换选中状态,在对比开始后系统将会记录用户选中选项的路径;
18、若用户建立节点,则下一个分支可以建立多种节点;
19、若用户建立文本节点,则下一个分支建立节点具有以下特点:用户只能编辑该节点,在对比开始后系统将会记录用户选中选项的路径;
20、若用户建立链接节点,当前节点可以编辑一个链接地址,点击地址可以直接跳转;
21、结合设定的评价指标进行量化分析,计算技能评估指数,确定各关键技能节点的技能水平。
22、优选的,所述技能评估指数的表达式为:
23、;
24、其中,是技能评估指数,是评价指标的数量,是第个评价指标的权重,表示该指标在总评估中的相对重要性,是第个评价指标的实际得分,是所有评价指标中得到的最高得分,是指数,用于调整得分的非线性影响,增强高得分指标的权重,值越高,表示技能水平越高。
25、优选的,所述单一图谱比对的过程包括:
26、比对节点路径及节点关键词是否一致,根据节点类型不同(单选节点,复选节点,文本节点)的使用不同的比对方法,对于单选节点:判断节点路径是否一致,对于复选节点:相同路径下是否所有节点均选择一致,若不一致按一致节点计算权重,对于文本节点:使用关键词匹配方式进行比对,计算比对结果并进行展示;
27、所述多图谱比对的过程包括:
28、开始比对:记录用户建立的节点体系,并生成选择路径,从选择路径上提取路径关键词,生成关键词路径,关键词路径为倒叙路径,即先记录路径的最后一个节点,然后逐层向根节点递进;
29、比对中:将用户建立的节点体系生成的关键词路径与其他所有关键词路径匹配相似度,即先匹配最后一个相似度,然后逐层向上,最后产生一个相似度的百分比值,相似度计算方法通过语义分析比对两个关键词相似度,即节点到其他节点最短路径之和的倒数,其计算公式为:;
30、比对后:将匹配的节点体系,按照相似度由高向低的顺序返回给用户并进行展示。
31、优选的,所述步骤三中,提取文本中关键信息与知识图谱中节点匹配的过程包括:
32、使用分词工具(如jieba分词、hanlp等)对职位数据和求职者数据中的文本进行分词处理,分词结果作为后续提取关键信息的基础,并从职位描述和求职者简历中提取出技能、经验、教育背景的关键信息,作为节点比对模型的主要输入,将提取出的关键信息结构化存储,形成结构化的数据格式(如json、xml等),结构化数据便于后续与知识图谱中的节点进行匹配;
33、对知识图谱中的每个节点进行标记,使每个节点有一个唯一的标识符和相应的属性描述,这些节点将作为比对模型的参考标准,将职位数据和求职者数据与知识图谱中的节点进行匹配标注,标注结果包含每个数据项与知识图谱中节点的对应关系,整合标注后的数据得到节点比对数据集,并将节点比对数据集划分为训练集和测试集;
34、基于神经网络模型构建节点比对模型,使用训练集中的相关数据训练节点比对模型,并使用测试集对训练好的节点比对模型进行测试评估;
35、将训练好的节点比对模型应用于实际的职位匹配和求职者筛选场景中,确保模型能够处理实时数据,并与知识图谱进行交互,通过模型预测结果来辅助招聘决策和职业规划。
36、优选的,所述步骤四中,计算求职者在各个技能节点上匹配程度的过程包括:
37、定义节点匹配规则,包括单选节点、复选节点和文本节点的匹配规则,其中,单选节点匹配时只能选择一个最相关的节点,复选节点匹配时可以选择多个相关的节点,但需要考虑权重分配,文本节点匹配时基于关键词及短语的相似度;
38、将节点比对模型应用于每个职位数据和求职者数据的节点,并利用节点比对模型输出每个节点的匹配程度,对于每个单选节点,将匹配分数相加,乘以其权重,得到单选节点匹配指数,对于复选节点,使用逻辑函数处理复选节点的匹配分数,根据匹配程度的高低调整分数的增长速率,将匹配分数相加,乘以其权重,得到复选节点匹配指数,对于文本节点,使用每个文本节点匹配分数的平方根进行累加,乘以其权重,得到文本节点匹配指数;
39、综合所有节点的匹配分数,生成比对匹配系数,分析求职者与职位的总体匹配程度,并展示比对结果;
40、根据比对匹配系数,划分求职者与职位的总体匹配程度的匹配等级,分别为高匹配等级、中匹配等级和低匹配等级,并为各匹配等级划分相对应的匹配阈值;
41、基于比对匹配系数和匹配等级,分析每个技能节点上的匹配程度,确定求职者在特定技能上的强项和弱项。
42、优选的,所述比对匹配系数的表达式为:
43、;
44、;
45、;
46、;
47、其中,是比对匹配系数,是单选节点匹配指数,是复选节点匹配指数,是文本节点匹配指数,是单选节点的权重,是复选节点的权重,是文本节点的权重,是单选节点的数量,是第个单选节点的匹配分数,是复选节点的数量,是第个复选节点的匹配分数,是第个复选节点的基线响应敏感度,是第个复选节点的逻辑回归的阈值参数,是文本节点的数量,是第个文本节点的匹配分数,,的取值范围在0到1之间,值越高,表示求职者与职位的匹配程度越高。
48、优选的,多个所述匹配等级对应多个所述匹配阈值,所述匹配阈值包括上限阈值和下限阈值,多个所述匹配等级与多个所述匹配阈值的对应关系为:
49、高匹配等级;
50、中匹配等级;
51、低匹配等级;
52、其中,为比对匹配系数,为高匹配等级对应的下限阈值与中匹配等级对应的上限阈值,为中匹配等级对应的下限阈值与低匹配等级对应的上限阈值,,。
53、优选的,所述步骤五中,向用户直观展示比对结果的过程包括:
54、深入分析每个求职者在各个技能节点上的匹配程度,并向求职者确认其强项,针对求职者的弱项,提供具体的改进建议,根据求职者的技能和兴趣,提供职业发展路径和职位推荐建议,针对当前求职目标,提供如何优化简历、准备面试等短期建议,根据求职者的职业兴趣和长期目标,提供职业路径规划建议,包括需要提升的技能、可能的发展方向等;
55、根据比对匹配系数,将求职者按照与职位的匹配度由高到低进行排序,并根据招聘方的需求和求职者的匹配程度,自动筛选出匹配度高的求职者,推荐合适的候选人,将匹配度最高的求职者置于推荐列表的顶部,以便招聘方快速查看;
56、创建可视化报告,展示求职者与职位的匹配程度,并使用图表表示匹配等级,展现每个技能节点的具体匹配分数和建议。
57、本发明提供了一种基于知识图谱的多分支多节点比对计算方法。具备以下有益效果:
58、一、该基于知识图谱的多分支多节点比对计算方法,通过构建知识图谱,能够系统地整合并分析求职者与职位之间的多维度信息,包括技能、经验、教育背景等,多分支多节点的比对计算方式确保了每一个细节都被充分考虑,从而大大提高了匹配的精度,同时,自动化的比对流程显著缩短了匹配所需的时间,提高了处理效率,使得招聘方能够迅速定位到最合适的候选人,求职者也能更快地找到与自身条件相匹配的岗位。
59、二、该基于知识图谱的多分支多节点比对计算方法,根据比对结果深入分析求职者的强项与弱项,为其提供个性化的职业发展建议,通过识别求职者在特定技能或领域上的优势与不足,能够精准地推荐提升路径和职业规划方向,帮助求职者明确自身定位,制定切实可行的职业发展计划,并且通过自动化筛选和精准推荐,招聘方可快速锁定高质量的候选人,减少无效面试和筛选的时间与成本,同时,提高匹配度,相应也会提升招聘成功率,进一步降低招聘的总体成本。
1.一种基于知识图谱的多分支多节点比对计算方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于知识图谱的多分支多节点比对计算方法,其特征在于:所述步骤二中,为每个技能节点设定相应评价指标的过程包括:
3.根据权利要求2所述的一种基于知识图谱的多分支多节点比对计算方法,其特征在于:所述技能评估指数的表达式为:
4.根据权利要求3所述的一种基于知识图谱的多分支多节点比对计算方法,其特征在于:所述单一图谱比对的过程包括:
5.根据权利要求4所述的一种基于知识图谱的多分支多节点比对计算方法,其特征在于:所述比对匹配系数的表达式为:
6.根据权利要求5所述的一种基于知识图谱的多分支多节点比对计算方法,其特征在于:多个所述匹配等级对应多个所述匹配阈值,所述匹配阈值包括上限阈值和下限阈值,多个所述匹配等级与多个所述匹配阈值的对应关系为:
7.根据权利要求6所述的一种基于知识图谱的多分支多节点比对计算方法,其特征在于:所述步骤五中,向用户直观展示比对结果的过程包括: