一种基于人工智能和色谱分析的样品查询方法及服务器与流程

专利查询2023-8-13  118



1.本技术涉及色谱数据分析领域,具体而言,涉及一种基于人工智能和色谱分析的样品查询方法及服务器。


背景技术:

2.色谱分析试验后,对样品的色谱数据进行分析,往往将实验过程和分析结果进行记录,以便于后续进行查询,例如记录下样品的物质类别和相应含量。在实际应用中,有时候会通过目标样品来寻找与目标样品类似的其他样品,如历史样品。例如在进行设备的集中故障检测时,大量设备的相关样品被采集进行色谱分析,判断故障风险,在确定一项故障时,需要确定其他设备的样品是否产生同样的色谱数据,又例如在样品匹配选择时,需要从大量样品中寻找与目标样品类似的其他样品。然而,在色谱试验之后,实验者并非每一次都会记录样品的物质类别和含量,或者记录产生错漏,因此导致查询相同相似色谱数据对应的样品时,产生错漏。


技术实现要素:

3.为了改善上述的问题,本技术实施例提供一种基于人工智能和色谱分析的样品查询方法及服务器。
4.为了达到上述目的,本技术实施例采用的技术方案如下:第一方面,本技术实施例提供了一种基于人工智能和色谱分析的样品查询方法,包括:获取待查询样品的参考样品描述结果和参考色谱分析结果;通过参考样品描述结果获取第一样品清单,第一样品清单包含的各个样品各自的样品描述结果,与参考样品描述结果的描述匹配度大于第一阈值;从第一样品清单中确定多个代表样品,多个代表样品各自的色谱分析结果与参考色谱分析结果的色谱匹配度大于第二阈值;逐一通过多个代表样品各自的色谱分析结果,获取相应的第二样品清单,每个第二样品清单包含的各个样品,与相应的代表样品的色谱分析结果之间的色谱匹配度大于第三阈值;通过获取的多个第二样品清单以及第一样品清单,确定查询到的参考样品清单。
5.进一步地,通过参考样品描述结果获取第一样品清单,包括:从样品集合中的多个样品描述结果指示信息中,选择多个对照描述指示信息,每个样品描述结果指示信息为具备相关性的多个样品描述结果的代表信息,多个对照描述指示信息各自与参考样品描述结果的描述匹配度大于第一预设匹配度;获取多个对照描述指示信息各自具备相关性的多个样品描述结果;根据获取的各个样品描述结果各自对应的样品,以及多个对照描述指示信息各自对应的样品,生成第一样品清单。
6.进一步地,逐一通过多个代表样品各自的色谱分析结果,获取相应的第二样品清单,包括:针对多个代表样品分别进行如下步骤:从样品集合中的多个色谱分析结果指示信息中,选择多个对照色谱指示信息;每个色谱分析结果指示信息为具备相关性的多个色谱分析结果的代表信息,确定的多个对照色谱指示信息各自与一个代表样品的色谱分析结果的色谱匹配度大于第二预设匹配度;获取多个对照色谱指示信息各自具备相关性的多个色谱分析结果;根据获取的各个色谱分析结果各自对应的样品,以及多个对照色谱指示信息各自对应的样品,生成相应的第二样品清单。
7.进一步地,获取待查询样品的参考样品描述结果和参考色谱分析结果,包括:获取样品描述结果提取模型;将待查询样品的文字描述结果输入样品描述结果提取模型,得到样品描述结果;样品描述结果提取模型的训练过程包括:获取样品描述数据训练样本,描述数据训练样本包括参考样品描述文本、匹配样品描述文本和非匹配样品描述文本;根据样品描述数据训练样本,采用预设的损失函数对样品描述结果提取模型进行训练直至满足预设训练停止条件;获取色谱分析结果提取模型,色谱分析结果提取模型通过标记有样品组分的三元组训练样本训练得到;将待查询样品的色谱试验数据输入色谱分析结果提取模型,得到色谱分析结果。
8.进一步地,通过获取的多个第二样品清单以及第一样品清单,确定查询到的参考样品清单,包括:对于多个第二样品清单以及第一样品清单包含的各个样品,根据各个样品各自的样品描述结果与参考样品描述结果的描述匹配度,以及各个样品各自的色谱分析结果与参考色谱分析结果的色谱匹配度,对各个样品按顺序排列;从排序后的各个样品中确定多个参考样品,获得查询到的参考样品清单。
9.进一步地,方法还包括:获取待查询样品的参考组分信息,参考组分信息表示待查询样品所包含的组分;获取第三样品清单,第三样品清单包含的各个样品各自的组分信息与参考组分信息匹配;基于第三样品清单包含的多个参考样品各自的色谱分析结果,获取相应的第四样品清单,每个第四样品清单包含的各个样品,与相应参考样品的色谱分析结果之间的色谱匹配度大于第四阈值;通过获取的多个第二样品清单以及第一样品清单,确定查询到的参考样品清单,包括:基于第一样品清单、多个第二样品清单、第三样品清单以及多个第四样品清单,确定查询到的参考样品清单。
10.进一步地,获取第三样品清单,包括:从样品集合中的多个样品组分指示信息中,选择与参考组分信息匹配的不少于一
个样品组分指示信息;每个样品组分指示信息具备相关性有多个包含相应样品组分的样品;获取确定的不少于一个样品组分指示信息各自具备相关性的多个样品,并根据获取的各个样品,生成第三样品清单。
11.进一步地,基于第三样品清单包含的多个参考样品各自的色谱分析结果,获取相应的第四样品清单,包括:从第三样品清单中选择多个参考样品,并将待查询样品作为一个参考样品;其中,多个参考样品各自的色谱分析结果,与参考色谱分析结果的色谱匹配度,大于第三预设匹配度;分别通过获得的多个参考样品各自的色谱分析结果,获取相应的第四样品清单,每个第四样品清单包含的各个样品,与相应参考样品的色谱分析结果之间的色谱匹配度,大于第四预设匹配度;分别通过获得的多个参考样品各自的色谱分析结果,获取相应的第四样品清单,包括:对于多个参考样品各自的色谱分析结果分别进行以下步骤:从样品集合中的多个色谱分析结果指示信息中,选择多个对照色谱指示信息,每个色谱分析结果指示信息为具备相关性的多个色谱分析结果的代表信息,确定的多个对照色谱指示信息各自与一个参考样品的色谱分析结果的色谱匹配度,大于第四预设匹配度;获取多个对照色谱指示信息各自具备相关性的多个色谱分析结果;根据获取的各个色谱分析结果各自对应的样品,以及多个对照色谱指示信息各自对应的样品,生成相应的第四样品清单。
12.进一步地,获取待查询样品的参考色谱分析结果,包括:获取色谱分析结果提取模型;将待查询样品的色谱试验数据输入色谱分析结果提取模型,得到色谱分析结果;色谱分析结果提取模型通过标记有样品组分的三元组训练样本训练得到,三元组训练样本包括参考样品色谱数据、匹配样品色谱数据和非匹配样品色谱数据;获取待查询样品的参考组分信息,包括:将待查询样品的色谱试验数据输入色谱分析结果提取模型,得到参考组分信息;基于第一样品清单、多个第二样品清单、第三样品清单以及多个第四样品清单,确定查询到的参考样品清单,包括:对于第一样品清单、多个第二样品清单、第三样品清单以及多个第四样品清单包含的各个样品,根据各个样品各自的样品描述结果与参考样品描述结果的描述匹配度,各个样品各自的色谱分析结果与参考色谱分析结果的色谱匹配度,以及各个样品各自的组分信息的分析结果,将各个样品按顺序排列;从排序后的各个样品中选择多个待查询样品,获得查询到的参考样品清单;各个样品各自的组分信息的分析结果,采用以下过程获取得到:确定参考组分信息中包含的不少于一个样品组分,并获取不少于一个样品组分各自的第一预估结果;针对各个样品,分别执行以下操作:根据一个样品的组分信息中,不少于一个样品组分各自的第二预估结果,以及不少于一个物体组分各自的第一预估结果,确定一个样品的组分信息的
分析结果。
13.第二方面,本技术实施例提供了一种服务器,包括处理器和存储器,存储器用于存放计算机程序,处理器用于执行存储器上所存放的计算机程序,以实现本技术实施例第一方面提供的方法。
14.本技术实施例通过获取待查询样品的参考样品描述结果和参考色谱分析结果,再通过参考样品描述结果获取第一样品清单,然后从第一样品清单中确定多个代表样品,之后逐一通过多个代表样品各自的色谱分析结果,获取相应的第二样品清单,最后通过获取的多个第二样品清单以及第一样品清单,确定查询到的参考样品清单。不仅能直接查询到记录有描述结果的样品,而且能够查询到与待查询样品色谱分析结果匹配的样品,增加了查询到的参考样品的个数,填补了因漏记录或错记录产生的查询缺失。
15.在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被实现和获得。
附图说明
16.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
17.附图中的方法、系统和/或程序将根据示例性实施例进一步描述。这些示例性实施例将参照图纸进行详细描述。这些示例性实施例是非限制的示例性实施例,其中示例数字在附图的各个视图中代表相似的机构。
18.图1是本技术实施例提供的服务器与终端设备交互的示意图。
19.图2是本技术实施例提供的服务器的方框示意图。
20.图3是根据本技术的一些实施例所示的一种基于人工智能和色谱分析的样品查询方法的流程图。
21.图4是本技术实施例提供的引导策略中查询样品的场景示意图。
22.图5是本技术实施例提供的样品查询装置的功能模块架构示意图。
具体实施方式
23.为了更好的理解上述技术方案,下面通过附图以及具体实施例对本技术技术方案做详细的说明,应当理解本技术实施例以及实施例中的具体特征是对本技术技术方案的详细的说明,而不是对本技术技术方案的限定,在不冲突的情况下,本技术实施例以及实施例中的技术特征可以相互组合。
24.在下面的详细描述中,通过实例阐述了许多具体细节,以便提供对相关指导的全面了解。然而,对于本领域的技术人员来说,显然可以在没有这些细节的情况下实施本技术。在其他情况下,公知的方法、程序、系统、组成和/或电路已经在一个相对较高水平上被描述,没有细节,以避免不必要的模糊本技术的方面。
25.这些和其他特性、当前申请披露的功能、执行的方法、结构中相关元素的功能和部件的组合和生产经济性,在参照附图进行以下描述的考虑中可能会变得更加明显,所有这些形成本技术的一部分。然而,需要理解清楚的是,附图仅仅是为了说明和描述的目的,并不旨在限制本技术的范围。应当了解的是,这些图纸不是按比例绘制的。然而,应当明确理解的是,附图仅用于说明和描述的目的,并不意图限制本技术的范围。应当知晓的是,这些附图并不依照比例。
26.本技术中使用流程图说明根据本技术的实施例的系统所执行的执行过程。应当明确理解的是,流程图的执行过程可以不按顺序执行。相反,这些执行过程可以以相反的顺序或同时执行。另外,可以将至少一个其他执行过程添加到流程图。一个或多个执行过程可以从流程图中删除。
27.本技术实施例中,服务器存储有大量样品的色谱实验数据,用户需要查询样品时,可以在服务器中进行查询,因此,为了便于用户能够方便快捷地查询到符合要求的样品,本技术实施例提供了一种基于人工智能和色谱分析的样品查询方法,应用于该服务器。在一些实施例中,用户查询样品通过终端设备进行查询,由服务器接收终端设备的查询请求,按照基于人工智能和色谱分析的样品查询方法在服务器的数据库中进行查询。请参照图1,是根据一些实施例提供的服务器200与终端设备300交互的场景示意图。终端设备300与服务器200之间通过网络通信,终端设备300可以是个人计算机、服务器、平板电脑、掌上助理等。容易理解,图1所示仅为示例,在其他实施例中,服务器200和终端设备300的形式和数量可以更多或更少,本技术对此不做限定。
28.如图2所示,是服务器200的方框示意图,该服务器200包括样品查询装置210、存储器220、处理器230和通信单元240。存储器220、处理器230和通信单元240相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。样品查询装置210包括至少一个可以软件或固件的形式存储于存储器220中或固化在电子设备的操作系统中的软件功能模块。处理器230用于执行存储器220中存储的可执行模块,例如样品查询装置210所包括的软件功能模块及计算机程序等。存储器220可以是,但不限于,随机存取存储器、只读存储器、可编程只读存储器、可擦除只读存储器、电可擦除只读存储器等。存储器220用于存储程序,处理器230在接收到执行指令后,执行所述程序。通信单元240用于通过网络建立服务器200与终端设备300之间的通信连接,并用于通过网络收发数据。
29.处理器可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。可以理解,图2所示的结构仅为示意,服务器200还可包括比图2中所示更多或者更少的组件,或者具有与图2所示不同的配置。图2中所示的各组件可以采用硬件、软件或其组合实现。
30.请参照图3,图3是根据本技术的一些实施例所示的一种基于人工智能和色谱分析的样品查询方法的流程图,该色谱仪试验数据验证方法应用于服务器200。可以包括以下步
骤s1~步骤s5,下面将对各个步骤进行详细说明。
31.步骤s1,获取待查询样品的参考样品描述结果和参考色谱分析结果。
32.该待查询样品的信息,由用户通过终端设备300上传到服务器200。待查询样品为需要进行查询的样品,即查询与待查询样品近似的其他样品。样品描述结果为对实验者在实验分析后根据色谱实验数据对样品进行的总结性描述,例如样品包含的物质种类和对应的含量,其可以通过文字描述,色谱分析结果为对样品进行试验后得到的色谱试验数据。参考样品描述结果为待查询样品的总结性描述,参考色谱分析结果为待查询样品的色谱试验数据。待查询样品的参考样品描述结果和参考色谱分析结果,一个是通过文字描述,一个是通过图表进行表达,本技术实施例中,通过借助人工智能工具从文字和图表中提取出待查询样品的参考样品描述结果和参考色谱分析结果。首先,训练人工智能模型,包括样品描述结果提取模型和色谱分析结果提取模型。对于色谱分析结果提取模型,其可以包括卷积神经网络模块和组合评估模块。卷积神经网络模块可以采用resnet,组合评估模块包括全连接层。本技术实施例不限制上述各个模块的结构和参数。模型训练时,对模型的各个参数进行初始化,设置学习的参数和学习率。在训练样本的选择中,通过标记有样品组分的三元组训练样本训练得到,收集海量的样品色谱数据样本并进行标注,利用三元组标注方式,分别包括参考样品色谱数据、匹配样品色谱数据和非匹配样品色谱数据。通常来说,标注过程中,从所有样品色谱数据样本中随机得到符合规则的三组数据,参考样品色谱数据、匹配样品色谱数据和非匹配样品色谱数据,以构成三元组训练样本。如此得到的训练样本包括大量易于学习的样本,该类易学习样本在初始阶段有利于模型的学习,直到模型针对易学习样本产生较强的分辨基础时,易学习样本的损失相较于难学习样本较大,致使难学习样本被掩盖,则在后期需要大量难学习样本。因此,本技术实施例中,三元组训练样本的标注包括:1.标注近似样品色谱数据样本对。2.对所有样本对进行划分,得到多个batch,囊括x个样本对。3.对每个batch的x个样本对进行挖掘,得到三元组训练样本。具体的,挖掘过程包括对一样品色谱数据样本a,从余下样本对中逐一随机确定一个样品色谱数据样本,计算相似度并按顺序排列,取相似度倒数的多个样本为负样本,与a归属的正样本对对应得到三元组。选取的个数可以自由设置。对每一样品色谱数据样本进行标注,当样品色谱数据样本包含某个样品组分的时候,其样品组分设置一标签,不包括的样品组分设置另外的标签。接下来的训练中,对三元组训练样本集进行多次批量梯度下降迭代,具体过程不做赘述。在训练过程中,采用二值交叉熵损失函数对模型进行训练,并对参数进行调整,最终得到训练好的色谱分析结果提取模型。
33.对于样品描述结果提取模型,其训练时,首先获取样品描述数据训练样本,该描述数据训练样本包括参考样品描述文本、匹配样品描述文本和非匹配样品描述文本,根据样品描述数据训练样本,采用预设的损失函数对样品描述结果提取模型进行训练直至满足预设训练停止条件。本实施例对具体的训练过程不再赘述。需要说明的是,样品描述结果提取模型的作用是提取关键文字信息,其需求相对简单,其还可以采用通用的文本识别模型实现。
34.作为一种实施方式,样品描述结果可以是对样品包含的物质类型和对应的物质含量进行的描述内容,色谱分析结果,是针对色谱图谱进行分析后,得到的色谱描述结果,例如可以包含试验条件、物质个数、各物质保留值、各物质峰高和峰面积。
35.建立上述两个模型后,服务器200中设置有样品集合,如何基于该两个模型在样品集合中寻找对应的样品,需要建立引导策略。因此,对于样品集合中的所有样品数据,进行以下步骤,1.利用样品描述结果提取模型分别提取所有样品的样品描述结果相似度。2.训练提取到的相似度的代表信息,例如对相似度聚类分析,得到代表信息。3.利用色谱数据分析结果提取模型分别提取所有样品的色谱数据分析结果相似度。4.训练色谱数据分析结果相似度的代表信息。那么,即可将获得各个样品描述结果的代表信息,作为寻找过程中的样品描述结果指示信息,用以指向样品。样品集合中的各个样品,均与距离最近的一个描述结果指示信息中心相关,建立样品与描述结果指示信息的关联关系。相应的,将获得各个色谱分析结果的代表信息,作为寻找过程中的色谱分析结果指示信息,将样品集合中的各个样品,均与距离最近的一个色谱分析结果指示信息中心相关,建立各个样品与色谱分析结果指示信息的关联关系。对样品集合中的各个样品,通过色谱分析结果提取模型评估每个样品包含的多个样品组分,每个样品组分可以通过一个标签表示。每个样品组分指示信息与包含该样品组分的所有样品进行关联。
36.步骤s2,通过参考样品描述结果获取第一样品清单,第一样品清单包含的各个样品各自的样品描述结果,与参考样品描述结果的描述匹配度大于第一阈值。
37.具体的,可以计算样品集合内各个样品的样品描述结果与待查询样品的参考样品描述结果的描述匹配度,并获取描述匹配度大于第一阈值的多个样品,获得第一样品清单。其中,样品描述结果可以通过向量表达,通过计算样品描述结果之间的距离,例如余弦距离或欧氏距离,即可得到样品描述结果间的描述匹配度。样品集合中的各个样品的样品描述结果可以预先通过样品描述结果提取模型得到。第一阈值根据实际需要进行设置,例如0.85或0.95。
38.步骤s3,从第一样品清单中确定多个代表样品,多个代表样品各自的色谱分析结果与参考色谱分析结果的色谱匹配度大于第二阈值。
39.具体的,可以计算样品集合内各个样品的色谱分析结果与待查询样品的参考色谱分析结果的色谱匹配度,并获取色谱匹配度大于第二阈值的多个代表样品。其中,色谱分析结果可以通过向量表达,通过计算色谱分析结果之间的距离,例如余弦距离或欧氏距离,即可得到色谱分析结果间的色谱匹配度。样品集合中的各个样品的色谱分析结果可以预先通过色谱分析结果提取模型得到。第二阈值根据实际需要进行设置,例如0.9或0.95。
40.步骤s4,逐一通过多个代表样品各自的色谱分析结果,获取相应的第二样品清单,每个第二样品清单包含的各个样品,与相应的代表样品的色谱分析结果之间的色谱匹配度大于第三阈值。
41.通过每个代表样品各自的色谱分析结果,均可以获取一个第二样品清单,该过程中,可以计算样品集合中各个样品的色谱分析结果与代表样品的色谱分析结果的色谱匹配度,然后获取色谱匹配度大于第三阈值的多个样品,从而得到第二样品清单。样品集合中的各个样品的色谱分析结果,可以预先采用上述色谱分析结果提取模型得到。第三阈值可以根据需要设置,此处不限定。
42.步骤s5,通过获取的多个第二样品清单以及第一样品清单,确定查询到的参考样品清单。
43.对于获取到的各个样品,可以基于各个样品与待查询样品之间的参考样品描述结
果和参考色谱分析结果,确定各个样品的总匹配度,然后按照匹配度大小排序,确定排名靠前的样品的组合为参考样品清单。各个样品的总匹配度可以通过将参考样品描述结果和参考色谱分析结果进行加权求和得到。
44.例如,作为一种实施例,可以包括:步骤s51,对于多个第二样品清单以及第一样品清单包含的各个样品,根据各个样品各自的样品描述结果与参考样品描述结果的描述匹配度,以及各个样品各自的色谱分析结果与参考色谱分析结果的色谱匹配度,对各个样品按顺序排列。
45.举例说明,样品a的描述匹配度为q,色谱匹配度为w,则样品a的总匹配度z=x
·
q+ y
·
w,其中,x、y分别为权重,其具体数值可以据实配置。
46.步骤s52,从排序后的各个样品中确定多个参考样品,获得查询到的参考样品清单。
47.通过描述匹配度和色谱匹配度将各个样品按顺序进行排列,可以让描述匹配度和色谱匹配度对结果进行联合激励,结果更精确。
48.由于样品集合中的样品数据是海量的,因此,可以通过信息指引加速样品的查找,提高查询速度。例如,可以借助本技术实施例提供的引导策略,根据待查询样品的参考样品描述结果,从样品集合中获取第一样品清单。具体的,步骤s2,通过参考样品描述结果获取第一样品清单,可以包括:步骤s21,从样品集合中的多个样品描述结果指示信息中,选择多个对照描述指示信息,每个样品描述结果指示信息为具备相关性的多个样品描述结果的代表信息,多个对照描述指示信息各自与参考样品描述结果的描述匹配度大于第一预设匹配度。
49.申请实施例中,建立的样品集合的引导策略中包括多个样品描述结果指示信息,每个样品描述结果指示信息为相关的多个样品描述结果的代表信息。其中,可以计算多个样品描述结果指示信息分别与待查询样品的参考样品描述结果的描述匹配度,然后从多个样品描述结果指示信息中,选择基础相似度不小于第一相似度阈值的基础特征索引,将选择的每个样品描述结果指示信息作为一个对照描述指示信息。其中,第一预设匹配度可以根据实际配置,此处不作限定。
50.步骤s22,获取多个对照描述指示信息各自具备相关性的多个样品描述结果。
51.步骤s23,根据获取的各个样品描述结果各自对应的样品,以及多个对照描述指示信息各自对应的样品,生成第一样品清单。
52.例如,请参照图4,从多个样品描述结果指示信息中,选择与目标样品描述结果最相似的样品描述结果指示信息a和样品描述结果指示信息b,该两个样品描述结果指示信息分别关联多个样品描述结果,将这两个样品描述结果指示信息对应的样品以及各自关联的多个样品描述结果对应的样品一起生成第一样品清单。
53.本技术实施例在通过参考样品描述结果,获取到第一样品清单时,先从样品描述结果指示信息中获取最接近的多个样品描述结果指示信息,再得到多个样品描述结果指示信息各自相关的样品描述结果,从而获取对应的第一样品清单,可以增加查询速度。
54.另外,作为一种实施方式,步骤s4中,逐一通过多个代表样品各自的色谱分析结果,获取相应的第二样品清单,可以通过以下步骤进行。
55.具体的,针对多个代表样品分别进行如下步骤:
步骤s41,从样品集合中的多个色谱分析结果指示信息中,选择多个对照色谱指示信息;每个色谱分析结果指示信息为具备相关性的多个色谱分析结果的代表信息,确定的多个对照色谱指示信息各自与一个代表样品的色谱分析结果的色谱匹配度大于第二预设匹配度。
56.申请实施例中,建立的样品集合的引导策略中包括多个色谱分析结果指示信息,每个色谱分析结果指示信息为关联的多个色谱分析结果的代表信息。其中,可以计算多个色谱分析结果指示信息分别与一个代表样品的色谱分析结果的色谱匹配度,然后从多个色谱分析结果指示信息中,选择色谱匹配度大于第二预设匹配度的色谱分析结果指示信息,将确定的每个色谱分析结果指示信息作为一个色谱分析结果指示信息。第二预设匹配度可以根据实际进行配置,此处不作限定。
57.步骤s42,获取多个对照色谱指示信息各自具备相关性的多个色谱分析结果。
58.步骤s43,根据获取的各个色谱分析结果各自对应的样品,以及多个对照色谱指示信息各自对应的样品,生成相应的第二样品清单。
59.本技术实施例通过待查询样品的参考样品描述结果和参考色谱分析结果,通过多次获取查询的方式,获取到第一样品清单和多个第二样品清单,同时,还通过待查询样品的参考样品描述结果和参考色谱分析结果,进一步获取更多的样品。
60.在一些实施例中,在步骤s4之后,还可以包括:步骤s6,获取所述待查询样品的参考组分信息,参考组分信息表示待查询样品所包含的组分。
61.从本技术实施例步骤s1的描述,色谱分析结果提取模型不仅可以提取样品的色谱分析结果,还可以评估样品所包含的样品组分,例如包含氢气、氧气、一氧化碳等。因此,在一些实施方式中,可以将待查询样品输入上述色谱分析结果提取模型,获得参考组分信息。
62.步骤s7,获取第三样品清单,第三样品清单包含的各个样品各自的组分信息与参考组分信息匹配。
63.其中,可以确定待查询样品的参考组分信息中所包含的多个样品组分,例如包含样品组分甲和样品组分乙,然后从样品集合中的所有样品中,获取组分信息与参考组分信息相同的各个样品。其中,样品集合中的各个样品的组分信息可以预先通过色谱分析结果提取模型得到。
64.具体的,可以基于预先建立的引导策略帮助获取第三样品清单,例如,步骤s7可以包括以下步骤:步骤s71,从样品集合中的多个样品组分指示信息中,选择与所述参考组分信息匹配的不少于一个样品组分指示信息,每个样品组分指示信息具备相关性有多个包含相应样品组分的样品。
65.本技术实施例中,建立的样品集合的引导策略中包括多个样品组分指示信息,每个样品组分指示信息关联有多个包含相应样品组分的样品,在获得待查询样品的参考组分信息后,可以确定待查询样品所包含的多个样品组分,然后,从引导策略中选择确定的多个样品组分,分别对应的样品组分指示信息。
66.步骤s72,获取确定的不少于一个样品组分指示信息各自具备相关性的多个样品,并根据获取的各个样品,生成所述第三样品清单。
67.步骤s8,基于第三样品清单包含的多个参考样品各自的色谱分析结果,获取相应的第四样品清单,每个第四样品清单包含的各个样品,与相应参考样品的色谱分析结果之间的色谱匹配度大于第四阈值。
68.第三样品清单中的多个参考样品可以是与待查询样品具有相似色谱分析结果的样品,可以计算第三样品清单中所有样品各自与待查询样品的色谱匹配度,然后通过所有样品的色谱匹配度,从所有样品中选择与待查询样品的分析结果最接近的多个参考样品。
69.进一步地,通过每个参考样品的色谱分析结果,可以获取一个第四样品清单,具体地,可以计算样品集合中各个样品的色谱分析结果,与参考样品的色谱分析结果的色谱相似度,然后获取色谱相似度大于第四阈值的多个样品,获得第四样品清单。第四阈值的大小可以根据实际配置,此处不作限定。
70.在步骤s8中,基于第三样品清单包含的多个参考样品各自的色谱分析结果,获取相应的第四样品清单。可以包括如下步骤:步骤s81,从第三样品清单中选择多个参考样品,并将待查询样品作为一个参考样品。
71.其中,多个参考样品各自的色谱分析结果,与参考色谱分析结果的色谱匹配度,大于第三预设匹配度。第三预设匹配度的实际大小可以根据情况自由设置,此处不做限定。
72.步骤s82,分别通过获得的多个参考样品各自的色谱分析结果,获取相应的第四样品清单,每个第四样品清单包含的各个样品,与相应参考样品的色谱分析结果之间的色谱匹配度,大于第四预设匹配度。
73.其中,分别通过获得的多个参考样品各自的色谱分析结果,获取相应的第四样品清单,可以执行以下过程:对于多个参考样品各自的色谱分析结果分别进行以下步骤:步骤s821,从样品集合中的多个色谱分析结果指示信息中,选择多个对照色谱指示信息。
74.每个色谱分析结果指示信息为具备相关性的多个色谱分析结果的代表信息,确定的多个对照色谱指示信息各自与一个参考样品的色谱分析结果的色谱匹配度,大于第四预设匹配度。
75.步骤s822,获取多个对照色谱指示信息各自具备相关性的多个色谱分析结果。
76.步骤s823,根据获取的各个色谱分析结果各自对应的样品,以及多个对照色谱指示信息各自对应的样品,生成相应的第四样品清单。
77.通过本技术以上实施例,在以待查询样品的参考样品描述结果和参考色谱分析结果进行多次查询的基础上,通过待查询样品的参考组分信息以及色谱分析结果,开启又一个多次查询,不仅可以获取与待查询样品具有相同组分信息的样品,还可以进一步获取与待查询样品具有相似色谱分析结果的样品,从而进一步获取足够多的样品,增加了查询的结果,进而提高查询结果的精确度。
78.经过步骤s6-s8之后,步骤s5通过获取的多个第二样品清单以及第一样品清单,确定查询到的参考样品清单,具体可以包括步骤s9,基于第一样品清单、多个第二样品清单、第三样品清单以及多个第四样品清单,确定查询到的参考样品清单。
79.具体的,该步骤s9可以包括:
步骤s91,对于第一样品清单、多个第二样品清单、第三样品清单以及多个第四样品清单包含的各个样品,根据各个样品各自的样品描述结果与参考样品描述结果的描述匹配度,各个样品各自的色谱分析结果与参考色谱分析结果的色谱匹配度,以及各个样品各自的组分信息的分析结果,将各个样品按顺序排列。
80.各个样品各自的组分信息的分析结果,可以采用以下过程获取得到:确定参考组分信息中包含的不少于一个样品组分,并获取不少于一个样品组分各自的第一预估结果;针对各个样品,分别执行以下操作:根据一个样品的组分信息中,不少于一个样品组分各自的第二预估结果,以及不少于一个物体组分各自的第一预估结果,确定一个样品的组分信息的分析结果。
81.举例说明,待查询样品的参考组分信息中包含样品组分a、样品组分b、样品组分c、样品组分d,四个样品组分分别对应:氢气、氧气、一氧化碳、硫化氢;其中,上述色谱分析结果提取模型对这四个样品组分的预估结果大于预估估值,该预估估值可以根据实际需求进行配置。获取的各个样品的组分信息与参考组分信息相同,因为各个样品的组分信息也包括了上述四个样品组分。色谱分析结果提取模型在预估各个样品的组分信息时,还可以输出组分信息中包含的各个样品组分的预估结果,即能得到获取的每个样品对应的上述四个样品组分的第二预估结果。例如,待查询样品的参考组分信息中,上述四个样品组分各自的第一预估结果分别为p1、p2、p3、p4,这几个第一预估结果均大于预估估值。
82.步骤s92,从排序后的各个样品中选择多个待查询样品,获得查询到的参考样品清单。
83.本技术实施例中,得到获取的所有样品后,按照描述匹配度、色谱匹配度、组分信息的评估值的总匹配度,将各个样品按顺序排列,选择排在靠前的多个参考样品。使得描述匹配度、色谱匹配度、组分信息对排序的结果共同起到激励,使结果更精准。
84.综上所述,本技术实施例提供的基于人工智能和色谱分析的样品查询方法,通过获取待查询样品的参考样品描述结果和参考色谱分析结果,再通过参考样品描述结果获取第一样品清单,然后从第一样品清单中确定多个代表样品,之后逐一通过多个代表样品各自的色谱分析结果,获取相应的第二样品清单,最后通过获取的多个第二样品清单以及第一样品清单,确定查询到的参考样品清单。不仅能直接查询到记录有描述结果的样品,而且能够查询到与待查询样品色谱分析结果匹配的样品,增加了查询到的参考样品的个数,填补了因漏记录或错记录产生的查询缺失。
85.此外,本技术实施例提供的服务器200中,样品查询装置210用于执行本技术实施例提供的基于人工智能和色谱分析的样品查询方法,该样品查询装置210可以包括多个功能模块,请参照图5,是样品查询装置210的功能模块架构示意图,该各个功能模块可以是通过软件程序实现的,或者硬件电路实现的模块。
86.样品查询装置210包括查询数据获取模块211、样品获取模块212、样品选择模块213、合成模块214。其中,查询数据获取模块211用于获取待查询样品的参考样品描述结果和参考色谱分析结果。样品获取模块212用于通过参考样品描述结果获取第一样品清单,第一样品清单包含的各个样品各自的样品描述结果,与参考样品描述结果的描述匹配度大于第一阈值。样品选择模块213用于从第一样品清单中确定多个代表样品,多个代表样品各自的色谱分析结果与参考色谱分析结果的色谱匹配度大于第二阈值。样品获取模块212还用
于逐一通过多个代表样品各自的色谱分析结果,获取相应的第二样品清单,每个第二样品清单包含的各个样品,与相应的代表样品的色谱分析结果之间的色谱匹配度大于第三阈值。合成模块214用于通过获取的多个第二样品清单以及第一样品清单,确定查询到的参考样品清单。
87.由于在本技术实施例的前面内容中对本技术实施例提供的基于人工智能和色谱分析的样品查询方法的各个步骤进行了实现原理的说明,则此处不再对样品查询装置210的相关原理进行赘述。
88.本技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,当计算机程序在计算机上执行时,使得计算机执行本技术实施例提供的色谱仪试验数据验证方法。
89.需要理解的是,针对上述内容没有进行名词解释的技术术语,本领域技术人员可以根据上述所公开的内容进行前后推导毫无疑义地确定其所指代的含义,例如针对一些阈值、系数等术语,本领域技术人员可以根据前后的逻辑关系进行推导和确定,这些数值的取值范围可以根据实际情况进行选取。
90.本领域技术人员可以根据上述已公开的内容毫无疑义对一些预设的、基准的、预定的、设定的以及偏好标签的技术特征/技术术语进行确定。对于一些未作解释的技术特征术语,本领域技术人员完全能够基于前后文的逻辑关系进行合理地、毫无疑义地推导,从而清楚、完整地实施上述技术方案。未作解释的技术特征术语的前缀和后缀,例如“第一”、“第二”、“代表”、“参考”、“结果”、“清单”、“列表”等,可以根据前后文进行毫无疑义地推导和确定。
91.本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
92.或者,发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例上述方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
93.基于同一技术构思,本技术实施例还一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,当上述计算机指令在计算机上运行时,使得计算机执行如前文论述的用于即时通讯的应用的启动方法。
94.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产
品的形式。
95.显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。

技术特征:
1.一种基于人工智能和色谱分析的样品查询方法,其特征在于,包括:获取待查询样品的参考样品描述结果和参考色谱分析结果;通过所述参考样品描述结果获取第一样品清单,所述第一样品清单包含的各个样品各自的样品描述结果,与所述参考样品描述结果的描述匹配度大于第一阈值;从所述第一样品清单中确定多个代表样品,所述多个代表样品各自的色谱分析结果与所述参考色谱分析结果的色谱匹配度大于第二阈值;逐一通过所述多个代表样品各自的色谱分析结果,获取相应的第二样品清单,每个所述第二样品清单包含的各个样品,与相应的代表样品的色谱分析结果之间的色谱匹配度大于第三阈值;通过获取的多个第二样品清单以及所述第一样品清单,确定查询到的参考样品清单。2.根据权利要求1所述的方法,其特征在于,所述通过所述参考样品描述结果获取第一样品清单,包括:从样品集合中的多个样品描述结果指示信息中,选择多个对照描述指示信息,每个样品描述结果指示信息为具备相关性的多个样品描述结果的代表信息,所述多个对照描述指示信息各自与所述参考样品描述结果的描述匹配度大于第一预设匹配度;获取所述多个对照描述指示信息各自具备相关性的多个样品描述结果;根据获取的各个样品描述结果各自对应的样品,以及所述多个对照描述指示信息各自对应的样品,生成所述第一样品清单。3.根据权利要求1所述的方法,其特征在于,所述逐一通过所述多个代表样品各自的色谱分析结果,获取相应的第二样品清单,包括:针对所述多个代表样品分别进行如下步骤:从样品集合中的多个色谱分析结果指示信息中,选择多个对照色谱指示信息;每个色谱分析结果指示信息为具备相关性的多个色谱分析结果的代表信息,确定的多个对照色谱指示信息各自与一个代表样品的色谱分析结果的色谱匹配度大于第二预设匹配度;获取所述多个对照色谱指示信息各自具备相关性的多个色谱分析结果;根据获取的各个色谱分析结果各自对应的样品,以及所述多个对照色谱指示信息各自对应的样品,生成相应的第二样品清单。4.根据权利要求1~3任一项所述的方法,其特征在于,所述获取待查询样品的参考样品描述结果和参考色谱分析结果,包括:获取样品描述结果提取模型;将所述待查询样品的文字描述结果输入所述样品描述结果提取模型,得到所述样品描述结果;所述样品描述结果提取模型的训练过程包括:获取样品描述数据训练样本,所述描述数据训练样本包括参考样品描述文本、匹配样品描述文本和非匹配样品描述文本;根据所述样品描述数据训练样本,采用预设的损失函数对所述样品描述结果提取模型进行训练直至满足预设训练停止条件;获取色谱分析结果提取模型,所述色谱分析结果提取模型通过标记有样品组分的三元组训练样本训练得到;
将所述待查询样品的色谱试验数据输入所述色谱分析结果提取模型,得到色谱分析结果。5.根据权利要求4所述的方法,其特征在于,所述通过获取的多个第二样品清单以及所述第一样品清单,确定查询到的参考样品清单,包括:对于所述多个第二样品清单以及所述第一样品清单包含的各个样品,根据所述各个样品各自的样品描述结果与所述参考样品描述结果的描述匹配度,以及所述各个样品各自的色谱分析结果与所述参考色谱分析结果的色谱匹配度,对所述各个样品按顺序排列;从排序后的各个样品中确定多个参考样品,获得查询到的参考样品清单。6.根据权利要求1~3任一项所述的方法,其特征在于,所述方法还包括:获取所述待查询样品的参考组分信息,所述参考组分信息表示所述待查询样品所包含的组分;获取第三样品清单,所述第三样品清单包含的各个样品各自的组分信息与所述参考组分信息匹配;基于所述第三样品清单包含的多个参考样品各自的色谱分析结果,获取相应的第四样品清单,每个所述第四样品清单包含的各个样品,与相应参考样品的色谱分析结果之间的色谱匹配度大于第四阈值;所述通过获取的多个第二样品清单以及所述第一样品清单,确定查询到的参考样品清单,包括:基于所述第一样品清单、所述多个第二样品清单、所述第三样品清单以及所述多个第四样品清单,确定查询到的参考样品清单。7.根据权利要求6所述的方法,其特征在于,所述获取第三样品清单,包括:从样品集合中的多个样品组分指示信息中,选择与所述参考组分信息匹配的不少于一个样品组分指示信息,每个样品组分指示信息具备相关性有多个包含相应样品组分的样品;获取确定的不少于一个样品组分指示信息各自具备相关性的多个样品,并根据获取的各个样品,生成所述第三样品清单。8.根据权利要求6所述的方法,其特征在于,所述基于所述第三样品清单包含的多个参考样品各自的色谱分析结果,获取相应的第四样品清单,包括:从所述第三样品清单中选择多个参考样品,并将所述待查询样品作为一个参考样品,其中,所述多个参考样品各自的色谱分析结果,与所述参考色谱分析结果的色谱匹配度,大于第三预设匹配度;分别通过获得的多个参考样品各自的色谱分析结果,获取相应的第四样品清单,每个第四样品清单包含的各个样品,与相应参考样品的色谱分析结果之间的色谱匹配度,大于第四预设匹配度;所述分别通过获得的多个参考样品各自的色谱分析结果,获取相应的第四样品清单,包括:对于所述多个参考样品各自的色谱分析结果分别进行以下步骤:从样品集合中的多个色谱分析结果指示信息中,选择多个对照色谱指示信息,每个色谱分析结果指示信息为具备相关性的多个色谱分析结果的代表信息,确定的多个对照色谱
指示信息各自与一个参考样品的色谱分析结果的色谱匹配度,大于所述第四预设匹配度;获取所述多个对照色谱指示信息各自具备相关性的多个色谱分析结果;根据获取的各个色谱分析结果各自对应的样品,以及所述多个对照色谱指示信息各自对应的样品,生成相应的第四样品清单。9.根据权利要求6所述的方法,其特征在于,所述获取所述待查询样品的参考色谱分析结果,包括:获取色谱分析结果提取模型;将所述待查询样品的色谱试验数据输入所述色谱分析结果提取模型,得到色谱分析结果;所述色谱分析结果提取模型通过标记有样品组分的三元组训练样本训练得到,所述三元组训练样本包括参考样品色谱数据、匹配样品色谱数据和非匹配样品色谱数据;所述获取所述待查询样品的参考组分信息,包括:将所述待查询样品的色谱试验数据输入所述色谱分析结果提取模型,得到所述参考组分信息;所述基于所述第一样品清单、所述多个第二样品清单、所述第三样品清单以及所述多个第四样品清单,确定查询到的参考样品清单,包括:对于所述第一样品清单、所述多个第二样品清单、所述第三样品清单以及所述多个第四样品清单包含的各个样品,根据所述各个样品各自的样品描述结果与所述参考样品描述结果的描述匹配度,所述各个样品各自的色谱分析结果与所述参考色谱分析结果的色谱匹配度,以及所述各个样品各自的组分信息的分析结果,将所述各个样品按顺序排列;从排序后的各个样品中选择多个待查询样品,获得查询到的参考样品清单;所述各个样品各自的组分信息的分析结果,采用以下过程获取得到:确定所述参考组分信息中包含的不少于一个样品组分,并获取所述不少于一个样品组分各自的第一预估结果;针对所述各个样品,分别执行以下操作:根据一个样品的组分信息中,所述不少于一个样品组分各自的第二预估结果,以及所述不少于一个物体组分各自的第一预估结果,确定所述一个样品的组分信息的分析结果。10.一种服务器,其特征在于,包括处理器和存储器,所述存储器用于存放计算机程序,所述处理器用于执行所述存储器上所存放的计算机程序,以实现上述权利要求1~9任一项所述方法的步骤。

技术总结
本申请实施例提供一种基于人工智能和色谱分析的样品查询方法及服务器,通过获取待查询样品的参考样品描述结果和参考色谱分析结果,再通过参考样品描述结果获取第一样品清单,然后从第一样品清单中确定多个代表样品,之后逐一通过多个代表样品各自的色谱分析结果,获取相应的第二样品清单,最后通过获取的多个第二样品清单以及第一样品清单,确定查询到的参考样品清单。不仅能直接查询到记录有描述结果的样品,而且能够查询到与待查询样品色谱分析结果匹配的样品,增加了查询到的参考样品的个数,弥补了因漏记录或错记录导致的查询缺失。缺失。缺失。


技术研发人员:王东强 冀禹璋
受保护的技术使用者:华谱科仪(北京)科技有限公司
技术研发日:2022.02.10
技术公布日:2022/3/8

最新回复(0)