一种开放域问答方法、装置、设备及存储介质

专利查询2月前  31


本发明属于自然语言处理,具体涉及一种开放域问答方法、装置、设备及存储介质。


背景技术:

1、开放域问答是自然语言处理领域中一个具有挑战性的任务,具有开放域性和知识密集性两大性质,开放域问答任务对于智能客服、聊天机器人、问答系统等应用的发展至关重要。

2、随着预训练的大语言模型(large language models,llm)的迅速发展,llm可以被用来处理开放域问答任务,将问题输入给大语言模型,利用大语言模型在训练期间学习到的知识生成答案。然而,对于这类隐式的内部参数化知识,llm在基于问答的提示下无法有效利用,以至于llm表现出“幻觉”现象,无法得到正确答案。目前,主要通过检索增强生成的方法来缓解了llm的“幻觉”现象,即将问题作为查询通过检索器从外部知识源中检索与问题相关的文档,然后将llm作为阅读器,输入检索到的文档和问题给llm并输出答案。

3、但对于开放域问答领域中的复杂问题(多跳问答问题)来说,现有的检索器无法一次性检索到回答该问题的全部信息,往往得到的是回答该问题的部分或初步信息,导致llm面对复杂的多跳问题时,会因为信息不足而无法正确回答,因此,如何提高llm对于复杂问题的回答准确性成为待解决的问题。


技术实现思路

1、为了解决现有技术中llm面对复杂的多跳问题时,会因为信息不足而无法正确回答的问题,本发明提供了一种开放域问答方法、装置、设备及存储介质。

2、为了实现上述目的,本发明提供如下技术方案:

3、一种开放域问答方法,包括:

4、获取待查询问题,在知识库中检索待查询问题的相关文档;

5、将待查询问题和相关文档输入预训练的问答模型,生成待查询问题的候选答案;

6、验证候选答案的正确性,若候选答案未通过验证,则基于检索得到的相关文档和待查询问题生成关于候选答案中缺失内容的反馈;

7、基于候选答案中缺失内容的反馈在知识库中再次检索待查询问题的相关文档;

8、迭代生成候选答案、验证和再次检索的过程,直至候选答案通过验证。

9、可选地,在知识库中检索待查询问题的相关文档之前,还包括:

10、将基于bert的双塔结构的密集检索器作为检索器,检索器包括文档编码器;

11、通过文档编码器对维基百科语料库中所有文档进行编码得到文档向量,并将文档向量载入到向量数据库fassi中,以构建知识库。

12、可选地,检索器还包括查询编码器,在知识库中检索待查询问题的相关文档,包括:

13、将待查询的问题通过查询编码器进行编码,得到待查询问题的问题向量;

14、对问题向量与向量数据库fassi中的所有文档向量计算相似度得分,并将文档按照相似度得分进行排序;

15、选取相似性得分排名前k位的文档作为待查询问题的相关文档,其中,k为大于等于1的整数。

16、可选地,验证候选答案的正确性,包括:

17、将检索得到的相关文档、待查询问题和候选答案输入基于大语言模型的证据提取模型,提取支持候选答案的证据片段;

18、将证据片段和待查询问题输入预训练的问答模型,生成校验答案;

19、通过完全匹配方式判断校验答案与候选答案的一致性,若校验答案与候选答案一致,则候选答案通过验证,若校验答案与候选答案不一致,则候选答案未通过验证。

20、可选地,还包括:

21、在将待查询问题和相关文档输入预训练的问答模型时,输入回答样例,使得问答模型按照回答样例生成待查询问题的候选答案。

22、可选地,基于检索得到的相关文档和待查询问题生成关于候选答案中缺失内容的反馈,包括:

23、将检索得到的相关文档和待查询问题输入基于大语言模型的反馈生成模型,通过反馈生成模型生成关于候选答案中缺失内容的反馈。

24、可选地,还包括:验证候选答案的正确性时,若候选答案通过验证,则输出候选答案。

25、本发明还提供一种开放域问答装置,包括:

26、第一检索模块,用于获取待查询问题,在知识库中检索待查询问题的相关文档;

27、生成模块,用于将待查询问题和相关文档输入预训练的问答模型,生成待查询问题的候选答案;

28、验证模块,用于验证候选答案的正确性,若候选答案未通过验证,则基于检索得到的相关文档和待查询问题生成关于候选答案中缺失内容的反馈;

29、第二检索模块,用于基于候选答案中缺失内容的反馈在知识库中再次检索待查询问题的相关文档;

30、迭代模块,用于迭代生成候选答案、验证和再次检索的过程,直至候选答案通过验证。

31、本发明还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述开放域问答方法。

32、本发明还提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述开放域问答方法。

33、本发明提供的开放域问答方法具有以下有益效果:

34、本发明在通过预训练的问答模型生成待查询问题的候选答案后并不直接将候选答案作为最终答案,而是对候选答案的准确性进行验证,在未通过验证时,基于检索的相关文档和待查询问题生成候选答案中缺失内容的反馈,基于反馈在知识库中再次检索待查询问题的相关文档,进而生成候选答案;由于候选答案准确性不高时,再基于相同的查询问题依旧会检索到相同的内容,无法补充缺失的内容,因此,不断生成候选答案中缺失内容的反馈进行迭代检索,会使得检索到的相关文档更加全面和准确,从而使得问答模型接收的提示内容更加丰富生成更准确的答案。



技术特征:

1.一种开放域问答方法,其特征在于,包括:

2.根据权利要求1所述的开放域问答方法,其特征在于,在知识库中检索待查询问题的相关文档之前,还包括:

3.根据权利要求2所述的开放域问答方法,其特征在于,检索器还包括查询编码器,在知识库中检索待查询问题的相关文档,包括:

4.根据权利要求1-3任一项所述的开放域问答方法,其特征在于,验证候选答案的正确性,包括:

5.根据权利要求1-3任一项所述的开放域问答方法,其特征在于,还包括:

6.根据权利要求1-3任一项所述的开放域问答方法,其特征在于,基于检索得到的相关文档和待查询问题生成关于候选答案中缺失内容的反馈,包括:

7.根据权利要求1-3任一项所述的开放域问答方法,其特征在于,还包括:

8.一种开放域问答装置,其特征在于,包括:

9.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至7任一项所述的开放域问答方法。

10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的开放域问答方法。


技术总结
本发明提供了一种开放域问答方法、装置、设备及存储介质,属于自然语言处理技术领域,包括:获取待查询问题,在知识库中检索待查询问题的相关文档;将待查询问题和相关文档输入预训练的问答模型,生成待查询问题的候选答案;验证候选答案的正确性,若候选答案未通过验证,则基于检索得到的相关文档和待查询问题生成关于候选答案中缺失内容的反馈;基于候选答案中缺失内容的反馈在知识库中再次检索待查询问题的相关文档;迭代生成候选答案、验证和再次检索的过程,直至候选答案通过验证。该方法能够提高大语言模型对于复杂问题的回答准确性。

技术研发人员:黄京胜,张文桥,汤斯亮,李俊成,庄越挺
受保护的技术使用者:浙江大学
技术研发日:
技术公布日:2024/12/5

最新回复(0)