本发明涉及自然语言处理,特别是涉及一种文本分析问题的生成方法、装置、电子设备及存储介质。
背景技术:
1、大语言模型(large language model,llm)的出现为复杂长文本分析,例如剧情、剧本及文学等产物的解构、分析、评价等,提供了可能,但仍没有完备的通用、垂类解决方案。通过借助llm来进行长文本的分析,需要能提出有关特定长文本的高质量的问题。
2、可以通过对llm预训练模型进行精调得到解决长文本分析的模型,但是,对llm预训练模型进行精调,训练所需时间长,硬件资源成本高,而且由于此类问题没有标准答案,无法轻易获得训练集,如果要形成一定量级的训练数据,需要相应专业背景的大量人力投入,成本较高。
技术实现思路
1、本发明实施例的目的在于提供一种文本分析问题的生成方法、装置、电子设备及存储介质,以提高文本分析问题的生成效率,降低成本。具体技术方案如下:
2、在本发明实施的第一方面,首先提供了一种文本分析问题的生成方法,包括:
3、获取大语言模型的身份角色,所述身份角色与待分析文本的文本类型对应;
4、根据所述身份角色,通过所述大语言模型基于自问答形式获取所述文本类型所对应的专业知识;
5、根据所述专业知识,通过所述大语言模型基于自问答形式生成分析所述待分析文本的文本分析问题,所述文本分析问题用于向所述大语言模型进行提问,以对所述待分析文本进行分析。
6、在本发明实施的第二方面,还提供了一种文本分析问题的生成装置,包括:
7、角色获取模块,用于获取大语言模型的身份角色,所述身份角色与待分析文本的文本类型对应;
8、专业知识获取模块,用于根据所述身份角色,通过所述大语言模型基于自问答形式获取所述文本类型所对应的专业知识;
9、分析问题生成模块,用于根据所述专业知识,通过所述大语言模型基于自问答形式生成分析所述待分析文本的文本分析问题,所述文本分析问题用于向所述大语言模型进行提问,以对所述待分析文本进行分析。
10、在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的文本分析问题的生成方法。
11、在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的文本分析问题的生成方法。
12、本发明实施例提供的文本分析问题的生成方法、装置、电子设备及存储介质,通过获取大语言模型的身份角色,根据该身份角色,通过大语言模型基于自问答形式获取该身份角色所应具有的专业知识,根据该专业知识,通过大语言模型基于自问答形式生成分析待分析文本的文本分析文本,由于可以通过该大语言模型基于身份角色获取该身份角色所应具有的专业知识,进而基于专业知识可以生成高质量的文本分析问题,不需要进行精调训练,可以减少文本分析问题的生成时间,提高文本分析问题的生成效率,而且不需要投入大量人力,可以降低成本。
1.一种文本分析问题的生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述身份角色,通过所述大语言模型基于自问答形式获取所述文本类型所对应的专业知识,包括:
3.根据权利要求2所述的方法,其特征在于,所述通过所述大语言模型获取所述专业知识问题所对应的第一中间答案,包括:
4.根据权利要求2所述的方法,其特征在于,在所述获取到所述文本类型所对应的专业知识之后,还包括:
5.根据权利要求1所述的方法,其特征在于,所述根据所述身份角色,通过所述大语言模型基于自问答形式获取所述文本类型所对应的专业知识,包括:
6.根据权利要求5所述的方法,其特征在于,还包括:
7.根据权利要求1所述的方法,其特征在于,所述通过所述大语言模型根据所述专业知识,基于自问答形式生成分析所述待分析文本的文本分析问题,包括:
8.根据权利要求7所述的方法,其特征在于,所述通过所述大语言模型根据所述专业知识,生成初始分析问题,包括:
9.根据权利要求7所述的方法,其特征在于,在所述生成所述文本分析问题之后,还包括:
10.一种文本分析问题的生成装置,其特征在于,包括:
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一所述的方法。
13.一种计算机程序产品,所述计算机程序产品包含指令,其特征在于,当所述计算机程序产品在计算机上运行时,使得计算机实现如权利要求1-9中任一所述的方法。