应用级医疗大模型训练、应用方法、设备、介质及产品

本申请涉及人工智能，特别是涉及一种应用级医疗大模型训练、应用方法、设备、介质及产品。

背景技术：

1、医疗是与社会经济和人民生活最密切的场景之一。近年来，医学人工智能是最受关注的赛道。

2、作为医疗ai领域最新出现的革命性技术-生成式人工智能/大模型技术，也就是人们熟知的chatgpt背后的核心技术，被广泛看好。麦肯锡的研究报告认为，生成式ai有望为全球经济贡献约7万亿美元的价值，并将ai的总体效益提高50％左右。

3、目前主流的大语言模型，如chatgpt、flan-palm、llama等，它们收录了范围十分广阔的知识，包括论文、学术报告、网络聊天对话等信息，可以回答很多知识种类的内容，形成了通用的大语言模型。但这类通用的大语言模型却是“泛而不精”，在某些特定场景，如临床环境下，它们无法达到能够在临床环境中应用的灵敏度和准确度。

技术实现思路

1、本申请的目的是提供一种应用级医疗大模型训练、应用方法、设备、介质及产品，能够学习特定时空下的有限规律和可能性，相对于通用的基座大语言模型，具有更强的针对临床环境的特异性性能，保证了灵敏度、准确度和更好的安全性。

2、为实现上述目的，本申请提供了如下方案：

3、第一方面，本申请提供了一种应用级医疗大模型训练方法，所述应用级医疗大模型训练方法包括：

4、对医疗场景进行分割，得到若干个小世界；

5、针对每个所述小世界：

6、获取所述小世界中的医患对话数据；

7、对所述医患对话数据进行匿名化处理，得到匿名化数据；

8、对所述匿名化数据进行精炼，得到适用于基座大语言模型的训练数据；所述训练数据包括：知识库和提示词；

9、利用所述训练数据训练基座大语言模型，得到适用于所述小世界的应用级医疗大模型。

10、可选地，所述匿名化数据包括音频数据和视频数据；对所述匿名化数据进行精炼，得到适用于基座大语言模型的训练数据，具体包括：

11、将所述音频数据转录为文字数据；

12、分别提取所述音频数据、所述视频数据和所述文字数据的模态特征，得到音频模态特征、视频模态特征和文字模态特征；

13、将所述音频模态特征、所述视频模态特征和所述文字模态特征融合，得到融合特征；

14、对所述融合特征进行情感识别，得到情感识别结果；

15、提取所述视频模态特征中的人物身体特征、人物面部特征和场景特征；

16、将所述人物身体特征、人物面部特征和场景特征输入动作检测模型，得到人物动作；

17、将所述情感识别结果、所述人物动作和所述文字数据作为训练数据。

18、可选地，对所述融合特征进行情感识别，得到情感识别结果，具体包括：

19、利用长短程记忆神经网络或自注意力模型对所述融合特征进行情感识别，并将情感识别的结果转换为情感坐标值形式，得到情感识别结果；所述情感坐标值形式为(v，a，l)形式；其中，v代表情感的效价，a代表情感的唤起度，l代表情感的喜好度。

20、可选地，利用所述训练数据训练基座大语言模型，得到适用于所述小世界的应用级医疗大模型，具体包括：

21、利用微调和提示调优方法，通过所述训练数据训练基座大语言模型，得到适用于所述小世界的应用级医疗大模型。

22、可选地，利用所述训练数据训练基座大语言模型，得到适用于所述小世界的应用级医疗大模型，具体包括：

23、对所述基座大语言模型的输出分别进行独立语言模型评估、rag管道评估和关键词评估；

24、当所述独立语言模型评估、rag管道评估和关键词评估均通过时，输出所述基座大语言模型的输出；否则，输出预警显示并重新获取基座大语言模型的输出。

25、第二方面，本申请提供了一种应用级医疗大模型应用方法，所述应用级医疗大模型应用方法包括：

26、获取导诊需求信息；

27、将所述导诊需求信息作为提示词，输入应用级医疗大模型，得到导诊输出；所述应用级医疗大模型是通过上述任一项所述的应用级医疗大模型训练方法训练得到的。

28、可选地，在所述将所述导诊需求信息输入应用级医疗大模型，得到导诊输出之后，还包括：

29、获取所述导诊需求信息和处理后的导诊输出；

30、利用所述导诊需求信息和处理后的导诊输出对所述应用级医疗大模型进行提示调优。

31、第三方面，本申请提供了一种计算机设备，包括：存储器、处理器以存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序以实现上述任一项所述的应用级医疗大模型训练方法或应用级医疗大模型应用方法。

32、第四方面，本申请提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述任一项所述的应用级医疗大模型训练方法或应用级医疗大模型应用方法。

33、第五方面，本申请提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述任一项所述的应用级医疗大模型训练方法或应用级医疗大模型应用方法。

34、根据本申请提供的具体实施例，本申请公开了以下技术效果：

35、本申请提供了一种应用级医疗大模型训练、应用方法、设备、介质及产品，首先，对医疗场景进行分割，得到若干个小世界；然后，针对每个所述小世界：获取所述小世界中的医患对话数据；对所述医患对话数据进行匿名化处理，得到匿名化数据；对所述匿名化数据进行精炼，得到适用于基座大语言模型的训练数据；所述训练数据包括：知识库和提示词；利用所述训练数据训练基座大语言模型，得到适用于所述小世界的应用级医疗大模型。本申请将通用的基座大语言模型的数据来源，定义为“大世界”，将这个“大世界”根据场景划分为多个“小世界”，在特定的一个小世界内进行全景全量的数据采集，建立小世界增强模型，学习特定时空下的有限规律和可能性，相对于通用的基座大语言模型，具有更强的针对临床环境的特异性性能，保证了灵敏度、准确度和更好的安全性。

技术特征：

1.一种应用级医疗大模型训练方法，其特征在于，所述应用级医疗大模型训练方法包括：

2.根据权利要求1所述的应用级医疗大模型训练方法，其特征在于，所述匿名化数据包括音频数据和视频数据；对所述匿名化数据进行精炼，得到适用于基座大语言模型的训练数据，具体包括：

3.根据权利要求2所述的应用级医疗大模型训练方法，其特征在于，对所述融合特征进行情感识别，得到情感识别结果，具体包括：

4.根据权利要求1所述的应用级医疗大模型训练方法，其特征在于，利用所述训练数据训练基座大语言模型，得到适用于所述小世界的应用级医疗大模型，具体包括：

5.根据权利要求4所述的应用级医疗大模型训练方法，其特征在于，利用所述训练数据训练基座大语言模型，得到适用于所述小世界的应用级医疗大模型，具体包括：

6.一种应用级医疗大模型应用方法，其特征在于，所述应用级医疗大模型应用方法包括：

7.根据权利要求6所述的应用级医疗大模型应用方法，其特征在于，在所述将所述导诊需求信息输入应用级医疗大模型，得到导诊输出之后，还包括：

8.一种计算机设备，包括：存储器、处理器以存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序以实现权利要求1-5中任一项所述的应用级医疗大模型训练方法或权利要求6所述的应用级医疗大模型应用方法。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1-5中任一项所述的应用级医疗大模型训练方法或权利要求6所述的应用级医疗大模型应用方法。

10.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1-5中任一项所述的应用级医疗大模型训练方法或权利要求6所述的应用级医疗大模型应用方法。

技术总结
本申请公开了一种应用级医疗大模型训练、应用方法、设备、介质及产品，涉及人工智能技术领域，该方法包括对医疗场景进行分割，得到若干个小世界；针对每个小世界：获取小世界中的医患对话数据；对医患对话数据进行匿名化处理，得到匿名化数据；对匿名化数据进行精炼，得到适用于基座大语言模型的训练数据；利用训练数据训练基座大语言模型，得到适用于小世界的应用级医疗大模型。本申请将通用的基座大语言模型的数据来源划分为多个“小世界”，在特定的一个小世界内进行全景全量的数据采集，建立小世界增强模型，学习特定时空下的有限规律和可能性，相对于通用的基座大语言模型，具有更强的针对临床环境的特异性性能。

技术研发人员：龙尔平,万沛星,黄子耕
受保护的技术使用者：中国医学科学院基础医学研究所
技术研发日：
技术公布日：2024/12/5

专利

最新回复(0)