1.本发明涉及人工智能技术领域,特别涉及一种拒识方法、装置、设备及存储介质。
背景技术:
2.随着人工智能技术的进步,人机语音交互也取得了长足的发展,为了提高用户的使用体验,全双工语音交互模式开始逐步出现,全双工语音交互模式的特点是一次唤醒后,在之后的一定时间内,可以进行多次连续交互。
3.在全双工语音交互模式下,智能语音系统需要持续录入用户输入的语音,并且对录取的语音进行自然语言理解并回复。在这种模式下,需要精准识别出用户输入的一些并非与系统交互的语音(例如与其他人的聊天、个人的自言自语等),并在确定用户未和系统交互时对用户的语音进行拒识,以避免对用户造成打扰。
4.为了实现上述功能,目前的智能语音系统一般通过建立分类模型如域外(out-of-domain,ood)模型,来区分功能范围话术和非功能范围话术(即功能范围外的话术)。这类分类模型主要是基于话术内容进行区分,例如可以区分用户的一句话是想要听歌,还是询问天气,还是一句和功能涉及内容完全无关的话,但是,在针对相似信息内容、不同意图的话术语料(例如“我要去上海”和“我去过上海”)时,区分效果往往不是很好,从而导致拒识效果较差,影响用户体验。
技术实现要素:
5.针对现有技术的上述问题,本发明的目的在于提供一种拒识方法、装置、设备及存储介质,能够提高对信息进行拒识的准确性,进而提高用户与语音交互系统之间的交互效果。
6.为了解决上述问题,本发明提供一种拒识方法,包括:
7.获取待识别的目标信息;
8.将所述目标信息输入预先训练的功能识别模型,得到所述目标信息对应的目标业务功能;
9.将所述目标信息输入预先训练的意图分类模型,得到所述目标信息对应的目标意图类型;
10.根据所述目标业务功能和所述目标意图类型确定是否拒识所述目标信息。
11.进一步地,所述获取待识别的目标信息包括:
12.获取待识别的语音信息;
13.对所述语音信息进行语音识别处理,得到所述语音信息对应的语音文本。
14.进一步地,所述根据所述目标业务功能和所述目标意图类型确定是否拒识所述目标信息包括:
15.获取所述目标业务功能对应的意图类型集;
16.将所述目标意图类型与所述意图类型集进行匹配,得到匹配结果;
17.根据所述匹配结果确定是否拒识所述目标信息。
18.进一步地,所述将所述目标意图类型与所述意图类型集进行匹配,得到匹配结果包括:
19.将所述目标意图类型与所述意图类型集中的各个意图类型分别进行匹配;
20.当所述目标意图类型与所述意图类型集中的任意一个意图类型相匹配时,确定匹配结果为匹配成功;
21.当所述目标意图类型与所述意图类型集中的各个意图类型均不匹配时,确定匹配结果为匹配失败。
22.进一步地,所述根据所述匹配结果确定是否拒识所述目标信息包括:
23.当所述匹配结果为匹配失败时,拒绝识别所述目标信息;
24.当所述匹配结果为匹配成功时,获取所述目标信息对应的语义信息并输出。
25.进一步地,所述方法还包括:
26.利用预先获取到的样本训练所述功能识别模型和所述意图分类模型。
27.本发明另一方面提供一种拒识装置,包括:
28.获取模块,用于获取待识别的目标信息;
29.识别模块,用于将所述目标信息输入预先训练的功能识别模型,得到所述目标信息对应的目标业务功能;
30.分类模块,用于将所述目标信息输入预先训练的意图分类模型,得到所述目标信息对应的目标意图类型;
31.确定模块,用于根据所述目标业务功能和所述目标意图类型确定是否拒识所述目标信息。
32.进一步地,所述装置还包括:
33.训练模块,用于利用预先获取到的样本训练所述功能识别模型和所述意图分类模型。
34.本发明另一方面提供一种电子设备,包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述的拒识方法。
35.本发明另一方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如上述的拒识方法。
36.由于上述技术方案,本发明具有以下有益效果:
37.根据本发明实施例提供的拒识方法,通过利用功能识别模型确定待识别的目标信息对应的目标业务功能,利用意图分类模型确定待识别的目标信息对应的目标意图类型,并通过判断所述目标意图类型是否符合所述目标业务功能所支持的意图类型,来区分所述目标信息是针对所述目标业务类型的功能范围话术还是非功能范围话术,最终对非功能范围话术进行拒识,对于具有相似信息内容、不同意图的话术语料有较好的区分效果,提高了语音交互系统对信息进行拒识的准确性,优化了语音交互系统中的拒识任务,提高了拒识效果,进而可以避免对用户产生不必要的打扰,提高了用户与语音交互系统之间的交互效果,提升了用户体验。
附图说明
38.为了更清楚地说明本发明的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
39.图1是本发明一个实施例提供的实施环境示意图;
40.图2是本发明一个实施例提供的拒识方法的流程图;
41.图3是本发明另一个实施例提供的拒识方法的流程图;
42.图4是本发明一个实施例提供的拒识装置的结构示意图;
43.图5是本发明另一个实施例提供的拒识装置的结构示意图;
44.图6是本发明一个实施例提供的电子设备的结构示意图。
具体实施方式
45.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
46.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
47.为了使本发明实施例公开的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明实施例进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明实施例,并不用于限定本发明实施例。首先,本发明实施例对下述概念进行解释:
48.全双工交互:一次唤醒后,在之后的一定时间内,用户无需唤醒语音系统,可以进行多次连续交互。
49.自然语言理解(natural language understanding,nlu):nlu是人工智能的一个应用领域,是使用自然语言同计算机进行通讯的技术,通过nlu可以让计算机“理解”自然语言,进而执行人类所期望的某些语言功能,换言之,nlu是人与机器交流的桥梁。nlu可以包括但不限于以下内容:
①
能够理解句子的正确次序规则和概念,也能理解不含规则的句子;
②
知道词的确切含义、形式、词类及构词法;
③
了解词的语义分类、词的多义性、词的歧义性;
④
指定和不定特性及所有特性;
⑤
问题领域的结构知识和实践概念;
⑥
语言的语气信息和韵律表现;
⑦
有关语言表达形式的文字知识;
⑧
论域的背景知识。
50.言语意图(speech acts)分类理论:语用学理论,关注言语除信息外承载的行为,并对行为进行意图层面的分类。
51.参考说明书附图1,其示出了本发明一个实施例提供的实施环境示意图,如图1所示,该实施环境可以包括至少一个终端设备110和服务器120。所述服务器120和各个终端设备110可以通过有线或无线通信方式进行直接或间接地连接,本发明实施例对此不做限制。
52.所述终端设备110可以包括智能手机、平板电脑、笔记本电脑、台式计算机、数字助理、智能音箱、智能可穿戴设备、车载终端、服务器等类型的实体设备,也可以包括运行于实体设备中的软体,例如应用程序等,但并不局限于此。所述终端设备110上运行的操作系统可以包括但不限于安卓系统、ios系统、linux系统、windows系统等。
53.所述服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
54.在实际应用中,本发明实施例提供的拒识方法可以应用于全双工交互的场景中。具体地,所述终端设备110可以配置有智能语音系统,所述智能语音系统可以通过语音采集模块采集用户发出的语音信息,并将采集到的语音信息发送至所述服务器120进行处理,所述服务器120可以通过本发明实施例提供的拒识方法对所述语音信息进行拒识判断,确定所述语音信息是否是与所述智能语音系统进行交互的语音,对于并非与智能语音系统进行交互的语音则拒绝识别,不给出任何反馈,对于与智能语音系统进行交互的语音则输出对应的语义信息,进一步生成对应的交互数据发送至所述终端设备110,以使得所述智能语音系统完成与用户的交互行为。
55.需要说明的是,图1仅仅是一种示例。本领域技术人员可以理解,虽然图1中只示出了2个终端设备110,但并不构成对本发明实施例的限定,可以包括比图示更多或更少的终端设备110。
56.参考说明书附图2,其示出了本发明一个实施例提供的一种拒识方法的流程,该方法可以应用于图1中的服务器120中,具体的如图2所示,所述方法可以包括以下步骤:
57.s210:获取待识别的目标信息。
58.本发明实施例中,所述目标信息为需要判断是否拒绝识别的信息,所述目标信息可以为智能语音系统与用户的交互过程中用户输入的各种信息。
59.具体地,所述获取待识别的目标信息可以包括:
60.获取待识别的语音信息;
61.对所述语音信息进行语音识别处理,得到所述语音信息对应的语音文本。
62.具体地,所述终端设备可以配置有智能语音系统,所述智能语音系统可以通过语音采集模块,采集用户输入的语音信息并发送至服务器,所服务器可以采用语音识别技术对所述语音信息进行识别处理,得到所述语音信息对应的语音文本,并将所述语音文本作为所述待识别的目标信息。其中,所述语音采集模块可以为声音传感器、麦克风等。
63.s220:将所述目标信息输入预先训练的功能识别模型,得到所述目标信息对应的目标业务功能。
64.本发明实施例中,所述功能识别模型可以对输入的目标信息进行处理,确定所述目标信息对应的意图,再根据所述目标信息对应的意图确定所述目标信息对应的目标业务功能。其中,所述目标业务功能可以为所述智能语音系统向用户提供的各项功能中的一种
或多种,所述智能语音系统向用户提供的各项功能可以包括现有技术中常见的各项功能,例如查询天气功能、播放音乐功能和发起导航功能等等,本发明实施例在此不再赘述。
65.在一个可能的实施例中,所述方法还可以包括利用预先获取到的样本训练所述功能识别模型的步骤。
66.具体地,可以预先获取标注有对应业务功能的第一训练数据,利用所述第一训练数据对第一预设神经网络模型进行训练,得到所述功能识别模型。其中,所述第一预设神经网络模型可以包括但不局限于现有技术中常用的深度神经网络模型,本发明实施例在此不再赘述。
67.s230:将所述目标信息输入预先训练的意图分类模型,得到所述目标信息对应的目标意图类型。
68.本发明实施例中,所述意图分类模型可以对输入的目标信息进行处理,确定所述目标信息对应的目标意图类型。其中,所述目标意图类型可以为当前应用场景下分类框架中的各种意图类型中的一种或者多种,所述当前应用场景下的分类框架可以基于言语意图分类理论,对当前应用场景下的用户话术信息进行分析来预先确定。
69.示例性地,对于汽车场景,车载智能语音系统中用户话术信息可以包括发起指令的话术和其他非指令类话术,根据发起指令的话术可以确定汽车场景下的分类框架包括发起命令类、意愿表达类、信息提问类等,根据其他非指令类话术可以确定汽车场景下的分类框架还包括事件陈述类、情绪表达类等。
70.需要说明的是,不同应用场景下的分类框架,可以包括相同的意图类型,也可以包括不同的意图类型,本发明实施例对此不作限制。
71.在一个可能的实施例中,所述方法还可以包括利用预先获取到的样本训练所述意图分类模型。
72.具体地,可以预先获取标注有对应意图类型的第二训练数据,利用所述第二训练数据对第二预设神经网络模型进行训练,得到所述意图分类模型。其中,所述第二预设神经网络模型可以包括但不局限于现有技术中常用的深度神经网络模型,本发明实施例在此不再赘述。
73.本发明实施例中,所述意图分类模型对于相似信息内容、不同意图的话术信息可以有较好的区分效果。例如相同事件“听音乐”,可以有不同意图类型的表达方式,如表1所示,区分这些意图类型正是所述意图分类模型的任务。
74.表1
75.话术信息意图类型是否对应业务功能听音乐发起命令(command)对应播放音乐功能我要听音乐表达意愿(desire)对应播放音乐功能我不要听音乐了表达意愿(desire)对应暂停播放音乐功能我爱听音乐表达喜好(preference)不对应业务功能我经常听音乐陈述某件事(inform info)不对应业务功能你听音乐吗对他人进行询问(request)不对应业务功能
76.通过所述意图分类模型,用户在表达相同事件、但不同意图的话术时,就可以更精准地区分用户意图究竟是要发起一个指令,还是并非发起指令(如在和其他人聊天),这种
对用户是否对系统发起指令的精准判断,可以更好地实现智能语音系统的全双工免唤醒功能。
77.需要说明的是,所述步骤s220和步骤s230可以按照上述顺序依次执行,也可以按照其它顺序依次执行,也可以并行地执行,本发明实施例对此不作限制。
78.s240:根据所述目标业务功能和所述目标意图类型确定是否拒识所述目标信息。
79.具体地,如图3所示,所述根据所述目标业务功能和所述目标意图类型确定是否拒识所述目标信息可以包括:
80.s241:获取所述目标业务功能对应的意图类型集。
81.本发明实施例中,可以预先确定当前应用场景中分类框架中的各种意图类型和智能语音系统支持的各项业务功能的对应逻辑,具体地,针对智能语音系统支持的各项业务功能,都有针对功能的功能范围话术,因此可以对各项业务功能对应的功能范围话术进行分析,归纳出特定的几种意图类型,得到所述业务功能对应的意图类型集。示例性地,例如针对查询天气的功能,包括信息询问类话术“今天天气怎么样”,或命令类话术“给我报一下今天的天气”等,因此可以确定查询天气的功能对应的意图类型集可以包括信息询问类型和发起命令类型等。
82.s242:将所述目标意图类型与所述意图类型集进行匹配,得到匹配结果。
83.本发明实施例中,所述将所述目标意图类型与所述意图类型集进行匹配,得到匹配结果可以包括:
84.将所述目标意图类型与所述意图类型集中的各个意图类型分别进行匹配;
85.当所述目标意图类型与所述意图类型集中的任意一个意图类型相匹配时,确定匹配结果为匹配成功;
86.当所述目标意图类型与所述意图类型集中的各个意图类型均不匹配时,确定匹配结果为匹配失败。
87.本发明实施例中,可以将所述目标意图类型与所述意图类型集中的各个意图类型一一进行匹配,确定所述目标意图类型是否与所述意图类型集中的任意一个意图类型相同,即确定所述目标意图类型是否包含于所述意图类型集中,如果所述目标意图类型包含于所述意图类型集中,则匹配成功,否则匹配失败。
88.s243:根据所述匹配结果确定是否拒识所述目标信息。
89.本发明实施例中,所述根据所述匹配结果确定是否拒识所述目标信息可以包括:
90.当所述匹配结果为匹配失败时,拒绝识别所述目标信息;
91.当所述匹配结果为匹配成功时,获取所述目标信息对应的语义信息并输出。
92.本发明实施例中,当所述目标意图类型包含于所述意图类型集中时,可以确定所述目标信息为针对所述目标业务类型的功能范围话术,即需要对所述目标信息进行识别,此时可以基于自然语言理解技术确定所述目标信息对应的语义信息并输出。
93.本发明实施例中,当所述目标意图类型未包含于所述意图类型集中时,可以确定所述目标信息为非功能范围话术,即不需要对所述目标信息进行识别,此时可以拒绝识别所述目标信息。
94.示例性地,假设用户输入的目标信息为“我要去人民广场”,通过功能识别模型确定所述目标信息对应的目标业务功能为“发起导航功能”,通过意图分类模型确定所述目标
信息对应的目标意图类型为“发起命令类”,又假设“发起导航功能”对应的意图类型集包括“发起命令类”、“意愿表达类”和“信息提问类”,那么将所述目标意图类型与所述意图类型集进行匹配的结果为匹配成功,即需要对所述目标信息进行识别并发起交互行为。假设用户输入的目标信息为“我去过人民广场了”或者“我明天再去人民广场”,可以通过意图分类模型确定所述目标信息对应的目标意图类型为“事件陈述类”,那么将所述目标意图类型与所述意图类型集进行匹配的结果为匹配失败,即不需要对所述目标信息进行识别并发起交互行为。
95.在一个可能的实施例中,所述方法还可以包括根据所述语义信息生成针对所述目标信息的交互信息,将所述交互信息发送至终端设备,以使得所述终端设备中的语音交互系统根据所述交互信息执行相应的交互操作的步骤。其中,所述交互信息可以包括针对所述目标信息的回复信息,也可以包括针对目标执行对象的交互操作。当所述交互信息为回复信息时,所述语音交互系统可以对所述回复信息进行展示,例如在指定界面中展示所述回复信息,或者通过语音播报所述回复信息。当所述交互信息为针对目标执行对象的交互操作时,所述语音交互系统可以生成执行所述交互操作的操作指令并发送给所述目标执行对象,所述目标执行对象可以响应于所述操作指令来执行所述交互操作,得到执行结果。
96.综上所述,根据本发明实施例提供的拒识方法,通过利用功能识别模型确定待识别的目标信息对应的目标业务功能,利用意图分类模型确定待识别的目标信息对应的目标意图类型,并通过判断所述目标意图类型是否符合所述目标业务功能所支持的意图类型,来区分所述目标信息是针对所述目标业务类型的功能范围话术还是非功能范围话术,最终对非功能范围话术进行拒识,对于具有相似信息内容、不同意图的话术语料有较好的区分效果,提高了语音交互系统对信息进行拒识的准确性,优化了语音交互系统中的拒识任务,提高了拒识效果,进而可以避免对用户产生不必要的打扰,提高了用户与语音交互系统之间的交互效果,提升了用户体验。
97.参考说明书附图4,其示出了本发明一个实施例提供的一种拒识装置400的结构。如图4所示,所述装置400可以包括:
98.获取模块410,用于获取待识别的目标信息;
99.识别模块420,用于将所述目标信息输入预先训练的功能识别模型,得到所述目标信息对应的目标业务功能;
100.分类模块430,用于将所述目标信息输入预先训练的意图分类模型,得到所述目标信息对应的目标意图类型;
101.确定模块440,用于根据所述目标业务功能和所述目标意图类型确定是否拒识所述目标信息。
102.在一个可能的实施例中,如图5所示,所述装置400还可以包括:
103.训练模块450,用于利用预先获取到的样本训练所述功能识别模型和所述意图分类模型。
104.需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与相应方法实施例属于同一构思,其具体实现过程详见对应方法实
施例,这里不再赘述。
105.本发明一个实施例还提供了一种电子设备,该电子设备包括处理器和存储器,该存储器中存储有至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现如上述方法实施例所提供的拒识方法。
106.存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、功能所需的应用程序等;存储数据区可存储根据所述设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。
107.本发明实施例提供的方法实施例可以在终端、服务器或者类似的运算装置中执行,即上述电子设备可以包括终端、服务器或者类似的运算装置。以运行在服务器上为例,如图6所示,其示出了本发明实施例提供的实现拒识方法的服务器的结构示意图。该服务器600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing unit,cpu)610(例如,一个或一个以上处理器)和存储器630,一个或一个以上存储应用程序623或数据622的存储介质620(例如一个或一个以上海量存储设备)。其中,存储器630和存储介质620可以是短暂存储或持久存储。存储在存储介质620的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器610可以设置为与存储介质620通信,在服务器600上执行存储介质620中的一系列指令操作。服务器600还可以包括一个或一个以上电源660,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口640,和/或,一个或一个以上操作系统621,例如windows servertm,mac os xtm,unixtm,linuxtm,freebsdtm等等。
108.输入输出接口640可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器600的通信供应商提供的无线网络。在一个实例中,输入输出接口640包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,输入输出接口640可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯,所述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(global system of mobile communication,gsm)、通用分组无线服务(general packet radio service,gprs)、码分多址(code division multiple access,cdma)、宽带码分多址(wideband code division multiple access,wcdma)、长期演进(long term evolution,lte)、电子邮件、短消息服务(short messaging service,sms)等。
109.本领域技术人员可以理解,图6所示的结构仅为示意,服务器600还可包括比图6中所示更多或者更少的组件,或者具有与图6所示不同的配置。
110.本发明一个实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质可设置于电子设备之中以保存用于实现一种拒识方法相关的至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述方法实施例提供的拒识方法。
111.可选地,在本发明实施例中,上述存储介质可以包括但不限于:u盘、只读存储器
(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
112.本发明一个实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现例中提供的拒识方法。
113.需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
114.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
115.本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
116.以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种拒识方法,其特征在于,包括:获取待识别的目标信息;将所述目标信息输入预先训练的功能识别模型,得到所述目标信息对应的目标业务功能;将所述目标信息输入预先训练的意图分类模型,得到所述目标信息对应的目标意图类型;根据所述目标业务功能和所述目标意图类型确定是否拒识所述目标信息。2.根据权利要求1所述的方法,其特征在于,所述获取待识别的目标信息包括:获取待识别的语音信息;对所述语音信息进行语音识别处理,得到所述语音信息对应的语音文本。3.根据权利要求1所述的方法,其特征在于,所述根据所述目标业务功能和所述目标意图类型确定是否拒识所述目标信息包括:获取所述目标业务功能对应的意图类型集;将所述目标意图类型与所述意图类型集进行匹配,得到匹配结果;根据所述匹配结果确定是否拒识所述目标信息。4.根据权利要求3所述的方法,其特征在于,所述将所述目标意图类型与所述意图类型集进行匹配,得到匹配结果包括:将所述目标意图类型与所述意图类型集中的各个意图类型分别进行匹配;当所述目标意图类型与所述意图类型集中的任意一个意图类型相匹配时,确定匹配结果为匹配成功;当所述目标意图类型与所述意图类型集中的各个意图类型均不匹配时,确定匹配结果为匹配失败。5.根据权利要求3所述的方法,其特征在于,所述根据所述匹配结果确定是否拒识所述目标信息包括:当所述匹配结果为匹配失败时,拒绝识别所述目标信息;当所述匹配结果为匹配成功时,获取所述目标信息对应的语义信息并输出。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:利用预先获取到的样本训练所述功能识别模型和所述意图分类模型。7.一种拒识装置,其特征在于,包括:获取模块,用于获取待识别的目标信息;识别模块,用于将所述目标信息输入预先训练的功能识别模型,得到所述目标信息对应的目标业务功能;分类模块,用于将所述目标信息输入预先训练的意图分类模型,得到所述目标信息对应的目标意图类型;确定模块,用于根据所述目标业务功能和所述目标意图类型确定是否拒识所述目标信息。8.根据权利要求7所述的装置,其特征在于,所述装置还包括:训练模块,用于利用预先获取到的样本训练所述功能识别模型和所述意图分类模型。9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储
有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如权利要求1-6任意一项所述的拒识方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由处理器加载并执行以实现如权利要求1-6任意一项所述的拒识方法。
技术总结
本发明提供一种拒识方法、装置、设备及存储介质,所述方法包括:获取待识别的目标信息;将所述目标信息输入预先训练的功能识别模型,得到所述目标信息对应的目标业务功能;将所述目标信息输入预先训练的意图分类模型,得到所述目标信息对应的目标意图类型;根据所述目标业务功能和所述目标意图类型确定是否拒识所述目标信息。本发明提供的拒识方法,通过判断目标信息对应的目标意图类型是否符合其对应的目标业务功能所支持的意图类型,来区分所述目标信息是针对所述目标业务类型的功能范围话术还是非功能范围话术,并对非功能范围话术进行拒识,提高了语音交互系统对信息进行拒识的准确性,优化了语音交互系统中的拒识任务,提高了拒识效果。提高了拒识效果。提高了拒识效果。
技术研发人员:靳莹雪 蔡勇 蒋磊 章乐
受保护的技术使用者:斑马网络技术有限公司
技术研发日:2021.12.08
技术公布日:2022/3/8