一种语音降噪方法、装置、存储介质及设备与流程

专利查询2023-8-7  120



1.本技术涉及语音处理技术领域,尤其涉及一种语音降噪方法、装置、存储介质及智能穿戴设备。


背景技术:

2.随着科技的进步和智能化浪潮的到来,智能穿戴设备也在飞速发展。智能穿戴设备的形式也越来越多样化,例如智能眼镜、智能手表、智能手环等。语音交互作为人机交互过程中极为方便和重要的交互方式,一些智能手环或智能手表也将录音功能集成到产品中,使得用户可以随时随地开始录音。
3.智能穿戴设备在采集语音时,容易受到外界环境以及自身播放音频的干扰,进而影响语音识别的准确率。目前,很多智能穿戴设备通常采用单个麦克风采集语音,基于此,可以通过单麦克风语音增强算法对语音进行降噪处理。单麦克风语音增强算法可以在无混响、低噪声、距离声源很近的情况下获得较好的效果。
4.然而,用户在运动时,声源可能距离麦克风较远,并且真实环境中可能存在大量多径反射、混响和噪声,如此导致单麦克风接收的语音信号是由多个声源和环境噪声叠加而成,单麦克风语音增强算法很难实现不同声源的分离,降噪效果下降明显,从而对后续的语音识别与交互,带来较大的影响。


技术实现要素:

5.本技术的目的在于提供一种语音降噪方法、装置、存储介质及智能穿戴设备,能够提高降噪效果。
6.第一方面,本技术提供了一种语音降噪方法,包括:
7.获取所述智能穿戴设备的状态,所述状态用于标识所述智能穿戴设备是否被用户佩戴;
8.根据所述智能穿戴设备的状态,确定对语音进行降噪所采用的降噪算法和超参数的参数值;
9.利用所述降噪算法和所述超参数的参数值对所述智能穿戴设备通过麦克风阵列采集的语音进行降噪,获得降噪后的语音。
10.一种可能的实现方式中,所述根据所述智能穿戴设备的状态,确定对语音进行降噪所采用的降噪算法和超参数的参数值,包括:
11.当所述智能穿戴设备的状态为未佩戴状态时,确定所述降噪算法为适用于固定位置的麦克风阵列的降噪算法,确定所述超参数的参数值为适用于固定位置的麦克风阵列的参数值。
12.一种可能的实现方式中,所述适用于固定位置的麦克风阵列的降噪算法包括基于最小均方误差lms的自适应滤波算法,所述超参数包括帧移、自适应滤波器步长、遗忘因子中的一种或多种,所述超参数的参数值为预设值。
13.一种可能的实现方式中,所述根据所述智能穿戴设备的状态,确定对语音进行降噪所采用的降噪算法和超参数的参数值,包括:
14.当所述智能穿戴设备的状态为佩戴状态时,确定所述降噪算法为适用于移动的麦克风阵列的降噪算法,确定所述超参数的参数值为适用于移动的麦克风阵列的参数值。
15.一种可能的实现方式中,所述适用于移动的麦克风阵列的降噪算法包括基于递归最小二乘rls的自适应滤波算法,所述超参数包括帧移、自适应滤波器步长、遗忘因子中的一种或多种,所述帧移小于预设帧移、所述自适应滤波器步长小于预设步长、所述遗忘因子小于预设遗忘因子。
16.一种可能的实现方式中,所述利用所述降噪算法和所述超参数的参数值对所述智能穿戴设备通过麦克风阵列采集的语音进行降噪,获得降噪后的语音,包括:
17.利用所述降噪算法和所述超参数的参数值更新自适应滤波器系数;
18.根据所述自适应滤波器系数以及所述智能穿戴设备通过麦克风阵列采集的语音,获得降噪后的语音。
19.一种可能的实现方式中,所述智能穿戴设备的状态为佩戴状态时,所述利用所述降噪算法和所述超参数的参数值更新自适应滤波器系数,包括:
20.利用所述降噪算法、所述超参数的参数值以及运动参数的参数值,更新自适应滤波器系数。
21.一种可能的实现方式中,所述获取所述智能穿戴设备的状态,包括:
22.接收用户输入的所述智能穿戴设备的状态;或,
23.通过所述智能穿戴设备的生物传感器检测所述智能穿戴设备的状态。
24.第二方面,本技术提供了一种语音降噪装置,包括:
25.获取模块,用于获取所述智能穿戴设备的状态,所述状态用于标识所述智能穿戴设备是否被用户佩戴;
26.确定模块,用于根据所述智能穿戴设备的状态,确定对语音进行降噪所采用的降噪算法和超参数的参数值;
27.降噪模块,利用所述降噪算法和所述超参数的参数值对所述智能穿戴设备通过麦克风阵列采集的语音进行降噪,获得降噪后的语音。
28.一种可能的实现方式中,所述确定模块,具体用于当所述智能穿戴设备的状态为未佩戴状态时,确定所述降噪算法为适用于固定位置的麦克风阵列的降噪算法,确定所述超参数的参数值为适用于固定位置的麦克风阵列的参数值。
29.一种可能的实现方式中,所述适用于固定位置的麦克风阵列的降噪算法包括基于最小均方误差lms的自适应滤波算法,所述超参数包括帧移、自适应滤波器步长、遗忘因子中的一种或多种,所述超参数的参数值为预设值。
30.一种可能的实现方式中,所述确定模块,具体用于当所述智能穿戴设备的状态为佩戴状态时,确定所述降噪算法为适用于移动的麦克风阵列的降噪算法,确定所述超参数的参数值为适用于移动的麦克风阵列的参数值。
31.一种可能的实现方式中,所述适用于移动的麦克风阵列的降噪算法包括基于递归最小二乘rls的自适应滤波算法,所述超参数包括帧移、自适应滤波器步长、遗忘因子中的一种或多种,所述帧移小于预设帧移、所述自适应滤波器步长小于预设步长、所述遗忘因子
小于预设遗忘因子。
32.一种可能的实现方式中,所述降噪模块,具体用于利用所述降噪算法和所述超参数的参数值更新自适应滤波器系数;根据所述自适应滤波器系数以及所述智能穿戴设备通过麦克风阵列采集的语音,获得降噪后的语音。
33.一种可能的实现方式中,所述智能穿戴设备的状态为佩戴状态时,所述降噪模块,具体用于利用所述降噪算法、所述超参数的参数值以及运动参数的参数值,更新自适应滤波器系数。
34.一种可能的实现方式中,所述获取模块,具体用于接收用户输入的所述智能穿戴设备的状态;或,通过所述智能穿戴设备的生物传感器检测所述智能穿戴设备的状态。
35.第三方面,本技术提供了一种智能穿戴设备,所述智能穿戴设备包括麦克风阵列和处理器;
36.所述麦克风阵列,用于采集语音;
37.所述处理器,用于获取智能穿戴设备的状态,所述状态用于标识所述智能穿戴设备是否被用户佩戴;根据所述智能穿戴设备的状态,确定对所述语音进行降噪所采用的降噪算法和超参数的参数值,利用所述降噪算法和所述超参数的参数值对所述语音进行降噪,获得降噪后的语音。
38.一种可能的实现方式中,所述智能穿戴设备还包括通信接口;
39.所述通信接口,用于接收用户输入的所述智能穿戴设备的状态;
40.所述处理器,具体用于获取所述用户输入的所述智能穿戴设备的状态。
41.一种可能的实现方式中,所述智能穿戴设备还包括生物传感器;
42.所述生物传感器,用于检测所述智能穿戴设备的状态;
43.所述处理器,具体用于获取所述生物传感器检测的所述智能穿戴设备的状态。
44.一种可能的实现方式中,所述智能穿戴设备包括智能手环、智能手表、智能眼镜、智能头盔和智能头带。
45.一种可能的实现方式中,所述处理器,具体用于当所述智能穿戴设备的状态为未佩戴状态时,确定所述降噪算法为适用于固定位置的麦克风阵列的降噪算法,确定所述超参数的参数值为适用于固定位置的麦克风阵列的参数值。
46.一种可能的实现方式中,所述处理器,具体用于当所述智能穿戴设备的状态为佩戴状态时,确定所述降噪算法为适用于移动的麦克风阵列的降噪算法,确定所述超参数的参数值为适用于移动的麦克风阵列的参数值。
47.一种可能的实现方式中,所述处理器,具体用于利用所述降噪算法和所述超参数的参数值更新自适应滤波器系数;根据所述自适应滤波器系数以及所述智能穿戴设备通过麦克风阵列采集的语音,获得降噪后的语音。
48.一种可能的实现方式中,所述处理器,具体用于所述智能穿戴设备的状态为佩戴状态时,利用所述降噪算法、所述超参数的参数值以及运动参数的参数值,更新自适应滤波器系数。
49.第四方面,本技术提供了一种电子设备,包括:处理器、存储器、系统总线;
50.所述处理器以及所述存储器通过所述系统总线相连;
51.所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令
当被所述处理器执行时使所述处理器执行上述语音降噪方法中的任意一种实现方式。
52.第五方面,本技术提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在电子设备上运行时,使得所述电子设备执行上述语音降噪方法中的任意一种实现方式。
53.第六方面,本技术提供了一种计算机程序产品,所述计算机程序产品在电子设备上运行时,使得所述电子设备执行上述语音降噪方法中的任意一种实现方式。
54.由上述技术方案可知,本技术至少具有以下有益效果:
55.本技术提供的一种语音降噪方法,该方法应用于智能穿戴设备,首先获取智能穿戴设备的状态,该状态用于标识智能穿戴设备是否被用户佩戴,接着基于智能穿戴设备的状态,来确定对语音进行降噪所采用的降噪算法和超参数的参数值,然后利用该基于智能穿戴设备的状态而确定的降噪算法以及超参数的参数值对语音进行降噪处理,而不是基于一套固定降噪算法以及超参数的参数值对语音进行降噪处理,如此能够利用适应于智能穿戴设备的状态的降噪算法以及超参数的参数值对语音进行降噪处理,从而提高对语音进行降噪的降噪效果。并且,基于麦克风阵列对声源进行采集得到的语音会携带有声源的空间特性,从而能够实现对不同声源的分离,进一步提高对采集的语音的降噪效果。
附图说明
56.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
57.图1为本技术实施例提供的一种语音降噪方法的应用场景图;
58.图2为本技术实施例提供的又一种语音降噪方法的应用场景图;
59.图3为本技术实施例提供的一种语音降噪方法的流程图;
60.图4a为本技术实施例提供的一种配置界面的示意图;
61.图4b为本技术实施例提供的一种配置界面的示意图;
62.图4c为本技术实施例提供的一种配置界面的示意图;
63.图5为本技术实施例提供的一种桌面的示意图;
64.图6为本技术实施例提供的一种语音降噪装置的示意图。
具体实施方式
65.本技术实施例中的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多该特征。
66.首先对本技术实施例中所涉及到的一些技术术语进行介绍。
67.麦克风阵列是指由多个位于空间不同位置的声学传感器(例如麦克风)按照一定的形状规则布置形成的语音信号采集装置。利用麦克风阵列对声源进行采集得到的语音可以携带有声源的空间特性(例如空间位置),从而实现对不同声源的分离。一般的,麦克风阵列可以根据声源与麦克风阵列之间的距离分为近场模型和远场模型,麦克风阵列可以根据
麦克风阵列的拓扑结构,分为线性阵列、平面阵列、体阵列等。麦克风阵列与单麦克风相比,通过麦克风阵列语音增强算法能够较好地解决真实环境中存在的大量多径反射、混响和噪声的问题,从而实现较好的降噪效果。
68.由于需要对声源进行跟踪,麦克风阵列语音增强算法通常基于最小均方误差(least mean squares,lms)、递归最小二乘(recursive least squares,rls)等自适应滤波算法对滤波器进行更新。目前的麦克风阵列语音增强算法仅通过一套超参数(例如帧移、自适应滤波器步长)来控制降噪效果。
69.然而,在一些场景中,智能手表、智能手环等智能穿戴设备上配备的麦克风阵列可能会随着佩戴用户的肢体运动,导致声源和麦克风阵列发生相对位移。上述自适应滤波算法对帧移、自适应滤波器步长等超参数较为敏感,当配置的超参数的参数值不合适时,会导致自适应滤波算法收敛速度慢,也可能导致自适应滤波算法无法达到预期的降效果。因此,仍然利用固定的超参数来控制降噪效果时,往往无法达到预期的降效果,从而对后续的语音识别与交互,带来较大的影响。
70.有鉴于此,本技术实施例提供了一种语音降噪方法,该方法可以应用于智能穿戴设备。具体地,该方法包括:智能穿戴设备获取该智能穿戴设备的状态,该状态用于标识该智能穿戴设备是否被用户佩戴,接着根据智能穿戴设备的状态,确定对语音进行降噪所采用的降噪算法和超参数的参数值,然后利用降噪算法和超参数的参数值,对智能穿戴设备通过麦克风阵列采集的语音进行降噪,获得降噪后的语音。
71.该方法中,智能穿戴设备利用与其自身的状态相关联的降噪算法以及超参数的参数值对麦克风阵列采集的语音进行降噪处理,而不是基于固定的超参数进行降噪处理。当智能穿戴设备的状态为佩戴状态时,利用适用于移动的麦克风阵列的降噪算法以及适应于移动的麦克风阵列的参数值,对麦克风阵列采集的语音进行降噪处理;当智能穿戴设备的状态为未佩戴状态时,利用适用于固定的麦克风阵列的降噪算法以及适应于固定的麦克风阵列的参数值,对麦克风阵列采集的语音进行降噪处理。如此,在智能穿戴设备随着用户的肢体运动而运动或者智能穿戴设备处于固定位置的情况下,对智能穿戴设备通过麦克风阵列采集的语音,均能够达到较好的降噪效果。
72.为了使得本技术的技术方案更加清楚、易于理解,下面结合附图对本技术实施例提供的语音降噪方法的应用场景进行介绍。
73.如图1所示,本技术实施例提供的语音降噪方法可以应用于通话场景。在通话场景中,智能穿戴设备11可以采集用户1的语音(例如:“您好请问xx在吗”对应的语音),智能穿戴设备12可以采集用户2的语音(例如:“您好,他今天不在”对应的语音),从而实现用户1与用户2之间的语音通话。如图2所示,本技术实施例提供的语音降噪方法也可以应用于智能家居场景。在智能家居场景中,智能穿戴设备21可以采集用户3的语音(例如:“打开空调”对应的语音),从而用户3可以通过语音的方式间接控制智能家电22(例如智能空调等)。
74.在上述场景中,智能穿戴设备可以检测其自身的状态,即,是否被用户佩戴,当该智能穿戴设备处于被用户佩戴的状态时,智能穿戴设备利用适用于移动的麦克风阵列的降噪算法以及适用于移动的麦克风阵列的参数值,对麦克风阵列采集的语音进行降噪;当该智能穿戴设备处于未被用户佩戴的状态时,智能穿戴设备利用适用于固定位置的麦克风阵列的降噪算法以及适用于固定位置的麦克风阵列的参数值,对麦克风阵列采集的语音进行
降噪。
75.如此,在上述场景中,智能穿戴设备被用户佩戴或者未被用户佩戴时,均能够较好地对麦克风阵列采集的语音进行降噪,从而有助于优化后续的语音识别与交互,提高用户体验。
76.为了使得本技术的技术方案更加清楚、易于理解,下面以智能穿戴设备的角度,对本技术实施例提供的语音降噪方法进行介绍。如图3所示,该图为本技术实施例提供的一种语音降噪方法的流程图,该方法包括:
77.s302:智能穿戴设备获取智能穿戴设备的状态。
78.智能穿戴设备的状态用于标识智能穿戴设备是否被用户佩戴。在一些示例中,智能穿戴设备可以基于智能穿戴设备上配备的生物传感器,获取智能穿戴设备的状态,即,检测智能穿戴设备是否被用户佩戴。
79.在另一些示例中,智能穿戴设备也可以接收用户配置的智能穿戴设备的状态。例如,用户在佩戴该智能穿戴设备后,可以将该智能穿戴设备的状态配置为被用户佩戴;用户在取下该智能穿戴设备后,可以将该智能穿戴设备的状态配置为未被用户佩戴。
80.在一些示例中,智能穿戴设备可以基于用户配置的方式,确定智能穿戴设备获取状态的方式。如图4a所示,该图为本技术实施例提供的一种配置界面的示意图。该配置界面包括:获取状态方式的选择开关410和佩戴状态的选择开关420。其中,获取状态的选择开关410用于用户配置智能穿戴设备获取状态的方式,佩戴状态的选择开关420用于用户手动配置该智能穿戴设备的状态。
81.当该获取状态的选择开关410处于开启状态时(如图4a所示),智能穿戴设备基于生物传感器,获取智能穿戴设备的状态;当获取状态的选择开关410处于关闭状态时(如图4b所示),用户可以基于佩戴状态的选择开关420手动配置智能穿戴设备的状态。当佩戴状态的选择开关420处于开启状态时(如图4b所示),表明用户配置智能穿戴设备的状态为佩戴状态,用户可以对该佩戴状态的选择开关420触发点击操作,智能穿戴设备基于用户的点击操作,将佩戴状态的选择开关420由开启状态切换为关闭状态(如图4c所示),当佩戴状态的选择开关420处于关闭状态时,表明用户配置智能穿戴设备的状态为未佩戴状态。
82.需要说明的是,本技术实施例不具体限定智能穿戴设备获取智能穿戴设备的状态的方式,本领域技术人员可以根据实际需要,选择智能穿戴设备获取其自身状态的方式。
83.智能穿戴设备可以安装有各种应用程序。在一些示例中,智能穿戴设备可以向用户桌面的示意图,如图5所示,该桌面包括录音应用501、语音助手应用502等。用户对该录音应用501触发点击操作,智能穿戴设备可以基于该点击操作开始采集语音;类似的,用户也可以对该语音助手应用502触发点击操作,智能穿戴设备可以基于该点击操作开始采集语音。在另一些示例中,用户也可以对该智能穿戴设备的硬件按键,触发该智能穿戴设备开始采集语音。
84.在智能穿戴设备开始采集语音时,智能穿戴设备可以实时获取该智能穿戴设备的状态,以便确定对该智能穿戴设备所采集的语音进行降噪处理所采用的降噪算法以及超参数的参数值。
85.在另一些实施例中,智能穿戴设备还可以记录所采集的语音的起始时刻以及结束时刻,并获取起始时刻到结束时刻的语音片段(例如一句话对应的语音)对应的智能穿戴设
备的状态,然后建立语音片段与智能穿戴设备的状态的关联关系,以便后续依据该关联关系,对该语音片段进行降噪处理。
86.s304:智能穿戴设备根据智能穿戴设备的状态,确定对语音进行降噪所采用的降噪算法和超参数的参数值。
87.在本技术实施例中,智能穿戴设备的状态不同,智能穿戴设备对其采集的语音进行降噪处理采用的降噪算法以及超参数的参数值不同。下面分别介绍智能穿戴设备处于被用户佩戴的状态和未被用户佩戴的状态的情况下,智能穿戴设备对语音进行降噪处理采用的降噪算法以及超参数的参数值。
88.在一些实施例中,当智能穿戴设备的状态为未佩戴状态时,确定降噪算法为适用于固定位置的麦克风阵列的降噪算法,确定超参数的参数值为适用于固定位置的麦克风阵列的参数值。其中,适用于固定位置的麦克风阵列的降噪算法包括基于最小均方误差的自适应滤波算法,超参数包括帧移、自适应滤波器步长、遗忘因子中的一种或多种,超参数可以为预设值。例如,帧移为预设帧移、自适应滤波器步长为预设步长和遗忘因子为预设遗忘因子,预设帧移、预设步长以及预设遗忘因子均可根据经验值来设定。
89.需要说明的是,适用于固定的麦克风阵列的降噪算法为基于最小均方误差的自适应滤波算法仅仅是举例说明,在另一些示例中,还可以采用其他自适应滤波算法。
90.在本实施例中,智能穿戴设备检测到自身处于未被用户佩戴的状态时,表明该智能穿戴设备处于固定位置。智能穿戴设备利用适用于固定位置的麦克风阵列的降噪算法,以及适用于固定位置的麦克风阵列的参数值,对麦克风阵列采集的语音进行降噪处理。
91.需要说明的是,智能穿戴设备处于固定位置具体可以是智能穿戴设备的麦克风阵列与声源处于相对固定的位置。例如,声源位于第一位置(如客厅的沙发),智能穿戴设备位于第二位置(如客厅的茶几)。
92.在另一些实施例中,当智能穿戴设备的状态为佩戴状态时,确定降噪算法为适用于移动的麦克风阵列的降噪算法,确定超参数的参数值为适用于移动的麦克风阵列的参数值。其中,适用于移动的麦克风阵列的降噪算法包括基于递归最小二乘的自适应滤波算法,超参数包括帧移、自适应滤波器步长、遗忘因子中的一种或多种。与适用于固定位置的麦克风阵列的参数值相比,适用于移动的麦克风阵列的帧移小于预设帧移、适用于移动的麦克风阵列的自适应滤波器步长大于预设步长、适用于移动的麦克风阵列的遗忘因子小于预设遗忘因子。
93.需要说明的是,适用于移动的麦克风阵列的降噪算法为基于最小二乘的自适应滤波算法仅仅是举例说明,在另一些示例中,还可以采用其他自适应滤波算法。
94.在本实施例中,智能穿戴设备检测到自身处于被用户佩戴的状态时,表明该智能穿戴设备与声源存在相对运动。智能穿戴设备利用适用于移动的麦克风阵列的降噪算法,以及适用于移动的麦克风阵列的参数值,对麦克风阵列采集的语音进行降噪处理。
95.需要说明的是,智能穿戴设备与声源存在相对运动具体可以是智能穿戴设备的麦克风阵列的位置固定不动,而声源的位置移动;也可以是智能穿戴设备的麦克风阵列的位置移动,声源的位置固定不动;也可以是智能穿戴设备的麦克风阵列和声源的位置均移动,但移动的速度不同。在一些示例中,声源的位置(用户的嘴巴)固定不动,智能穿戴设备的位置移动,如随用户摆动的手臂而摆动。
96.如此,智能穿戴设备能够基于其自身的状态,确定合适的降噪算法以及超参数的参数值,从而智能穿戴设备能够在不同状态(例如被用户佩戴和未被用户佩戴)下,均能够实现较好的降噪效果,为后续的语音识别与交互提供更加清晰的语音,满足业务需求。
97.s306:智能穿戴设备利用降噪算法和超参数的参数值对智能穿戴设备通过麦克风阵列采集的语音进行降噪,获得降噪后的语音。
98.自适应滤波器可以基于自适应滤波算法(例如上述基于递归最小二乘的自适应滤波算法、基于最小均方误差的自适应滤波算法)对自适应滤波器系数进行更新。例如,输入信号(例如输入的语音信号)可以输入到自适应滤波器进行滤波处理得到输出信号(例如输出的语音信号),比较该输出信号与期望信号,得到误差信号,然后通过自适应滤波算法对自适应滤波器系数进行更新,使得误差信号的均方差值达到最小。
99.在一些示例中,智能穿戴设备利用降噪算法和超参数的参数值更新自适应滤波器系数。具体地,智能穿戴设备可以基于如下公式更新n时刻的自适应滤波器系数:
100.w(n+1)=w(n)+μe(n)x(n) (1)
101.其中,w(n+1)为n+1时刻的自适应滤波器系数,w(n)为n时刻的自适应滤波器系数,μ为自适应滤波器步长,e(n)为n时刻的估计误差,x(n)为n时刻输入的语音信号,例如麦克风阵列采集的语音。
102.智能穿戴设备的状态不同时,智能穿戴设备对自适应滤波器系数进行更新时所采用的自适应滤波算法以及超参数的参数值不同。
103.当智能穿戴设备的状态为未佩戴状态时,可以基于适应于固定位置的麦克风阵列的降噪算法以及适应于固定位置的麦克风阵列的超参数的参数值,对自适应滤波器进行更新。例如,可以基于最小均方误差的自适应滤波算法以及预设帧移、预设步长、预设遗忘因子等对自适应滤波器系数进行更新。
104.当智能穿戴设备的状态为佩戴状态时,可以基于适应于移动的麦克风阵列的降噪算法以及适应于移动的麦克风阵列的超参数的参数值,对自适应滤波器系数进行更新。例如可以基于递归最小二乘的自适应滤波算法以及小于上述预设帧移的帧移、大于上述预设步长的自适应滤波器步长、小于预设遗忘因子的遗忘因子等对自适应滤波器系数进行更新。
105.当智能穿戴设备的状态为佩戴状态时,智能穿戴设备会随着用户的肢体(例如手臂)移动而移动,进而导致声源与智能穿戴设备的麦克风阵列产生相对运动。并且,即智能穿戴设备的加速度会影响声源与智能穿戴设备的麦克风阵列之间的相对位置的变化程度。例如,当智能穿戴设备的加速度较大时,相对位置的变化程度较大,进而需要利用较小的帧移、较大的自适应滤波器步长的对自适应滤波器系数进行更新;当智能穿戴设备的加速度较小时,相对位置的变化程度较小,进而需要利用较大的帧移、较小的自适应滤波器步长对自适应滤波器系数进行更新。
106.需要说明的是,智能穿戴设备在基于运动参数对帧移以及自适应滤波器步长进行调整过程中,帧移应小于预设帧移,自适应滤波器步长应大于预设步长。
107.基于此,本技术的另一实施例中,智能穿戴设备可以利用适应于移动的麦克风阵列的降噪算法、适应于移动的麦克风阵列的参数值以及运动参数的参数值,更新自适应滤波器系数。智能穿戴设备可以获取该智能穿戴设备的运动参数的参数值。例如,智能穿戴设
备可以基于智能穿戴设备上配备的运动传感器,采集该智能穿戴设备的运动参数,进而得到该运动参数的参数值。接着利用该运动参数的参数值辅助更新自适应滤波器系数。具体地,智能穿戴设备可以基于如下公式更新n时刻的自适应滤波器系数:
108.w(n+1)=w(n)+μf[m(n)]e(n)x(n) (2)
[0109]
其中,f[m(n)]为转换函数,例如f[m(n)]=log[m(n)+1]。m(n)为n时刻的运动参数的参数值,例如m(n)可以为n时刻的穿戴设备的加速度。由于加速度与自适应滤波算法不在一个量纲,转换函数可以将加速度进行转换处理。
[0110]
需要说明的是,运动传感器的采集频率与自适应滤波算法保持一致,从而使得运动传感器所采集的运动参数所针对的语音与自适应滤波算法所针对的语音为同一时段的语音。
[0111]
然后,智能穿戴设备可以基于该自适应滤波器系数以及智能穿戴设备通过麦克风阵列采集的语音,获得降噪后的语音。在一些示例中,智能穿戴设备可以基于更新后的自适应滤波器系数对智能穿戴设备通过麦克风阵列采集的语音进行处理,得到降噪后的语音。具体地,智能穿戴设备可以基于如下公式获得n时刻的降噪后的语音:
[0112]
y(n)=w(n)*x(n) (3)
[0113]
其中,y(n)为n时刻输出的语音信号,例如降噪后的语音,w(n)为n时刻的自适应滤波器系数,x(n)为n时刻的输入信号,例如麦克风阵列采集的语音。
[0114]
进一步,可以将降噪后的语音传输给语音识别系统以用于语音识别,也可以将降噪后的语音进行存储以用于后续回放。
[0115]
基于上述内容描述,本技术实施例提供的语音降噪方法,基于不同的场景,利用不同的降噪算法以及不同的超参数的参数值,对自适应滤波器系数进行更新。例如可以基于智能穿戴设备自带的生物传感器,自动检测智能穿戴设备的麦克风阵列采集语音时的状态,基于不同的状态,选择不同的降噪算法及超参数的参数值进行适配,从而提高在不同场景下,对麦克风阵列采集的语音进行降噪的降噪效果。
[0116]
进一步,智能穿戴设备还可以基于自带的运动传感器,获取智能穿戴设备的运动参数的参数值,然后基于该运动参数的参数值,辅助更新自适应滤波器系数。例如,智能穿戴设备的加速度较大时,在对自适应滤波器系数进行更新过程中,采用的自适应滤波器步长增大、帧移减小;智能穿戴设备的加速度较小时,在对自适应滤波器系数进行更新过程中,采用的自适应滤波器步长减小、帧移增大,从而使自适应滤波算法达到快速收敛的目的。
[0117]
本实施例将对一种语音降噪装置进行介绍,相关内容请参见上述方法实施例。
[0118]
参见图6,为本实施例提供的语音降噪装置的组成示意图,该语音降噪装置600包括:
[0119]
获取模块601,用于获取所述智能穿戴设备的状态,所述状态用于标识所述智能穿戴设备是否被用户佩戴;
[0120]
确定模块602,用于根据所述智能穿戴设备的状态,确定对语音进行降噪所采用的降噪算法和超参数的参数值;
[0121]
降噪模块603,利用所述降噪算法和所述超参数的参数值对所述智能穿戴设备通过麦克风阵列采集的语音进行降噪,获得降噪后的语音。
[0122]
一种可能的实现方式中,所述确定模块602,具体用于当所述智能穿戴设备的状态为未佩戴状态时,确定所述降噪算法为适用于固定位置的麦克风阵列的降噪算法,确定所述超参数的参数值为适用于固定位置的麦克风阵列的参数值。
[0123]
一种可能的实现方式中,所述适用于固定位置的麦克风阵列的降噪算法包括基于最小均方误差lms的自适应滤波算法,所述超参数包括帧移、自适应滤波器步长、遗忘因子中的一种或多种,所述超参数的参数值为预设值。
[0124]
一种可能的实现方式中,所述确定模块602,具体用于当所述智能穿戴设备的状态为佩戴状态时,确定所述降噪算法为适用于移动的麦克风阵列的降噪算法,确定所述超参数的参数值为适用于移动的麦克风阵列的参数值。
[0125]
一种可能的实现方式中,所述适用于移动的麦克风阵列的降噪算法包括基于递归最小二乘rls的自适应滤波算法,所述超参数包括帧移、自适应滤波器步长、遗忘因子中的一种或多种,所述帧移小于预设帧移、所述自适应滤波器步长小于预设步长、所述遗忘因子小于预设遗忘因子。
[0126]
一种可能的实现方式中,所述降噪模块603,具体用于利用所述降噪算法和所述超参数的参数值更新自适应滤波器系数;根据所述自适应滤波器系数以及所述智能穿戴设备通过麦克风阵列采集的语音,获得降噪后的语音。
[0127]
一种可能的实现方式中,所述智能穿戴设备的状态为佩戴状态时,所述降噪模块603,具体用于利用所述降噪算法、所述超参数的参数值以及运动参数的参数值,更新自适应滤波器系数。
[0128]
一种可能的实现方式中,所述获取模块601,具体用于接收用户输入的所述智能穿戴设备的状态;或,通过所述智能穿戴设备的生物传感器检测所述智能穿戴设备的状态。
[0129]
本技术实施例还提供了一种智能穿戴设备,所述智能穿戴设备包括麦克风阵列和处理器;
[0130]
所述麦克风阵列,用于采集语音;
[0131]
所述处理器,用于获取智能穿戴设备的状态,所述状态用于标识所述智能穿戴设备是否被用户佩戴;根据所述智能穿戴设备的状态,确定对所述语音进行降噪所采用的降噪算法和超参数的参数值,利用所述降噪算法和所述超参数的参数值对所述语音进行降噪,获得降噪后的语音。
[0132]
一种可能的实现方式中,所述智能穿戴设备还包括通信接口;
[0133]
所述通信接口,用于接收用户输入的所述智能穿戴设备的状态;
[0134]
所述处理器,具体用于获取所述用户输入的所述智能穿戴设备的状态。
[0135]
一种可能的实现方式中,所述智能穿戴设备还包括生物传感器;
[0136]
所述生物传感器,用于检测所述智能穿戴设备的状态;
[0137]
所述处理器,具体用于获取所述生物传感器检测的所述智能穿戴设备的状态。
[0138]
一种可能的实现方式中,所述智能穿戴设备包括智能手环、智能手表、智能眼镜、智能头盔和智能头带。
[0139]
一种可能的实现方式中,所述处理器,具体用于当所述智能穿戴设备的状态为未佩戴状态时,确定所述降噪算法为适用于固定位置的麦克风阵列的降噪算法,确定所述超参数的参数值为适用于固定位置的麦克风阵列的参数值。
[0140]
一种可能的实现方式中,所述处理器,具体用于当所述智能穿戴设备的状态为佩戴状态时,确定所述降噪算法为适用于移动的麦克风阵列的降噪算法,确定所述超参数的参数值为适用于移动的麦克风阵列的参数值。
[0141]
一种可能的实现方式中,所述处理器,具体用于利用所述降噪算法和所述超参数的参数值更新自适应滤波器系数;根据所述自适应滤波器系数以及所述智能穿戴设备通过麦克风阵列采集的语音,获得降噪后的语音。
[0142]
一种可能的实现方式中,所述处理器,具体用于所述智能穿戴设备的状态为佩戴状态时,利用所述降噪算法、所述超参数的参数值以及运动参数的参数值,更新自适应滤波器系数。
[0143]
本技术实施例还提供了一种电子设备,包括:处理器、存储器、系统总线;
[0144]
所述处理器以及所述存储器通过所述系统总线相连;
[0145]
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述语音降噪方法的任一种实现方法。
[0146]
本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在电子设备上运行时,使得所述电子设备执行上述语音降噪方法的任一种实现方法。
[0147]
本技术实施例还提供了一种计算机程序产品,所述计算机程序产品在电子设备上运行时,使得所述电子设备执行上述语音降噪方法的任一种实现方法。
[0148]
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如媒体网关等网络通信设备,等等)执行本技术各个实施例或者实施例的某些部分所述的方法。
[0149]
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0150]
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0151]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一
致的最宽的范围。

技术特征:
1.一种语音降噪方法,其特征在于,应用于智能穿戴设备,所述方法包括:获取所述智能穿戴设备的状态,所述状态用于标识所述智能穿戴设备是否被用户佩戴;根据所述智能穿戴设备的状态,确定对语音进行降噪所采用的降噪算法和超参数的参数值;利用所述降噪算法和所述超参数的参数值对所述智能穿戴设备通过麦克风阵列采集的语音进行降噪,获得降噪后的语音。2.根据权利要求1所述的方法,其特征在于,所述根据所述智能穿戴设备的状态,确定对语音进行降噪所采用的降噪算法和超参数的参数值,包括:当所述智能穿戴设备的状态为未佩戴状态时,确定所述降噪算法为适用于固定位置的麦克风阵列的降噪算法,确定所述超参数的参数值为适用于固定位置的麦克风阵列的参数值。3.根据权利要求2所述的方法,其特征在于,所述适用于固定位置的麦克风阵列的降噪算法包括基于最小均方误差lms的自适应滤波算法,所述超参数包括帧移、自适应滤波器步长、遗忘因子中的一种或多种,所述超参数的参数值为预设值。4.根据权利要求1所述的方法,其特征在于,所述根据所述智能穿戴设备的状态,确定对语音进行降噪所采用的降噪算法和超参数的参数值,包括:当所述智能穿戴设备的状态为佩戴状态时,确定所述降噪算法为适用于移动的麦克风阵列的降噪算法,确定所述超参数的参数值为适用于移动的麦克风阵列的参数值。5.根据权利要求4所述的方法,其特征在于,所述适用于移动的麦克风阵列的降噪算法包括基于递归最小二乘rls的自适应滤波算法,所述超参数包括帧移、自适应滤波器步长、遗忘因子中的一种或多种,所述帧移小于预设帧移、所述自适应滤波器步长小于预设步长、所述遗忘因子小于预设遗忘因子。6.根据权利要求1至5任一项所述的方法,其特征在于,所述利用所述降噪算法和所述超参数的参数值对所述智能穿戴设备通过麦克风阵列采集的语音进行降噪,获得降噪后的语音,包括:利用所述降噪算法和所述超参数的参数值更新自适应滤波器系数;根据所述自适应滤波器系数以及所述智能穿戴设备通过麦克风阵列采集的语音,获得降噪后的语音。7.根据权利要求6所述的方法,其特征在于,所述智能穿戴设备的状态为佩戴状态时,所述利用所述降噪算法和所述超参数的参数值更新自适应滤波器系数,包括:利用所述降噪算法、所述超参数的参数值以及运动参数的参数值,更新自适应滤波器系数。8.根据权利要求1至5任一项所述的方法,其特征在于,所述获取所述智能穿戴设备的状态,包括:接收用户输入的所述智能穿戴设备的状态;或,通过所述智能穿戴设备的生物传感器检测所述智能穿戴设备的状态。9.一种智能穿戴设备,其特征在于,所述智能穿戴设备包括麦克风阵列和处理器;所述麦克风阵列,用于采集语音;
所述处理器,用于获取智能穿戴设备的状态,所述状态用于标识所述智能穿戴设备是否被用户佩戴;根据所述智能穿戴设备的状态,确定对所述语音进行降噪所采用的降噪算法和超参数的参数值,利用所述降噪算法和所述超参数的参数值对所述语音进行降噪,获得降噪后的语音。10.根据权利要求9所述的智能穿戴设备,其特征在于,所述智能穿戴设备还包括通信接口;所述通信接口,用于接收用户输入的所述智能穿戴设备的状态;所述处理器,具体用于获取所述用户输入的所述智能穿戴设备的状态。11.根据权利要求9所述的智能穿戴设备,其特征在于,所述智能穿戴设备还包括生物传感器;所述生物传感器,用于检测所述智能穿戴设备的状态;所述处理器,具体用于获取所述生物传感器检测的所述智能穿戴设备的状态。12.根据权利要求9-11任一项所述的智能穿戴设备,其特征在于,所述智能穿戴设备包括智能手环、智能手表、智能眼镜、智能头盔和智能头带。13.一种语音降噪装置,其特征在于,包括:获取模块,用于获取所述智能穿戴设备的状态,所述状态用于标识所述智能穿戴设备是否被用户佩戴;确定模块,用于根据所述智能穿戴设备的状态,确定对语音进行降噪所采用的降噪算法和超参数的参数值;降噪模块,利用所述降噪算法和所述超参数的参数值对所述智能穿戴设备通过麦克风阵列采集的语音进行降噪,获得降噪后的语音。14.一种电子设备,其特征在于,包括:处理器、存储器、系统总线;所述处理器以及所述存储器通过所述系统总线相连;所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行权利要求1-8任一项所述的方法。15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在电子设备上运行时,使得所述电子设备执行权利要求1-8任一项所述的方法。

技术总结
本申请公开了一种语音降噪方法、装置、存储介质及设备,涉及语音处理技术领域,该方法应用于智能穿戴设备,该方法包括:获取智能穿戴设备的状态,该状态用于标识智能穿戴设备是否被用户佩戴;根据智能穿戴设备的状态,确定对语音进行降噪所采用的降噪算法和超参数的参数值;利用降噪算法和超参数的参数值对智能穿戴设备通过麦克风阵列采集的语音进行降噪,获得降噪后的语音。如此,该方法利用基于智能穿戴设备的状态确定的降噪算法以及超参数的参数值,对语音进行降噪处理,能够使得智能穿戴设备在不同状态下,均实现较好的降噪效果,进而便于后续的语音识别与交互。进而便于后续的语音识别与交互。进而便于后续的语音识别与交互。


技术研发人员:程枫
受保护的技术使用者:科大讯飞股份有限公司
技术研发日:2021.12.16
技术公布日:2022/3/8

最新回复(0)