一种基于语音控制的终端设备及语音控制系统

专利查询2023-9-11 105

1.本技术属于语音识别技术领域，尤其涉及一种基于语音控制的终端设备及语音控制系统。

背景技术：

2.随着语音识别技术的快速发展，基于语音识别技术的语音控制功能被广泛应用于各个领域中。例如，可以通过在终端设备(例如，机器人)的控制单元中内置语音识别算法来实现对终端设备的语音控制，进而实现对终端设备的智能化控制，提高终端设备的控制效率。
3.为了提高终端设备语音识别的准确率，现有的终端设备通常需要用户输入特定的唤醒语来唤醒其语音识别功能，在终端设备的语音识别功能被唤醒后终端设备才开始进行语音识别操作。然而，现有终端设备中的控制单元需要时刻监听用户是否输入唤醒语，这样会占用控制单元较多的处理资源，降低了控制单元的资源利用率，且会增加控制单元的功耗。

技术实现要素：

4.有鉴于此，本技术实施例提供了一种基于语音控制的终端设备及语音控制系统，以解决现有终端设备中的控制单元需要时刻监听是否有唤醒语输入，占用控制单元较多处理资源，导致控制单元的资源利用率低，功耗高的技术问题。
5.第一方面，本技术实施例提供一种基于语音控制的终端设备，包括：
6.语音采集单元，用于采集语音信号；
7.唤醒语识别单元，与所述语音采集单元连接，所述唤醒语识别单元用于对所述语音信号进行识别，并在识别出所述语音信号中包括预设的唤醒语时向控制单元发送中断信号；
8.所述控制单元，与所述唤醒语识别单元连接，所述控制单元用于在接收到所述中断信号时开始监听来自所述唤醒语识别单元的语音指令，并在接收到所述语音指令时生成与所述语音指令对应的控制指令。
9.可选的，所述终端设备还包括连接在所述语音采集单元与所述唤醒语识别单元之间的语音信号处理单元；所述语音信号处理单元用于对所述语音信号进行预处理，并向所述唤醒语识别单元发送预处理后的所述语音信号；所述预处理包括滤波处理和信号放大处理。
10.可选的，所述终端设备还包括与所述控制单元连接的通信单元；所述终端设备通过所述通信单元与至少一个受控设备连接；
11.所述控制单元用于在所述控制指令为针对所述受控设备的控制指令时，向所述通信单元发送所述控制指令；
12.所述通信单元用于接收来自所述控制单元的所述控制指令，并向所述受控设备发
送所述控制指令。
13.可选的，所述终端设备还包括电机驱动单元、电机及运动组件；所述电机驱动单元与所述控制单元连接，所述电机与所述电机驱动单元和所述运动组件连接；
14.所述控制单元用于在所述控制指令为针对所述控制单元所在的终端设备的运动指令时，向所述电机驱动单元发送所述控制指令；
15.所述电机驱动单元用于基于所述控制指令驱动所述电机运转，以带动所述运动组件进行相应运动。
16.可选的，所述终端设备还包括与所述控制单元连接的音频输出单元；所述控制单元用于在接收到所述中断信号时生成携带有回复语的音频信号，并向所述音频输出单元发送所述音频信号；
17.所述音频输出单元用于接收所述音频信号，并播放所述回复语。
18.可选的，还包括与所述控制单元连接的状态指示单元；
19.所述状态指示单元用于通过指示灯指示所述控制单元所在的终端设备的状态。
20.可选的，所述语音采集单元为由多个麦克风组成的麦克风阵列。
21.可选的，所述多个麦克风线性排列，且相邻两个麦克风之间间隔预设距离。
22.可选的，所述唤醒语识别单元包括模数转换单元和数字信号处理单元；
23.所述模数转换单元用于将所述语音信号转换为数字信号形式的语音指令；所述语音指令中携带有与所述麦克风阵列对应的波束信息；所述波束信息用于描述各个所述麦克风接收到所述语音信号的时间以及各个所述麦克风的位置；
24.所述数字信号处理单元用于基于所述波束信息确定所述语音信号对应的声源所处的位置范围，并基于所述位置范围对所述语音指令进行语音增强处理，并向所述控制单元发送语音增强处理后的所述语音指令。
25.第二方面，本技术实施例提供一种语音控制系统，包括至少一个受控设备以及如上述第一方面或第一方面的任一可选方式所述的基于语音控制的终端设备，所述终端设备与所述至少一个受控设备连接。
26.实施本技术实施例提供的基于语音控制的终端设备及语音控制系统具有以下有益效果：
27.本技术实施例提供的一种基于语音控制的终端设备，通过在语音采集单元与控制单元之间设置用于对语音信号进行识别的唤醒语识别单元，在唤醒语识别单元识别出语音信号中包括预设的唤醒语时，向控制单元发送一中断信号；控制单元在接收到该中断信号后才开始监听来自来自唤醒语识别单元的语音指令，即本技术中的唤醒语监听操作由唤醒语识别单元完成，控制单元在唤醒语识别单元监听到预设的唤醒语后才开启语音识别功能，从而不会占用控制单元较多的处理资源，提高了控制单元的资源利用率，且降低了控制单元的功耗。
附图说明
28.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些
附图获得其他的附图。
29.图1为本技术实施例提供的一种基于语音控制的终端设备的结构示意图；
30.图2为本技术另一实施例提供的一种基于语音控制的终端设备的结构示意图；
31.图3为本技术实施例提供的一种语音控制系统的结构示意图。
具体实施方式
32.需要说明的是，本技术实施例的实施方式部分使用的术语仅用于对本技术的具体实施例进行解释，而非旨在限定本技术。在本技术实施例的描述中，除非另有说明，“/”表示或的意思，例如，a/b可以表示a或b；本文中的“和/或”仅仅是一种描述关联物的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。另外，在本技术实施例的描述中，除非另有说明，“多个”是指两个或多于两个，“至少一个”、“一个或多个”是指一个、两个或两个以上。
33.以下，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”特征可以明示或者隐含地包括一个或者更多个该特征。
34.在本说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本技术的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。
35.本技术实施例首先提供一种基于语音控制的终端设备。该终端设备可以是机器人或音响设备等。请参阅图1，为本技术实施例提供的一种基于语音控制的终端设备的结构示意图。如图1所示，该终端设备100可以包括语音采集单元11、唤醒语识别单元12及控制单元13。其中，唤醒语识别单元12与语音采集单元11和控制单元13连接。
36.本技术实施例中，语音采集单元11用于采集语音信号。
37.在具体应用中，语音采集单元11可以包括至少一个麦克风。语音采集单元11可以通过该至少一个麦克风来采集语音信号，并将采集到的语音信号发送给唤醒语识别单元12。其中，麦克风的数量和排列方式可以根据实际需求设置。
38.本技术实施例中，唤醒语识别单元12用于对语音信号进行识别，并在识别出语音信号中包括预设的唤醒语时向控制单元13发送中断信号。
39.在具体应用中，唤醒语识别单元12可以基于语音识别算法对来自语音采集单元11的语音信号进行识别，并判断语音信号中是否包括预设的唤醒语。
40.其中，预设的唤醒语用于唤醒终端设备100的语音控制功能。预设的唤醒语可以是一个字、一个词或一句话等，具体可以根据实际需求设置，此处不对其做特别限定。例如，预设的唤醒语可以是“小q小q”。
41.在本技术的一个实施例中，唤醒语识别单元12在判断出语音信号中包括预设的唤醒语时，可以向控制单元13发送中断信号。在本技术的另一个实施例中，唤醒语识别单元12在判断出语音信号中不包括预设的唤醒语时，可以不对该语音信号进行响应，继续接收来
自语音采集单元11的语音信号，直到识别出语音信号中包括预设的唤醒语时，向控制单元13发送中断信号。
42.在具体应用中，唤醒语识别单元12可以通过硬件中断的方式向控制单元13发送中断信号，也可以通过软件中断的方式向控制单元13发送中断信号。具体可以根据实际需求设置，此处不对其做特别限定。
43.唤醒语识别单元12向控制单元13发出中断信号后，若再次接收到来自语音采集单元11的语音信号，则可以将该语音信号转换为对应的语音指令，并将该语音指令发送给控制单元13。其中，语音信号为模拟信号，语音指令为语音信号对应的数字信号，唤醒语识别单元12可以对语音信号进行模数转换处理，进而得到语音信号对应的语音指令。
44.本技术实施例中，控制单元13用于在接收到中断信号时开始监听来自唤醒语识别单元12的语音指令，并在接收到语音指令时生成与该语音指令对应的控制指令。
45.在一种可能的实现方式中，控制指令可以包括针对终端设备自身的控制指令，例如，运动指令。运动指令中可以包括终端设备的运动参数，例如，终端设备的运动路线、运动速度和/或旋转角速度等。该实现方式中，终端设备100可以通过执行该控制指令来实现对自身的控制。
46.在另一种可能的实现方式中，控制指令可以包括针对与终端设备连接的其他设备的控制指令。该实现方式中，控制单元13可以将控制指令发送给其他设备，以实现对其他设备的控制。
47.在具体应用中，控制单元13可以包括微处理单元(micro controller unit，mcu)、单片机或先进的精简指令微处理器(advanced risc machines，arm)等，具体可以根据实际需求设置，此处不对其做特别限定。
48.以上可以看出，本实施例提供的基于语音控制的终端设备，通过在语音采集单元与控制单元之间设置用于对语音信号进行识别的唤醒语识别单元，在唤醒语识别单元识别出语音信号中包括预设的唤醒语时，向控制单元发送一中断信号；控制单元在接收到该中断信号后才开始监听来自来自唤醒语识别单元的语音指令，即本技术中的唤醒语监听操作由唤醒语识别单元完成，控制单元在唤醒语识别单元监听到预设的唤醒语后才开启语音识别功能，从而不会占用控制单元较多的处理资源，提高了控制单元的资源利用率，且降低了控制单元的功耗。
49.请参阅图2，为本技术另一实施例提供的一种基于语音控制的终端设备的结构示意图。如图2所示，本实施例相对于图1对应的实施例的区别在于，本实施例中的语音采集单元11可以为由多个麦克风(麦克风1～麦克风n)组成的麦克风阵列。示例性的，该多个麦克风可以呈线性排布，且每相邻两个麦克风之间间隔一定距离。当然，该多个麦克风还可以呈其他排列方式。
50.可以理解的是，不同麦克风在排列位置上的差异会导致同一声源发出的语音信号到达不同麦克风的时间不同。因此，利用语音信号达到各个麦克风的时间信息以及各个麦克风的位置信息可以计算出声源所处的位置范围。
51.本实施例中，麦克风在向唤醒语识别单元12传输语音信号的同时，还传输其采集到该语音信号的时间。唤醒语识别单元12可以根据各个麦克风采集到语音信号的时间以及各个麦克风的位置信息计算出声源所处的位置范围，进而对该位置范围内的语音信号进行
语音增强处理，对该位置范围外的语音信号进行滤除。其中，各个麦克风的位置信息可以存储在唤醒语识别单元12中。
52.本实施例采用麦克风阵列来采集语音信号，利用麦克风阵列的强指向性对声源进行定位，并对声源所处的位置范围内的的语音信号进行增强，对声源所处的位置范围外的信号进行滤除，从而可以降低环境噪音对语音信号的干扰，提高了终端设备语音识别的准确率，使得语音控制更为精准。
53.在本技术的又一个实施例中，基于语音控制的终端设备100还包括连接在语音采集单元11与唤醒语识别单元12之间的语音信号处理单元14。
54.其中，语音信号处理单元14用于对语音信号进行预处理，并向唤醒语识别单元12发送预处理后的语音信号。
55.在具体应用中，预处理可以包括滤波处理和信号放大处理。基于此，语音信号处理单元14可以包括滤波电路141和信号放大电路142。
56.其中，滤波电路141可以是硬件滤波电路(例如，可以是由电阻和电容等元器件组成的滤波电路)，也可以是成品滤波器，此处不对其做特别限定。
57.信号放大电路142可以是硬件信号放大电路。实例中的，信号放大电路142可以包括低噪声放大器。
58.本实施例通过在语音采集单元与唤醒语识别单元之间设置语音信号处理单元，可以滤除语音信号中的杂音(例如环境噪音)并对语音信号进行信号放大，从而可以提高唤醒语识别单元和控制单元的语音识别准确率。
59.在本技术的又一个实施例中，基于语音控制的终端设备100还包括与控制单元13连接的通信单元15。终端设备可以通过通信单元15与至少一个受控设备连接。在具体应用中，受控设备可以是智能家居设备，包括但不限于：智能灯、空调、冰箱、洗衣机、晾衣架、窗帘、电视及视频监控器等。受控设备的数目可以根据实际需求设置，此处不对其做特别限定。
60.在一种可能的实现方式中，通信单元15可以是无线通信单元，例如，可以是基于无线保真(wireless fidelity，wifi)协议的通信单元、基于紫蜂(zigbee)协议或基于蓝牙协议的通信单元。
61.在另一种可能的实现方式种，通信单元15可以是有线通信单元，例如，可以是通用串行总线(universal serial bus，usb)接口单元。
62.本实施例中，控制单元13用于在控制指令为针对受控设备的控制指令时，向通信单元15发送控制指令。通信单元15用于接收来自控制单元13的控制指令，并向受控设备发送控制指令。
63.本实施例中，由于控制单元13需要将控制指令发送给与终端设备连接的受控设备，因此控制单元13在生成控制指令时需要终端设备与受控设备之间的通信协议，即控制单元13生成的控制指令的数据结构要符合该通信协议的要求。
64.在一种可能的方式中，控制指令的数据结构可以如下表1所示。
65.表1
66.数据头数据长度功能码数据位校验位byte0，byte1byte2byte3byte4-byte nbyte n+1
67.其中，数据头为控制指令的起始字节，用于表示控制指令的开始。示例性的，数据头可以通过两个字节(即byte0和byte1)来表示。作为示例而非限定，byte0和byte1均可以为十六进制数0xf8(即二进制数11111000)。
68.数据长度用于表示控制指令的有效数据长度，即表1中包括数据头在内的所有字节的长度。
69.功能码用于表示控制指令所实现的功能类别。不同类别的功能通过该功能码进行唯一标识。示例性的，功能码的定义可以如下：
70.当功能码为十六进制数0x00，表示用于实现对终端设备的运动控制功能。
71.当功能码为十六进制数0x01，表示用于实现对智能灯的控制功能。
72.当功能码为十六进制数0x02，表示用于实现对空调的控制功能。
73.当功能码为十六进制数0x03，表示用于实现对冰箱的控制功能。
74.当功能码为十六进制数0x04，表示用于实现对洗衣机的控制功能。
75.当功能码为十六进制数0x05，表示用于实现对晾衣架的控制功能。
76.当功能码为十六进制数0x06，表示用于实现对窗帘的控制功能。
77.当功能码为十六进制数0x07，表示用于实现对电视的控制功能。
78.当功能码为十六进制数0x08，表示用于实现对视频监控器的控制功能。
79.数据位用于记载有效控制内容。有效控制内容用于描述对目标设备的控制方式，即对目标设备进行怎样的控制。数据位的长度根据控制内容的不同而不同，具体可以根据实际需求确定，此处不对数据位的长度做特别限定。其中，目标设备可以是终端设备100本身，也可以是与终端设备100连接的受控设备。
80.校验码用于验证控制指令的有效性。校验码可以是基于预设的校验码生成策略生成的。示例性的，校验码生成策略可以为：从控制指令的第一个字节开始，将控制指令中的第一个字节与第二字节进行异或运算，得到第一个异或值；将第一个异或值与第三字节进行异或运算，得到第二个异或值；以此类推，直至求得第n-1个异或值为止，将第n-1个异或值作为校验码。
81.受控设备接收到数据后，可以先通过数据头来识别控制指令，再基于控制指令中的功能码来识别该控制指令是否是针对当前受控设备自身的。如果控制指令是针对当前受控设备自身的，则基于控制指令中的校验码对控制指令的有效性进行验证，在确定控制数据有效后基于控制指令中的数据位实现相应控制。
82.本实施例通过在终端设备中增加通信单元，可以使终端设备通过通信单元与受控设备进行连接，进而实现对受控设备的语音控制。
83.在本技术的又一个实施例中，基于语音控制的终端设备100还包括电机驱动单元16、电机17及运动组件18。其中，电机驱动单元16与控制单元13连接，电机17与电机驱动单元16和运动组件18连接。
84.本实施例中，控制单元13用于在控制指令为针对终端设备自身的运动指令时，向电机驱动单元16发送该控制指令。该控制指令中可以携带有终端设备的运动参数，例如，终端设备的运动路线、运动速度和/或旋转角速度等。
85.电机驱动单元16用于基于该控制指令驱动电机17运转，以带动运动组件18进行相应运动。
86.本实施例通过在终端设备中设置电机驱动单元、电机及运动组件，可以实现语音控制终端设备运动，从而提高了对终端设备控制的便捷性。
87.在本技术的又一个实施例中，基于语音控制的终端设备100还包括与控制单元13连接的音频输出单元19。本实施例中，控制单元13用于在接收到中断信号时生成携带有回复语的音频信号，并向音频输出单元19发送该音频信号。其中，音频输出单元19用于接收音频信号，并播放音频信号中的回复语。
88.本实施例中，音频输出单元19播放回复语的目的是为了告知用户终端设备的语音监听功能已开启，用户可以开始对终端设备进行语音控制。
89.其中，回复语可以根据实际需求设置，此处不对其做特别限定。例如，回复语可以为“灵犀灵犀”。
90.在具体应用中，音频输出单元19可以包括信号放大电路和扬声器(未图示)。其中，信号放大电路与控制单元13和扬声器连接。信号放大电路用于对携带有回复语的音频信号进行信号放大处理，并将信号放大处理后的音频信号发送给扬声器。扬声器用于对音频信号中的回复语进行播放。
91.本实施例通过在终端设备中设置音频输出单元，通过音频输出单元输出与用户发出的语音信号对应的回复语，使用户可以及时获知终端设备的状态。
92.在本技术的又一个实施例中，基于语音控制的终端设备100还包括与控制单元13连接的状态指示单元20。其中，状态指示单元20用于通过指示灯指示终端设备100的状态。示例性的，终端设备100的状态包括但不限于终端设备100中的控制单元13的语音监听状态。
93.在具体应用中，状态指示单元20可以包括发光二极管(light-emitting diode，led)，通过控制led发出不同颜色的光来对终端设备的不同状态进行指示。
94.在本技术的又一个实施例中，唤醒语识别单元12可以包括模数转换单元121和数字信号处理单元122。
95.其中，模数转换单元121用于将语音信号转换为数字信号形式的语音指令；语音指令中携带有与麦克风阵列对应的波束信息。波束信息可以用于描述各个麦克风接收到语音信号的时间以及各个麦克风的位置。
96.数字信号处理单元122用于基于波束信息确定语音信号对应的声源所处的位置范围，并基于该位置范围对语音指令进行语音增强处理，并向控制单元13发送语音增强处理后的语音指令。
97.在具体应用中，模数转换单元121的数目可以与麦克风的数目相等，即，每个模数转换单元121对应一个麦克风，每个模数转换单元121用于将来自其对应的麦克风的语音信号转换为数字形式的语音指令。
98.本实施例中，数字信号处理单元122确定出声源所处的位置范围后，可以对该位置范围内的语音信号进行语音增强处理，对该位置范围外的语音信号进行滤除，从而可以降低环境噪音对语音信号的干扰，提高了终端设备语音识别的准确率，使得语音控制更为精准。
99.在本技术的又一个实施例中，终端设备100还可以包括与控制单元13连接的存储单元以及为各个单元进行供电的供电单元等。
100.本技术实施例还提供一种语音控制系统。请参阅图3，为本技术实施例提供的一种语音控制系统的结构示意图。如图3所示，该语音控制系统可以包括至少一个受控设备以及图1或图2对应的实施例中的基于语音控制的终端设备100。该终端设备100与至少一个受控设备连接。
101.需要说明的是，关于终端设备100的说明具体可以参考图1和图2以及图1和图2对应的实施例中的相关描述，此处不再对其进行赘述。
102.所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元完成，即将语音播报装置的内部结构划分成不同的功能单元，以完成以上描述的全部或者部分功能。实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本技术的保护范围。上述系统中单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
103.在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参照其它实施例的相关描述。
104.本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本技术的范围。
105.以上所述实施例仅用以说明本技术的技术方案，而非对其限制；尽管参照前述实施例对本技术进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围，均应包含在本技术的保护范围之内。

技术特征：
1.一种基于语音控制的终端设备，其特征在于，包括：语音采集单元，用于采集语音信号；唤醒语识别单元，与所述语音采集单元连接，所述唤醒语识别单元用于对所述语音信号进行识别，并在识别出所述语音信号中包括预设的唤醒语时向控制单元发送中断信号；所述控制单元，与所述唤醒语识别单元连接，所述控制单元用于在接收到所述中断信号时开始监听来自所述唤醒语识别单元的语音指令，并在接收到所述语音指令时生成与所述语音指令对应的控制指令。2.根据权利要求1所述的终端设备，其特征在于，还包括连接在所述语音采集单元与所述唤醒语识别单元之间的语音信号处理单元；所述语音信号处理单元用于对所述语音信号进行预处理，并向所述唤醒语识别单元发送预处理后的所述语音信号；所述预处理包括滤波处理和信号放大处理。3.根据权利要求1所述的终端设备，其特征在于，还包括与所述控制单元连接的通信单元；所述终端设备通过所述通信单元与至少一个受控设备连接；所述控制单元用于在所述控制指令为针对所述受控设备的控制指令时，向所述通信单元发送所述控制指令；所述通信单元用于接收来自所述控制单元的所述控制指令，并向所述受控设备发送所述控制指令。4.根据权利要求1所述的终端设备，其特征在于，还包括电机驱动单元、电机及运动组件；所述电机驱动单元与所述控制单元连接，所述电机与所述电机驱动单元和所述运动组件连接；所述控制单元用于在所述控制指令为针对所述控制单元所在的终端设备的运动指令时，向所述电机驱动单元发送所述控制指令；所述电机驱动单元用于基于所述控制指令驱动所述电机运转，以带动所述运动组件进行相应运动。5.根据权利要求1所述的终端设备，其特征在于，还包括与所述控制单元连接的音频输出单元；所述控制单元用于在接收到所述中断信号时生成携带有回复语的音频信号，并向所述音频输出单元发送所述音频信号；所述音频输出单元用于接收所述音频信号，并播放所述回复语。6.根据权利要求1所述的终端设备，其特征在于，还包括与所述控制单元连接的状态指示单元；所述状态指示单元用于通过指示灯指示所述控制单元所在的终端设备的状态。7.根据权利要求1至6任一项所述的终端设备，其特征在于，所述语音采集单元为由多个麦克风组成的麦克风阵列。8.根据权利要求7所述的终端设备，其特征在于，所述多个麦克风线性排列，且相邻两个麦克风之间间隔预设距离。9.根据权利要求7所述的终端设备，其特征在于，所述唤醒语识别单元包括模数转换单元和数字信号处理单元；所述模数转换单元用于将所述语音信号转换为数字信号形式的语音指令；所述语音指令中携带有与所述麦克风阵列对应的波束信息；所述波束信息用于描述各个所述麦克风接
收到所述语音信号的时间以及各个所述麦克风的位置；所述数字信号处理单元用于基于所述波束信息确定所述语音信号对应的声源所处的位置范围，并基于所述位置范围对所述语音指令进行语音增强处理，并向所述控制单元发送语音增强处理后的所述语音指令。10.一种语音控制系统，其特征在于，包括至少一个受控设备以及如权利要求1至9任一项所述的基于语音控制的终端设备，所述终端设备与所述至少一个受控设备连接。

技术总结
本申请适用于语音识别技术领域，提供了一种基于语音控制的终端设备及语音控制系统，其中，基于语音控制的终端设备包括：语音采集单元，用于采集语音信号；唤醒语识别单元，与所述语音采集单元连接，所述唤醒语识别单元用于对所述语音信号进行识别，并在识别出所述语音信号中包括预设的唤醒语时向控制单元发送中断信号；所述控制单元，与所述唤醒语识别单元连接，所述控制单元用于在接收到所述中断信号时开始监听来自所述唤醒语识别单元的语音指令，并在接收到所述语音指令时生成与所述语音指令对应的控制指令，从而不会占用控制单元较多的处理资源，提高了控制单元的资源利用率，且降低了控制单元的功耗。降低了控制单元的功耗。降低了控制单元的功耗。

技术研发人员：高向阳程俊任子良张锲石康宇航郭海光
受保护的技术使用者：中国科学院深圳先进技术研究院
技术研发日：2021.11.30
技术公布日：2022/3/8

专利

最新回复(0)