一种语音识别系统的制作方法

专利查询2023-9-4 141

1.本发明涉及语音识别技术领域，具体涉及一种语音识别系统。

背景技术：

2.一种语音识别系统是一种能够智能识别语音并将输入的语音转换为文本的系统，以往，在无相关语音数据的情况下，需要后台进行大量输入各种类型的语音数据，数据量大，且费时费力，且后台人员输入的语音数据风格相似，对比时容易产生较大误差，此外，以往的语音识别系统功能较为单一，仅仅只是将方言转换成相应的文本，使用范围受限。

技术实现要素：

3.本发明所要解决的技术问题是提供一种语音识别系统，以克服上述现有技术中的不足。
4.本发明解决上述技术问题的技术方案如下：一种语音识别系统，包括服务器端以及与其连接的客户端，服务器端包括：服务器端接收部，其接收从客户端发送的语音数据；服务器端发送部，其向客户端发送服务器端对语音数据处理的结果；服务器端分类部，其将服务器端接收部接收到的语音数据进行分析，转换成相应的文本，并按地域方言、性别以及年龄段进行按字、词组以及句段进行分类；服务器端存储部，其将服务器端分类部分类的语音数据及其关联的文本进行对应存储；服务器端比对部，其将客户端发送部发送过来的语音数据，与服务器端存储部中已分类的语音数据进行分析比对，选择最为接近的结果并通过服务器端发送部发送至客户端；客户端包括：客户端语音输入部，其将所输入的发声语音转换成语音数据；客户端发送部，其向服务器端接收部发送客户端语音输入部所转换的语音数据；客户端接收部，其接收服务器端发送部所发送的语音数据处理的结果；客户端输出部，其输出服务器端比对部所确定的语音识别结果。
5.本发明的有益效果是：通过将客户端输入的每一条语音作为语音样本，再经过服务器端分类部进行字、词组以及句段的提取和分类，以存储于服务器端存储部中，当需要识别方言语音时，只需通过服务器端比对部在服务器端存储部中进行调取和比对现有的语音数据，即可快速得到结果，降低了错误率。
附图说明
6.图1为本发明的结构框架示意图；
7.附图中，各标号所代表的部件列表如下：
8.1、服务器端，11、服务器端接收部，12、服务器端发送部，13、服务器端分类部，14、服务器端存储部，15、服务器端比对部，2、客户端，21、客户端输入部，22、客户端发送部，23、客户端接收部，24、客户端输出部，25、客户端规则制定部，251、敏感词制定部，252、方言学习部，253、方言屏蔽部，254、自动补充部，255、检索规则制定部。
具体实施方式
9.以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。
10.如图1所示，一种语音识别系统，包括服务器端1以及与其连接的客户端2，服务器端1包括：
11.服务器端接收部11，其接收从客户端2发送的语音数据；
12.服务器端发送部12，其向客户端2发送服务器端1对语音数据处理的结果；
13.服务器端分类部13，其将客户端2接收到的每一条语音数据均作为语音样本，进行分析，转换成相应的文本，并按地域方言、性别以及年龄段进行按字、词组以及句段进行分类；
14.服务器端存储部14，其将服务器端分类部13分类的语音数据及其关联的文本进行对应存储；
15.服务器端比对部15，其将客户端发送部22发送过来的语音数据，与服务器端存储部14中已分类的语音数据进行分析比对，选择最为接近的结果并通过服务器端发送部12发送至客户端2；
16.客户端2包括：
17.客户端输入部21，其接收发声语音，并将所输入的发声语音转换成语音数据，同时也可输入该语音数据所对应的文本，以用于系统内用户共享；
18.客户端发送部22，其向服务器端接收部11发送客户端输入部21所转换的语音数据；
19.客户端接收部23，其接收服务器端发送部12所发送的语音数据处理的结果；
20.客户端输出部24，其输出服务器端比对部15所确定的语音识别结果。
21.用户共享：客户端输入部21采集发声语音，并转换成语音数据，同时使用者录入对应的文本内容，经客户端发送部22发送给服务器端接收部11，服务器端分类部13将接收到的语音数据进行分解为字、词组以及句段，并与文本内容相对应，进而进行分类存储。
22.语音识别：客户端输入部21采集发声语音，并转换成语音数据，经客户端发送部22发送给服务器端接收部11，服务器端比对部15调取服务器端存储部14内数据并进行数据对比，筛选最为近似的结果，并通过服务器端发送部12发送给客户端接收部23，经客户端输出部24解析并输出
23.客户端2还包括客户端规则制定部25，其制定指定的内容类型或方式的规则，服务器端比对部15根据客户端规则制定部25制定的规则，将语音数据与服务器端存储部14内数据进行比对，并按要求筛选或剔除。
24.客户端规则制定部25还包括：
25.敏感词制定部251，其用于制定剔除敏感词规则，进而通过服务器端比对部15将语音数据与服务器端存储部14内存储的词组进行比对和剔除，再进行输出；
26.方言学习部252，其用于将服务器端存储部14内所分类存储的字、词组以及句段，进行语音及文本关联输出；
27.方言屏蔽部253，其用于在指定的情况下分析和判别语音数据是否为方言，若为方言则智能屏蔽；
28.自动补充部254，其用于在指定的情况下，将接收到的不清晰、模糊发音，通过服务器端比对部15将语音数据与服务器端存储部14内存储的语音数据进行比对，并将最为接近的字、词组或句段进行填充，进而补充完整。
29.客户端规则制定部25还包括检索规则制定部255，其用于制定方言学习部252的检索规则，指定字、词组或句段进而输出。
30.尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

技术特征：
1.一种语音识别系统，其特征在于，包括服务器端(1)以及与其连接的客户端(2)，所述服务器端(1)包括：服务器端接收部(11)，其接收从所述客户端(2)发送的语音数据；服务器端发送部(12)，其向所述客户端(2)发送服务器端(1)对语音数据处理的结果；服务器端分类部(13)，其将客户端(2)接收到的每一条语音数据均作为语音样本，进行分析，转换成相应的文本，并按地域方言、性别以及年龄段进行按字、词组以及句段进行分类；服务器端存储部(14)，其将服务器端分类部(13)分类的语音数据及其关联的文本进行对应存储；服务器端比对部(15)，其将客户端发送部(22)发送过来的语音数据，与服务器端存储部(14)中已分类的语音数据进行分析比对，选择最为接近的结果并通过服务器端发送部(12)发送至客户端(2)；所述客户端(2)包括：客户端输入部(21)，其接收发声语音，并将所输入的发声语音转换成语音数据，同时也可输入该语音数据所对应的文本，以用于系统内用户共享；客户端发送部(22)，其向所述服务器端接收部(11)发送客户端输入部(21)所转换的语音数据；客户端接收部(23)，其接收所述服务器端发送部(12)所发送的语音数据处理的结果；客户端输出部(24)，其输出所述服务器端比对部(15)所确定的语音识别结果。2.根据权利要求1所述的一种语音识别系统，其特征在于，所述客户端(2)还包括客户端规则制定部(25)，其制定指定的内容类型或方式的规则，服务器端比对部(15)根据客户端规则制定部(25)制定的规则，将语音数据与服务器端存储部(14)内数据进行比对，并按要求筛选或剔除。3.根据权利要求2所述的一种语音识别系统，其特征在于，所述客户端规则制定部(25)还包括：敏感词制定部(251)，其用于制定剔除敏感词规则，进而通过服务器端比对部(15)将语音数据与服务器端存储部(14)内存储的词组进行比对和剔除，再进行输出；方言学习部(252)，其用于将服务器端存储部(14)内所分类存储的字、词组以及句段，进行语音及文本关联输出；方言屏蔽部(253)，其用于在指定的情况下分析和判别语音数据是否为方言，若为方言则智能屏蔽；自动补充部(254)，其用于在指定的情况下，将接收到的不清晰、模糊发音，通过服务器端比对部(15)将语音数据与服务器端存储部(14)内存储的语音数据进行比对，并将最为接近的字、词组或句段进行填充，进而补充完整。4.根据权利要求2所述的一种语音识别系统，其特征在于，所述客户端规则制定部(25)还包括检索规则制定部(255)，其用于制定方言学习部(252)的检索规则，指定字、词组或句段进而输出。

技术总结
本发明涉及一种语音识别系统，服务器端包括：服务器端分类部，其将客户端接收到的每一条语音数据均作为语音样本，进行分析，转换成相应的文本，并按地域方言、性别以及年龄段进行按字、词组以及句段进行分类；客户端包括：客户端输入部，其接收发声语音，并将所输入的发声语音转换成语音数据，同时也可输入该语音数据所对应的文本，以用于系统内用户共享。通过将客户端输入的每一条语音作为语音样本，再经过服务器端分类部进行字、词组以及句段的提取和分类，以存储于服务器端存储部中，当需要识别方言语音时，只需通过服务器端比对部在服务器端存储部中进行调取和比对现有的语音数据，即可快速得到结果，降低了错误率。降低了错误率。降低了错误率。

技术研发人员：余利强
受保护的技术使用者：武汉俊楚信息科技有限公司
技术研发日：2021.10.14
技术公布日：2022/3/8

专利

最新回复(0)