音频特征的提取方法、装置、计算机设备及存储介质与流程

本申请涉及车辆音乐系统，具体涉及一种音频特征的提取方法、装置、计算机设备及存储介质。

背景技术：

1、随着车载音乐系统在现代汽车中的广泛应用，对提高车内音乐体验的需求逐渐增加。传统车载音乐特征提取方法因存在提取的特征不足的技术问题，导致不能满足用户日益增长的体验需求。

技术实现思路

1、鉴于上述问题，本申请提供了一种音频特征的提取方法、装置、计算机设备及存储介质，用于解决现有技术中存在的提取特征不足的技术问题，通过将初始音频特征进行映射变换处理后，得到包括不同频率的待处理音频特征，再采用多个频率和分辨率各不相同的梅尔滤波器组对待处理音频特征进行滤波，以到待处理音频特征对应的多个频谱表示；对每个频谱表示进行非线性变换和多级离散余弦变换，得到多个频率系数，最后再将各频谱表示和各频率系数进行融合，得到目标音频特征。实现了对不同频率的特征对应采用不同的频率的梅尔滤波器组进行滤波处理，再针对得到的不同频谱表示进行分别处理，最后再融合，从而能够对不同频率的特征都进行准确的捕捉和分析，进而提高了音频特征提取的准确性。同时，不同频率的特征对应了不同音频细节，通过区分频率进行分别提取和并行处理后再融合，保证了音频特征提取的完整性，避免了现有技术存在的提取特征不足的情况，进而满足了用户体验需求，进一步提高了用户体验度。

2、根据本申请实施例的一个方面，提供了一种音频特征的提取方法，所述方法包括：对初始音频特征进行映射变换处理，得到映射变换后的待处理音频特征；其中，所述待处理音频特征包括多个不同频率的音频特征；采用预设的多个梅尔滤波器组，对所述待处理音频特征进行滤波处理，得到所述待处理音频特征对应的多个频谱表示；其中各梅尔滤波器组之间的频率或分辨率不同，一个所述频谱表示对应一个所述梅尔滤波器组；对每个所述频谱表示进行非线性变换，得到多个变换后的频谱表示；对每个所述变换后的频谱表示进行多级离散余弦变换，得到多个频率系数；将各个所述频谱表示和各个所述频率系数进行融合，得到目标音频特征。

3、在一种可选的方式中，所述对初始音频特征进行映射变换处理，得到待处理音频特征步骤之前，还包括：对原始音乐信号进行预处理，得到初始音频特征。

4、在一种可选的方式中，所述对原始音乐信号进行预处理，得到初始音频特征，进一步包括：对原始音乐信号进行编解码处理，得到格式统一的音乐数据；对所述音乐数据进行降采样处理，得到初始音频特征。

5、在一种可选的方式中，所述对初始音频特征进行映射变换处理，得到映射变换后的待处理音频特征步骤，进一步包括：基于预设变换对所述初始音频特征进行映射变换处理，得到包括所述初始音频特征的频率和相位的复平面图像；其中，所述复平面图像则为所述映射变换后的待处理音频特征，所述复平面图像中的点表征所述待处理音频特征的频率。

6、在一种可选的方式中，所述对每个所述频谱表示进行非线性变换，得到多个变换后的频谱表示步骤，进一步包括：基于预设函数对每个所述频谱表示进行非线性压缩变换，得到多个变换后的频谱表示；其中，所述预设函数包括对数函数或指数函数。

7、在一种可选的方式中，所述对每个所述变换后的频谱表示进行多级离散余弦变换，得到多个频率系数步骤，进一步包括：遍历每个所述变换后的频谱表示，并将遍历到的所述变换后的频谱表示作为目标频谱表示；对所述目标频谱表示进行当前层级的离散余弦变换，并将得到的当前层级的输出作为下一层级的离散余弦变换的输入，重复本步骤，直至当前层级的数量达到预设数量或当前层级的输出符合预设压缩率时停止；将停止时所对应的当前层级的输出作为所述目标频谱表示的频率系数，得到各个所述变换后的频谱表示对应的频率系数，进而得到多个频率系数。

8、在一种可选的方式中，所述将各个所述频谱表示和各个所述频率系数进行融合，得到目标音频特征步骤，进一步包括：基于加权平均算法将各个所述频率系数进行拼接融合，得到拼接音频特征；基于深度学习算法将所述拼接音频特征和预设特征进行特征融合，得到目标音频特征；其中，所述预设特征包括预设色度特征和预设频谱对比度特征。

9、根据本申请实施例的另一方面，提供了一种音频特征的提取装置，包括：特征处理模块，用于对初始音频特征进行映射变换处理，得到映射变换后的待处理音频特征；其中，所述待处理音频特征包括多个不同频率的音频特征；特征处理模块，还用于采用预设的多个梅尔滤波器组，对所述待处理音频特征进行滤波处理，得到所述待处理音频特征对应的多个频谱表示；其中各梅尔滤波器组之间的频率或分辨率不同，一个所述频谱表示对应一个所述梅尔滤波器组；特征处理模块，还用于对每个所述频谱表示进行非线性变换，得到多个变换后的频谱表示；特征处理模块，还用于对每个所述变换后的频谱表示进行多级离散余弦变换，得到多个频率系数；特征融合模块，用于将各个所述频谱表示和各个所述频率系数进行融合，得到目标音频特征。

10、根据本申请实施例的另一方面，提供了一种计算机设备，包括：，包括：控制器；存储器，用于存储一个或多个程序，当一个或多个程序被控制器执行时，使得控制器实现上述任意一项权利要求中所述的音频特征的提取方法。

11、根据本申请实施例的又一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令在计算机装置/设备上运行时，使得计算机装置/设备执行上述任意一项权利要求中所述的音频特征的提取方法的操作。

12、本申请实施例通过将初始音频特征进行映射变换处理后，得到包括不同频率的待处理音频特征，再采用多个频率和分辨率各不相同的梅尔滤波器组对待处理音频特征进行滤波，以到待处理音频特征对应的多个频谱表示；对每个频谱表示进行非线性变换和多级离散余弦变换，得到多个频率系数，最后再将各频谱表示和各频率系数进行融合，得到目标音频特征。实现了对不同频率的特征对应采用不同的频率的梅尔滤波器组进行滤波处理，再针对得到的不同频谱表示进行分别处理，最后再融合，从而能够对不同频率的特征都进行准确的捕捉和分析，进而提高了音频特征提取的准确性。同时，不同频率的特征对应了不同音频细节，通过区分频率进行分别提取和并行处理后再融合，保证了音频特征提取的完整性，避免了现有技术存在的提取特征不足的情况，进而满足了用户体验需求，进一步提高了用户体验度。

13、上述说明仅是本申请实施例技术方案的概述，为了能够更清楚了解本申请实施例的技术手段，而可依照说明书的内容予以实施，并且为了让本申请实施例的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

技术特征：

1.一种音频特征的提取方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对初始音频特征进行映射变换处理，得到待处理音频特征步骤之前，还包括：

3.根据权利要求2所述的方法，其特征在于，所述对原始音乐信号进行预处理，得到初始音频特征步骤，进一步包括：

4.根据权利要求1所述的方法，其特征在于，所述对初始音频特征进行映射变换处理，得到映射变换后的待处理音频特征步骤，进一步包括：

5.根据权利要求1所述的方法，其特征在于，所述对每个所述频谱表示进行非线性变换，得到多个变换后的频谱表示步骤，进一步包括：

6.根据权利要求1所述的方法，其特征在于，所述对每个所述变换后的频谱表示进行多级离散余弦变换，得到多个频率系数步骤，进一步包括：

7.根据权利要求1至6中任意一项所述的方法，其特征在于，所述将各个所述频谱表示和所述频率系数进行融合，得到目标音频特征步骤，进一步包括：

8.一种音频特征的提取装置，其特征在于，所述装置包括：

9.一种计算机设备，其特征在于，包括：

10.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一可执行指令，所述可执行指令在计算机装置/设备上运行时，使得计算机装置/设备执行如权利要求1至7中任意一项所述的音频特征的提取方法的操作。

技术总结
本申请涉及车辆音乐系统技术领域，公开了一种音频特征的提取方法、装置、计算机设备及存储介质。应用本申请的技术方案，能够对不同频率的特征对应采用不同的频率的梅尔滤波器组进行滤波处理，再针对得到的不同频谱表示进行分别处理，最后再融合，从而实现了对不同频率的特征都能够准确的捕捉和分析，进而提高了音频特征提取的准确性。同时，不同频率的特征对应了不同音频细节，通过区分频率进行分别提取和并行处理后再融合，保证了音频特征提取的完整性，避免了现有技术存在的提取特征不足的情况，进而满足了用户体验需求，进一步提高了用户体验度。

技术研发人员：杨超,何浩,段文平,黄勇波,伍海银,苏军,张保林,王令,唐建权,马念
受保护的技术使用者：重庆赛力斯新能源汽车设计院有限公司
技术研发日：
技术公布日：2024/12/5

专利

最新回复(0)