变换域中瞬变的高效编码的制作方法

专利查询1天前  4


本说明书整体涉及数字音频编码。


背景技术:

1、数字音频编码通常包括将时域音频样本的帧变换成频域样本的块,和然后,量化频域样本。

2、在频域编码中,由于缺乏时域掩蔽,瞬变通常导致可感知的量化噪声。例如,冲击声音之后是静音或者无声之后是语音的开始导致频域编码不能很好地编码的瞬变。当在带宽受限的编码应用中将频率建模应用于此类瞬变时,频率模型通常将信号能量移动到应当是无声的音频信号的部分,这可导致人类收听者的失真感知。这些伪像通常被表征为“前回声”伪像。

3、为了减轻此类伪像,在音频编码中流行两种技术。首先,音频编码器对音频内容的帧执行该编码器的频率变换,与瞬变不存在时相比,该音频编码器可在瞬变发生时采用更短变换窗口。第二,音频编码器可采用时域噪声整形(tns)。然而,这两种技术都增加编码音频内容的比特数量,这可使得该技术不适用于带宽受限的编码应用。


技术实现思路



技术特征:

1.一种音频编码方法,包括:

2.根据权利要求1所述的音频编码方法,还包括,在解析成多个窗口之前:

3.根据权利要求1所述的音频编码方法,其中,所述频域系数的布置是根据第一对准模式的,并且所述第一对准模式包括将所述频域系数的窗口连接成用于所述帧的一系列窗口,其中每个窗口内的频域系数按频率定序,并且按频率定序在所述系列中的邻近窗口之间反向。

4.根据权利要求1所述的音频编码方法,其中,所述频域系数的布置是根据第二对准模式的,并且所述第二对准模式包括根据频率来排序所有窗口的频域系数,使得用于来自所有窗口的最低频率的频率系数在所述第二对准模式下彼此邻近。

5.根据权利要求1所述的音频编码方法,其中,所述频谱包络的估计包括:估计与根据所述对准模式布置的所述频域系数对应的线性预测(lp)参数。

6.根据权利要求1所述的音频编码方法,其中,编码包括:

7.根据权利要求6所述的音频编码方法,还包括:

8.根据权利要求1所述的音频编码方法,其中,所述音频样本的编码包括对从多个所述窗口提取的频域系数的向量进行向量量化。

9.一种用于音频编码的系统,包括:

10.一种非暂态计算机可读存储器,所述非暂态计算机可读存储器存储用于编码音频的指令,所述指令在由处理器执行时使得所述处理器:

11.一种音频编码方法,包括:

12.一种音频解码方法,包括:

13.根据权利要求12所述的音频解码方法,还包括:在所述归一化系数的去归一化之前:

14.根据权利要求12所述的音频解码方法,其中,所述对准模式是第一对准模式,并且所述第一对准模式包括将所述频域系数的窗口连接成用于所述帧的一系列窗口,其中每个窗口内的频域系数按频率定序,并且按频率定序在所述系列中的邻近窗口之间反向。

15.根据权利要求12所述的音频解码方法,其中,所述对准模式是第二对准模式,并且所述第二对准模式包括根据频率来排序所有窗口的频域系数,使得用于来自所有窗口的最低频率的频域系数在所述第二对准模式中彼此邻近。

16.根据权利要求12所述的音频解码方法,其中,对所述频谱包络的指示包括与根据所述对准模式布置的所述频域系数对应的线性预测(lp)。

17.根据权利要求12所述的音频解码方法,其中,去归一化包括:

18.根据权利要求17所述的音频解码方法,还包括:

19.根据权利要求12所述的音频解码方法,其中,所述编码音频信号的解码以确定归一化频域系数,包括对来自多个所述窗口的频域系数的向量进行逆向量量化。

20.一种用于音频解码的系统,包括:

21.一种非暂态计算机可读存储器,所述非暂态计算机可读存储器存储用于解码音频的指令,所述指令在由处理器执行时使得所述处理器:


技术总结
本公开涉及变换域中瞬变的高效编码。本公开的各方面提供用于对具有瞬变音频声音的音频信号进行编码的改进的技术。改进的技术包括将预定长度的音频样本的帧解析成一系列更小尺寸的窗口,以及将时域样本的窗口变换成一系列频域样本的窗口。可根据对准模式来组织频域样本,且可相对于所组织的频域样本的包络来编码频域样本。

技术研发人员:V·阿蒂,D·森
受保护的技术使用者:苹果公司
技术研发日:
技术公布日:2024/12/5

最新回复(0)