音频有损编码有:aac,mp3,ogg(vobis),opus等。这里只讨论主流编码格式,aac编码器有faac,qaac,fhgacc,neroacc,fdkacc,falabaac等,其封装格式有.aac,.m4a,.m4b,.mp4等。
aac基本上是最优秀的有损编码器,它有着非常好的频谱一致性,照顾了0~22kHZ的频谱响应,而不是高频一刀切。虽然我们很难分辨高频信息,但是高频信息影响我们对音乐的赏析,没有高频信息会变得难听,而且频谱差异也并不是用肉眼看的,即使频谱上很难发现差异,但是在波形上会出现极大差异,是肉耳可闻的差异,只不过有损压缩一般会得到一致的频率响应,为此可以在振幅大的点误差也大,也就是音量大的时刻差异相应地增大,而由于音量的增大,我们更难发现这个差异,所以良好的有损压缩会利用这个特点,原始音频的频谱和有损音频频谱一致,且和两者差值(也叫纠错音频)的频谱基本一致,也就是说纠错音频放大音量来听也能听到原音乐的大部分信息,这就是三者的相似性。
其他有损音频也大致如此,当然,也有不完全考虑或完全不考虑三者频谱一致性(即人体声学),如:wv有损模式,ofs双流模式。wv有损基本没有考虑之,它的纠错音频频谱是一条条竖线,即某时刻各频率响应基本一致,这样可以尽量与原始音频接近从而纠错音频可以压缩得更小,这就是wv混合模式可以不增加文件体积的原因。而ofs双流模式(OptimFROG DualStream),它介于wv和aac之间,频率响应优于wv,但压缩耗时多,文件体积基本没变,这是最好的有损无损混合模式,但支持设备极少。另外,aac编码有一种HD-AAC,也即MPEG-4 SLS,它是对AAC音频的纠错音频应用MPEG-4 SLS编码,某些情况下效果可以(文件体积多出1%),某些情况下极差(可能是编码不成熟),对应的编解码器是Nero商业版工作站,它的HD-AAC基本没用。
mp3格式音频实在是不太好的有损,不过是最先流行起来的,它编码效率不高,但是一般地320kbps的mp3还是优于256kbps的aac音频的,两者音质基本一样。
ogg格式音频也是十分适合高码率有损音频的,一般建议128~512kbps使用,在较高码率下可能优于aac(不过太高码率意义不大)。
opus格式音频其实没什么用,你说它对低频处理得非常好,但是在它的纠错文件频谱上,可以明显看见低频上有明显的响应,这说明它其实是本末倒置,它对20kHZ以上频谱一刀切,而且它要求编码後采样率为48kHZ,然而重采样也会损失部分音质(信噪比一般有130dB)。
一、在频谱上比较各种有损音频编码方案:
音频:BGM02A.wav 立体声 16位 48kHZ
<