本指南将涵盖当今音频流服务使用的一些最流行的格式,并解释它们的区别。

什么是音频文件格式?

打开网易新闻 查看更多图片

数字音频文件是记录内容如何保存在计算机、媒体播放器、智能手机或其他设备上的方式。在最基本的层面上,数字音频是设备可以用来重现声波的一系列数字。有多种方法可以完成此操作,然后压缩(或不压缩)结果数据。我们知道,通过在从模数转换到 44.1kHz 的至少 16 位的过程中对声波进行采样,我们可以在以后再次完美地再现捕获的信号。这要归功于称为Nyquist-Shannon 采样定理的一些数学运算。我们可以实现更高的比特率和频率范围,但是否有人能听到差异——即使是最好的耳机——充其量也是值得商榷的。

如果我们只是按原样保存该数据(称为脉冲编码调制或 PCM),则该文件会占用大量空间。这就是开发有损和无损音频压缩形式的原因。有损音频会抛出我们耳朵听不到的音频频率,而无损音频则会保留它们。有损音频格式还可以使用其他技巧来进一步压缩音频,我们稍后会介绍。

因为如今大多数人通过流媒体服务访问他们的音乐,所以压缩的有损文件格式是分发内容的主要方式。随便听也没关系,但有些人要求最高质量。因此,现在可以使用越来越多的高质量甚至无损流媒体选项。但是,如下图所示,有损格式占用的空间更少,消耗的移动数据也更少,这是无法回避的事实。

MP3

打开网易新闻 查看更多图片

在下载音乐时,MP3 音频文件格式曾经是至高无上的。事实上,这种格式是移动音乐解决方案的代名词,以至于“MP3 播放器”现在是音频播放设备的通用格式。但是,由于各种原因,如今它已不那么突出了。不过,它仍在继续。了解 MP3 文件也可以帮助我们更轻松地了解其他格式,所以我们将从这里开始。

MP3 文件是有损音频文件,这意味着它会丢弃我们耳朵听不到的数据。几乎每个人的听力范围都在 2oHz 到 20kHz 之间。上限实际上随着年龄的增长而降低,但一般来说,这是你听到的每一种噪音的范围内的谎言。因为我们知道其他频率因此是多余的,所以 MP3 会丢弃此范围之外的所有频率。

为了进一步节省一些空间,MP3 文件使用了更多的技巧。音频工程师使用基于人耳和大脑心理声学效应的噪声整形算法来去除我们不应该听到的部分音乐。例如,大脑无法区分相邻的两个频率。此外,成年人的耳朵很难识别高频声音的方向。它在 16kHz 以上也开始失去灵敏度。另外,响亮的声音可以掩盖更安静的声音。所有这些都可以删除,最终听众几乎没有明显的区别。

基本上,MP3 文件会删除我们听不到的频率和我们可以单独听到的频率,但不能因为它们在特定歌曲中的组合方式。

MP3 将轨道分成 576 个样本帧,并使用快速傅里叶变换 (FFT)从这些帧中获取频率数据。然后分析频率数据以查看是否存在任何机会来应用如上所述的基于人类听力的压缩规则。如果是这样,则将这些部分向下舍入(量化)以降低比特率,这有助于节省空间。有关如何将每个帧恢复为其完整声波表示的数据将保存到 32 位标头中。

比特率决定了每帧允许的最大文件大小。压缩越激进,算法就越有可能删除可听得见的东西。此外,这种类型的过滤和切割并不完美,量化可能会留下一些人可以听到的伪影。这种有损心理声学压缩之后是类似于 .zip 文件的无损Huffman 编码压缩,以节省更多空间。

如果这听起来太复杂,那么 MP3 文件会删除我们听不到的频率以及我们理论上可以单独听到的频率,但由于听觉掩蔽而不能在特定歌曲中听到。这可能会导致文件非常小。但是,如果它过于激进或比特率太低,质量可能会受到影响。因此,MP3 对于流媒体来说不再那么流行了。

AAC、M4A 和 OGG Vorbis 音频格式

打开网易新闻 查看更多图片

音频压缩可以采用多种形式,并且已经开发了其他格式。它们使用略有不同的算法和技术来完成任务,因此我们不能仅根据比特率来比较它们。

OGG Vorbis 是 MP3 的开源替代品。它仍然使用 FFT 和类似方法来分析和量化可屏蔽频率信息,但采用了不同的算法。Vorbis 还考虑了本底噪声以提高低比特率性能。Spotify以 320kbps 的速度使用这种格式。

还有 AAC,被Apple Music、Tidal、Pandora 和YouTube Music使用。它是 MPEG (MP3) 格式的演变,允许高达 96kHz 的更高采样率。此外,它可以在需要时在 1024/960 或 128/120 样本之间动态切换帧长度以获得更好的分辨率。与 MP3 相比,它在较小的文件大小下表现更好,以启动。

您可能会遇到的另一种文件类型是 M4A 文件。这些文件使用 AAC 格式编码,然后存储在 MPEG-4 容器中,因此文件扩展名为 .m4a。Apple 创建这种类型是对 MP3 的回应。虽然没有得到普遍支持,但无论如何都不少见。

由于这些原因,例如,您不能直接比较比特率并声称更高的比特率将是 AAC 和 MP3 之间听起来更好的文件。较低比特率的 AAC 和 M4A 文件在占用较少空间的同时听起来仍然不错。

这使得 OGG Vorbis 和 AAC 等格式对流媒体服务具有吸引力。它们可以提供更高质量的声音,同时消耗更少的移动数据。

FLAC

如果您不想丢弃任何频率,但仍想要一个小于原始数据的文件,这就是 FLAC 的用武之地。FLAC 不会丢弃录音的任何部分,因此它被称为无损。Apple 的无损编解码器版本称为 ALAC。这两种编解码器的功能都类似于 .zip 文件。如果您曾经压缩然后解压缩一组文件,您就会理解基本思想。什么都没有被删除,FLAC 文件只是寻找合并重复模式和数据的方法,然后在播放时重新构建它们。

尽管如此,FLAC 文件永远不会像 MP3 或 AAC 文件那么小。但是随着带宽变得更便宜和更容易获得,越来越多的流媒体服务提供了使用 FLAC 流媒体的能力。这些通常是“高清”、“超高清”或“高保真”订阅。Amazon Music Unlimited、Tidal HiFi 和 HiFi Plus、Deezer Premium和 Qobuz 都提供 FLAC 流媒体。

请注意,FLAC 文件比有损格式大,并且会占用大量数据。如果您将它们保存到设备中,它们也会很快开始占用存储空间。

WAV 和 AIFF 音频格式

打开网易新闻 查看更多图片

录音可以只是保存到设备上的纯 PCM,本质上就是 WAV(在 Windows 上)和 AIFF(在 Mac 上)。它们代表了一些最早的数字音乐存储形式。这些文件没有压缩或应用其他任何东西。事实上,您可以通过以下等式很容易地找出它们的文件大小:

PCM 大小 = 采样率 X(每个样本的位数 /8)X 时间(以秒为单位) X 通道数

因此,这些格式可能会导致文件非常大。这意味着它们很少用于流媒体和下载,尽管像HDtracks这样的服务确实提供了它们。这些文件真正有用的是音频混合和编辑。由于没有进行转换、压缩或其他任何操作,因此可以轻松快速地编辑曲目、保存它们,然后根据需要再次编辑它们。