了解无损、高分辨率和空间音频

了解无损、高分辨率和空间音频

苹果最近宣布了 Apple Music 流媒体服务的无损音频选项。此外,该公司还将提供无损高分辨率音频以及使用杜比全景声编码的环绕声音频。

苹果现在是无损音乐俱乐部的最新成员,加入了 Tidal、亚马逊、Deezer 和 Quobuz 等提供无损音乐选项的服务行列。就连实际上尚未开始向其订阅用户推出无损音频的 Spotify,也在几个月前宣布了自己的 Spotify HiFi 服务,抢在苹果之前推出了这项服务。

苹果现在正在其平台上部署无损音频,它应该会自动成为提供此功能的最大音乐流媒体服务。数百万人将突然获得无损音频,而无需付出任何额外努力,甚至无需支付任何额外费用。

那么现在的问题是,无损音频到底是什么,为什么有人会关心它?高分辨率音频或杜比全景声到底是什么?现在是时候澄清一些关于这些技术的错误观点,并消除一些与它们相关的误解了。但在此之前……

基础知识

我们听到的声音是模拟的,因为这是我们所处的领域。过去,用于向我们分发这种声音的媒体也是模拟的。录音带和黑胶唱片就是模拟媒体的两个例子,录音带直到最近才开始使用,而黑胶唱片仍在发烧友中流行。

然而,在媒体上以模拟方式录制音频会严重限制录制信息的质量。此外,它开始与日益数字化的世界格格不入。这就是数字音频的用武之地。

4 位 PCM 编码

模拟音频信号可以表示为简单的连续正弦波。为了将此模拟信号表示为离散数字域,使用了一种称为脉冲编码调制或 PCM 的技术。如今,我们消费的绝大多数数字音频都使用这种方法。

脉冲编码调制,或较新的线性脉冲编码调制 (LPCM),通过在上述模拟正弦波上采集时间和幅度上的离散样本来工作。这种模拟到数字转换的质量取决于采样频率(采样率)以及可用于表示每个样本的可能数字值的数量(位深度)。从理论上讲,这些值越高,数字信号就越接近原始模拟音频。

由于样本是在连续信号的离散点上采集的,因此需要进行量化过程来填补空白,量化过程使用四舍五入和截断等技术。然而,此过程会增加噪声,转换后的信号中的噪声量与其位深度成反比。因此,增加数字信号的位深度可以降低本底噪声,从而增加动态范围。

当然,我们今天听到的大多数数字音频并不充满背景噪音。这是因为一种名为抖动的巧妙技术。抖动用我们选择的噪声模式替换了量化过程产生的自然噪声模式。这使我们能够获得想要的噪声,并且将其放置在频谱中我们想要的位置。通过抖动,我们可以用更微妙、更一致的噪声替换量化噪声,这种噪声不太明显,还可以将其转移到我们耳朵不太敏感的频率响应部分。

量化噪声

说到频率响应,我们的耳朵对 20Hz 至 20,000Hz 范围内的音频波很敏感。这是一个相当宽泛的数字,这意味着大多数人的听觉范围都低于这个数字,尤其是在频谱的较高区域。此外,随着年龄的增长,这个范围自然会缩小,你听到的较高频率范围的声音也会减少。但在我们的讨论中,我们只讨论一般的 20-20,000Hz 范围。

为了确保录音中的音频覆盖至少 20,000Hz 的频率,采样率必须至少是该频率的两倍,这是由所谓的奈奎斯特-香农采样定理决定的。这样做是为了避免在将数字信号转换回模拟信号进行播放时出现混叠。这意味着要达到高达 20,000Hz 或 20kHz 的频率,您需要至少 40kHz 的采样率。

当今数字音频的标准是音频 CD,它使用 16 位信息,采样率为 44.1kHz,为未压缩的 LPCM 音频。尽管已有 40 多年历史,但它仍被视为数字音频的黄金标准,我们用它来比较其他标准,例如有损压缩音频和高分辨率音乐。

然而,尽管 CD 音频至今仍质量上乘,但由于文件大小较大,因此在流媒体或下载方面并不特别方便。这个问题在互联网和在线音乐的早期尤为严重,因为当时的互联网速度要慢得多。这导致了压缩音频的发明,最终占领了音频世界。

压缩是计算机中一种常用的减小文件大小的技术。创建 ZIP 文件时,实际上是在压缩它以减少磁盘占用空间。但是,ZIP 是无损压缩的一个例子,它可以减小文件大小,但不会减小太多。要看到真正的好处,您需要进行有损压缩。

现在,如果您的归档应用程序在创建 ZIP 文件时开始丢弃随机数据,您可能不会对此感到高兴。但是,音频的工作方式不同。即使是标准 CD 音频也包含大量人耳通常无法感知的信息,具体取决于人的听力和他们可能使用的设备。这使得通过仅丢弃那些不太重要的位来压缩它变得容易。

早期的压缩技术并不那么好。我们都记得,即使在不太完美的设备上收听,旧的 MP3 文件也具有非常明显的压缩伪影。您甚至不需要知道压缩伪影是什么,因为它非常明显,所以您可以听到它。

随着时间的推移,情况有所改善。我们有了更好、更高效的编解码器,可以在更小的空间中存储更多数据。更重要的是,我们有了更好的编码器,因此可以更有效地打包数据。如今,有损压缩音频无处不在。每个音乐流媒体服务都有它,每个视频流媒体服务都有它,甚至有声读物和播客等其他格式也使用它。你录制的每个智能手机视频都有压缩音频。它足够好,以至于大多数人甚至没有意识到他们的音乐是压缩的,即使他们过去碰巧听过原版。它就是有效。

这就引出了我们的下一个话题……

什么是无损音频?为什么我应该关心它?

我要先明确这一点:无损并不意味着未压缩。人们经常交替使用这些术语,但它们绝对不是同一个意思。

如前所述,您可以通过丢弃部分数据的方式压缩文件,从而显著减小文件大小,或者您也可以通过保留所有数据的方式压缩文件,从而相对减小文件大小。后者是无损压缩。

无损音频是使用保留原始文件所有数据的技术进行压缩的音频。与原始未压缩文件相比,无损音频更易于通过互联网传输或下载,尽管与有损压缩相比,无损音频仍然很大。

Tidal 是最早提供无损流媒体的服务之一

这样做的好处显而易见。虽然有损压缩技术多年来一直在不断改进,但即使使用现代设备,大多数人也无法区分无损音频和无损音频,但它仍然不是原始文件。这意味着对于那些听力非常好、设备精良、能够辨别有损音频和无损音频之间差异的人,或者只是想要原始文件保持不变以用于存档的人来说,现在您可以选择收听无损版本。

发明有损编解码器的主要原因是为了使它们更容易在互联网上传播。但随着全球大多数地方的带宽不断增加、计算设备速度越来越快以及存储空间越来越大,现在比以往任何时候都更容易在不丢失任何数据的情况下使用原始音频。流媒体也使存储问题变得无关紧要,因为音乐不再需要本地存储,可以按需流式传输。

即使你不一定有很好的听力,不知道要寻找什么样的优质音频,或者没有好的设备来帮助你进行搜索,但恰好有非常快的互联网,没有数据上限,你为什么要听压缩音频?如果你可以像使用有损音频一样使用无损音频,你为什么要选择有损音频?

亚马逊最近推出了 Music HD,进军无损音频领域

这几乎就是无损音频背后的原理。从实际角度来说,它不一定是更好的音频,而只是原始音频,因为它多年前就已经出现在音频 CD 上了。是的,在某种程度上,我们又回到了音频 CD,看到无损音频被如此炒作,这很奇怪,因为从技术上讲,它通常只是 CD 音频,只是没有 CD。有时事情的发展很有趣。

不过,无损音频不一定是 CD 音频。当其规格与 CD 音频相似时,您会看到公司称其为“CD 品质”音频。当然,它通常仅表示 16 位、44.1kHz 的音频,但当与无损一起使用时,它只是您在实际音频 CD 上找到的音频。

但 CD 的音质对某些人来说已经不够好了。这就是数字音频的终极目标。

高分辨率音频

与上一节一样,我将首先澄清一下。高分辨率并不意味着无损,无损也不意味着高分辨率。高分辨率可以是有损或无损格式。无损音频可以是低分辨率或高分辨率。两者是不同的。

Apple 将以与 CD 质量无损文件相同的无损 ALAC 编解码器提供其高分辨率音轨。亚马逊没有指定其编解码器,但也为其高分辨率和 CD 质量文件提供无损音频。另一方面,Tidal 以无损 FLAC 提供其 CD 质量音轨,但以 FLAC 容器内的有损 MQA 编解码器提供高分辨率音轨。

那么什么是高分辨率音频呢?为此,我们必须回到我们的老朋友——位深度和采样率。高分辨率只是拥有更多这些;更多位,也有更多的样本。

Amazon Music HD 规格

高分辨率通常至少具有 24 位动态范围和 88.2kHz 采样率,但在某些情况下可以高达 192kHz 甚至 384kHz。

高分辨率音频有时也被称为高清音频。此外还有 Hi-Res Audio,这是索尼的一个品牌,其他人可以授权该品牌来表明他们的设备支持高分辨率音频,但这不是必需的,你可以拥有没有这个品牌的高分辨率音频硬件。

高分辨率音频已经存在了一段时间,始于超级音频 CD 时代。问题是,大多数人(包括发烧友和工程师)似乎无法就高分辨率是有用还是只是骗人的把戏达成一致。音频 CD 使用的 16 位、44.1kHz 标准红皮书规范不仅不能涵盖整个普通人类听力,而且它以一种实际上很难改进的方式做到了这一点。

让我们看看高分辨率音频带来的第一个优势,即更高的位深度。当您降低模拟到数字转换的位深度时,在必须转换回模拟时,量化过程中会增加更多噪音。通过增加位深度,您可以自然地减少噪音,从而增加动态范围。

但是,即使使用无抖动的 16 位,您也可以获得 96dB 的动态范围,这非常接近人类听觉的最大极限(120dB),而 24 位提供的额外余量(144dB)远远超出了这一范围,甚至超过了大多数设备的限制。换句话说,您听不到它。

其次,抖动等巧妙的技术可以帮助减少和调整噪音,即使是 16 位信号,也只能由精密设备听到。通过减少和调整可听范围内的噪音,抖动 16 位信号的动态范围可以轻松超过 120dB。这意味着,从实际角度来看,16 位对人耳来说已经足够了。

高分辨率的另一个优势是更高的采样率。192kHz 采样率意味着音频的频率响应上限可以高达 96kHz。正如我已经提到的,人类只能听到高达 20kHz 的声音,而且只有那些听力完美的黄金年龄的人才能听到。大多数人的频率响应甚至比这还要低。

如果音频的频率超出了人类可听范围,就好比电视机显示可见范围之外的光线。你听到 96kHz 的声音几乎和看到 X 射线一样多。也就是说,完全看不到。

必须重现如此高频率的音频也会给设备和驱动器带来压力,从而导致额外的失真。这种失真肯定是在可听范围内,这意味着您会将可以听到的声音扭曲成听不见的声音。

有人认为,超出人类听力范围的频率会影响我们能听到的频率,因此这些额外的频率可以改善可听见的声音。然而,对此并没有真正的共识。

Tidal 使用 MQA,这是一种有损编解码器,具有独特的折叠算法,可以打包更多数据

事实上,更高的位深和更高的采样率都有优势,但这主要体现在制作音乐方面。与处理 RAW 图像一样,处理具有更高位深的音轨可以更轻松地处理和调整电平。主要优势是噪声基底更低,当分层多个音轨时,噪声基底会累积起来,因此如果所有音轨都是 24 位或更高,则平均噪声基底仍然可以很低。采样率和它提供的更高频率响应也是如此。但是,一旦您完成音轨的创作,您就可以将其导出为 16 位、44.1kHz,并且仍然可以获得完美的输出。

很难明确地说高分辨率是否对人类听音乐有切实的好处。大多数声称能听出差异的人可能只是在听不同版本的曲目;许多以高分辨率音频发布的音乐都经过了重新制作,这会使某些东西听起来截然不同。这里造成差异的原因是母带制作,这在当时往往不尽如人意,这就是为什么现在许多音乐在重新制作后重新发布的原因。即使在标准 CD 音频中,这听起来也会更好,因此,如果您要进行任何比较,请确保在两种格式中使用相同的母带。

高分辨率音频在早期也名声不佳,因为那些加入这一潮流的公司(无论是音乐发行服务还是硬件销售商)都会为高分辨率支持收取高额费用。以前,大多数数模转换器 (DAC) 仅支持最高 16 位、48kHz。即使在今天,这也是世界上大多数智能手机和电脑上都能找到的。这就是为什么 Apple 还建议在 Apple Music 上播放高分辨率文件时使用外部 DAC。

话虽如此,过去几年情况已有了很大改善。如今,你甚至可以买到能够解码 24 位、192kHz 信号的廉价智能手机。现在用于桌面的高质量 DAC 比以往任何时候都便宜,你可以花大约 109 美元买到像 Schiit Fulla(是的,它就是这么叫的)这样的产品,它还配有一个很棒的内置放大器。现在唯一的限制是能否找到足够的高分辨率音频内容,因为它仍然相当有限。

空间音频

苹果宣布 Apple Music 上将推出无损音频,同时还增加了 Spatial Audio。具体来说,苹果声称现在 Apple Music 上支持杜比全景声 (Dolby Atmos) 的空间音频。那么这意味着什么呢?

首先,我们来讨论一下杜比全景声。众所周知,杜比拥有多种环绕声编解码器,是影院音频领域最知名的品牌之一。然而,传统的环绕声格式有独立的声道支持,比如 5.1 或 7.1。这意味着在制作这些格式的音频时,必须根据导演希望声音出现的位置将音频放置在声道内。

杜比全景声 (Dolby Atmos) 引入了基于对象的声音,而不是基于声道的声音。这意味着在制作母带时,音频工程师只需将声音置于听众周围的 3D 空间中,然后系统就会确定使用哪些扬声器来重现该声音。这也意味着 Atmos 理论上拥有无限数量的声道,因为人们总是可以添加更多扬声器来增加声音的沉浸感,而这是固定声道格式无法做到的。

Atmos 则更进一步,为声音添加了高度元素,这意味着现在您可以在头顶放置扬声器,并且可以对声音进行编码,使其从头顶发出。这使得声音更具沉浸感,因为它现在可以从各个方向发出,就像现实生活中一样。

音乐中的杜比全景声 (Dolby Atmos) 工作原理类似。它允许作曲家编排音乐,这样当在带有高度声道的环绕立体声扬声器上聆听音乐时,音乐听起来就像是从你周围传来的,从而将你包裹在声音空间中,让你感觉自己身临其境。你可以想象它如何用于现场录制表演之类的事情。

然后,Apple 使用杜比全景声音轨并通过其名为 Spatial Audio 的技术进行传输。与 Apple 设备配对后,AirPods Pro 和 AirPods Max 即可为视频内容提供 Spatial Audio。在 iPhone 或 iPad 上播放杜比全景声内容时,AirPods Pro/Max 将使用音轨中的数据来模拟您周围的 3D 声音。此外,它还将使用这些 AirPods 型号上的加速度计和陀螺仪,并跟踪您的头部运动,以便音频随您的头部移动,就像在现实世界中一样。

对于 Apple Music,Spatial Audio 的作用是让声音出现在你周围,但没有头部跟踪功能。由于它不进行头部跟踪,因此现在也可以在基本 AirPods 型号上使用。事实上,它适用于所有配备 W1/H1 芯片的 AirPods 和 Beats 型号,以及所有配备立体声扬声器的 iPhone、iPad 和 Mac 型号的内置扬声器。

现在的问题是,这听起来好不好。我还没有体验过 Apple Music 中的 Apple Spatial Audio,但作为 Tidal 的长期订阅者,环绕声音乐有点糟糕。

这不是格式本身的问题,而是录音的问题。您偶尔会遇到专门设计用于展示环绕声音频的曲目,听起来可能很酷。但是,您想听的音乐,即录音室发布的流行曲目的环绕声母带,听起来并不好。录音室专辑尤其如此,这些专辑最初设计为在普通立体声扬声器上播放,在收听环绕声母带时听起来很奇怪和混乱。就我个人而言,我更愿意听标准立体声版本。

我知道这对于音乐会的现场录音可能很有效,但我没有遇到过很多这样的情况。最后,我仍然对这项技术持乐观态度,但如果你没有硬件来收听它,那么不用担心,你不会错过太多。

那么蓝牙音频怎么样?

到目前为止,我主要谈论的是有线领域的音频,但现在很多人都使用蓝牙设备听音乐,无论是像 AirPods 这样的蓝牙耳机,还是像索尼 WH-1000XM4 这样的蓝牙耳机、蓝牙扬声器,还是通过蓝牙的车载音响。

然而,蓝牙增加了一层额外的复杂性和一层额外的妥协。通过蓝牙发送的所有音频(我的意思是所有音频)都是压缩的。目前可用的每一个蓝牙编解码器,无论是从基线 SBC 到 AAC、aptX、aptX HD、LDAC、LHDC 还是三星可扩展编解码器,都是有损编解码器。另外,为了消除另一个流行的误解,如果您的音乐是 AAC 格式,并且您的蓝牙耳机和设备使用 AAC 进行传输,音乐仍将被压缩和重新编码,而不仅仅是按原样发送。

AirPods Pro 使用有损 AAC 编解码器进行音频传输

这就是目前蓝牙音频的工作原理。它根本没有足够的带宽来使用现有的编解码器进行无损传输,更不用说未压缩的传输了。有可能出现一种非常高效的编解码器,它可以将所有原始数据打包而不丢弃任何内容,并且仍然能够通过蓝牙的微小带宽发送它,但这还没有发生。

根据用于蓝牙传输的编解码器,您可以获得相当不错的效果,特别是当蓝牙编解码器的比特率远远超过音频文件的比特率时。但是,如果您正在收听无损音频,那么您将只能保留蓝牙编解码器能够保留的信息量。不过,在无损音频的情况下,由于蓝牙编解码器正在处理整个文件,因此结果可能比以有损方式重新压缩同一文件两次要好一些。您是否能注意到差异则完全是另一回事。

结论

本页上有很多文字,如果你有好奇心,它们可能会派上用场。但归根结底,音乐不仅仅是组成它的比特和波的总和。听音乐或任何音频的目的是为了享受它。

对于某些人,比如我自己,拆解音乐的技术层面并研究其细节是聆听体验的一部分。我不记得上次听音乐时没有潜意识地记录录音质量、编曲以及我使用的扬声器或耳机如何重现所有内容。我会确保所有设备都正常工作,所有位深度和采样率都正确并与源音频匹配,并且音频从源头到输出路径干净,没有任何可能影响最终交付的元素。

如果您和我一样——或者像许多人一样,您是更狂热的发烧友——那么无损音频和高分辨率音频就适合您。有时,我们不在乎是否能分辨出差异,而是一切都正确并且按照我们喜欢的方式工作。人们仍然在购买有线耳机并对其充满热情,使用外部 DAC 和放大器,尽管我们不断被告知如今内置在计算机中的那些“足够好”,并且禁用所有 EQ 和 DSP 效果。

如果你不是这样的,首先恭喜你,因为你很正常。其次,你可以忽略这里的一切,继续像往常一样聆听和享受音乐。如果你想更上一层楼,无损和高分辨率之类的东西永远都在。如果没有,那也很好。重要的是你是否玩得开心。

<<:  OnePlus Nord CE 设计宣传材料在发布前泄露

>>:  Gionee StylFit GSW7 在印度亮相:一款具有 SpO2 跟踪功能、IP67 等级的经济型手表

推荐阅读

iQOO Z3 将于 3 月 25 日发布,现已出现在 Geekbench 上

几天前,一款型号为 V2073A 的未知 vivo 智能手机(据信是 iQOO Z3)在 Googl...

中兴 Blade X Max 宣布推出 6 英寸显示屏和 Android 7.1.1 操作系统

上个月泄露的 ZTE Blade X Max 现已由这家中国公司正式发布。该设备采用 Snapdra...

点击这里观看小米 A2 和 A2 Lite 发布会直播

小米将在马德里举办一场活动,我们非常兴奋。西班牙首都并不是我们通常看到手机首次亮相的地方,但这些手机...

Oppo Find X2 Pro 推出绿色纯素皮革选项

Oppo Find X2 Pro 即将推出绿色版本——我们指的是该公司已开始接受绿色素食皮革选项的预...

Nvidia 宣布推出基于 Volta 的 3000 美元显卡 Titan V

NVIDIA 宣布推出 Titan V,这是一款基于该公司全新 Volta 架构的专业级显卡,采用...

每周民意调查:930 欧元是 Galaxy S8 的合理价格吗?

三星 Galaxy S8 一直被认为价格昂贵,但最新传闻将预期价格推得更高 - S8 为 830 欧...

还有一个-华硕 Zenfone 4 Selfie Lite 正式发布

就在我们以为终于开始了解华硕的 Zenfone 4 系列时,该公司又推出了另一款 Selfie,即 ...

Realme X50t 5G 出现在认证列表中

Realme 的 X50 系列已有 4 款设备,最新一款是周一发布的 X50 Pro Player。...

vivo X50 Pro 实况照片曝光,原版 X50 规格也曝光

vivo X50 手机一次又一次地发布预告片或泄露消息,距离正式发布仅一步之遥。vivo X50 P...

OnePlus 发布了 6T 的内核源代码

在新款 OnePlus 6T 发布后不久,该公司在 GitHub 上发布了内核源代码,以便开发人员可...

vivo 暂停 Jovi OS 项目,将继续使用 Funtouch OS

我们曾报道过,vivo 计划将其 FuntouchOS 界面更名为 Jovi OS,我们甚至看到了一...

LG Rollable 命运未定,即使 LG 保留其移动部门,也可能会被取消

LG 在 2021 年 CES 上通过简短演示了可卷曲手机,令虚拟观众惊叹不已,几天后又传出计划于 ...