5个优化音频文件大小的技巧

每个人都应该了解音频文件的工作原理。这些知识看似微不足道或无关紧要,但确实可以派上用场-例如在录制音乐时。

在本文中,我们将探讨影响音质和音频的各种因素。音频文件的大小。当然,要在两者之间取得完美的平衡并不容易,但是到最后,您应该了解足够的内容以感到舒适并自己进行试验。

注意:将此知识付诸实践后,您将需要免费的音频编辑器,例如Audacity。学习这些工具超出了本文的范围。

1。采样率

在现实生活中,声音就是波浪。当某人讲话或拍手时,您实际上所听到的是压力的变化,这种变化通过空气传播并最终击中您的耳膜。

但是我们如何捕获声音并将其转换为数字数据?我们不能只记录完整的声波;取而代之的是,我们必须定期对声音进行“快照"。依次播放所有内容时,您会获得原始声音的大致再现。

每个快照称为 sample ,每个快照之间的间隔称为采样率。间隔越短,频率越快。更快的频率可以产生更准确的录音,但是还需要更多的数据来存储每秒录制的声音。

例如,CD品质的音频使用44.1 KHz的采样频率(或每秒44,100个采样),而TV和DVD质量的音频使用48 KHz的采样频率。给定10分钟未压缩的单声道音频录音,前者可能是51.7 MB,而后者可能是56.3 MB。

对于纯语音录音,您可以降低到32 KHz,而不会造成质量损失,但如果涉及音乐或需要最高质量,则请坚持44.1 KHz。降至22.05 KHz听起来更接近AM收音机。

2。比特率

比特率与采样率不同。很多人倾向于将两者混为一谈,但不要混为一谈。首先,如果采样率是拍摄声音快照的频率,则位深度是每个快照期间记录的数据量。

为说明起见,请想象一下声音像水流一样波浪,您正试图用水桶捕获(即记录)水。采样率将是您将存储桶浸入流中的频率,而位深度将是存储桶的大小。

位深度越高,每个采样捕获的数据就越多。这导致更准确的记录,但需要存储该数据的更多空间。但是,如果您将位深度减小太多,则会丢失声音数据。

比特率是每秒处理实际声音数据的数量;在这种情况下,将采样率乘以位深。具有44.1 KHz采样率和16位深度的CD音频文件将具有705.6 kbps的未压缩比特率。

有关最佳比特率的更多信息,请阅读本文的最后一节“文件格式"。

有时,在给定的快照中不需要完整的比特率,例如在无声的情况下。在这种情况下,您可以使用可变比特率(VBR),MP3,OGG,AAC和WMA支持。过去,VBR并未得到广泛支持,但如今已不再是一个大问题。

3。立体声vs.单声道

这点很简单,因此我将简要介绍一下。 单声道表示一个频道,而立体声表示两个频道。立体声音频文件中的两个通道可称为“左"和“右"通道。

使用一对耳机,您将可以听到一个立体声通道中的一个另一只耳朵的另一只立体声通道。收听单声道音频文件时,您将在两只耳朵中听到相同的确切声道。

从某种意义上讲,立体声音频文件本质上是两个单声道音频文件,这意味着立体声音频假设两者之间的采样率,位深度,源声音等相同,则文件的大小总是单声道音频文件的两倍。

因此,立即剪切音频文件大小的一半是将其从立体声转换为单声道。对于纯语音录制,出于这个原因,单声道几乎总是首选。

请注意,立体声使很多音乐听起来更加3D,就像音乐在您周围而不是在您周围播放(即单声道听起来更平坦)。但是很多人无法分辨出差异,因此您可能会满意。只有您可以决定是否值得削减。

4。压缩

如果您正在使用WAV文件,则减小文件大小的唯一方法是修改上述设置之一(采样率,位深或通道数)。压缩是影响音频文件大小的最大因素。

压缩有两种:

  • 有损压缩可从中删除“不必要的"数据音频,例如大多数人的听力范围之外的声音。压缩后,这些丢弃的数据将无法恢复。
  • 无损压缩会获取音频文件,并使用数学算法将其尽可能压缩,但必须在播放时间,这需要更多处理能力。没有实际的数据丢失。
  • 无损压缩所产生的质量与未压缩的音频相同,但是即使在最佳状态下,无损压缩所产生的文件大小也至少是有损压缩的两倍。 为获得最佳文件大小,请进行有损压缩。

    如果您以前从未压缩过音频文件,或者您正在寻找一种出色的工具来完成工作,请考虑使用这些简单有效的方法之一来压缩音频。

    5。文件格式

    一旦决定使用有损压缩,就必须确定哪种文件格式最适合您。在撰写本文时,三个最受欢迎的选项是 MP3 OGG AAC 。通过比较音频文件格式了解更多信息。

    MP3到目前为止最受欢迎,主要是因为它是出现在现场的三种音频中的第一种。从技术上来说,AAC比MP3更好,但是使用率却不一样。 OGG也很好,但是没有很多设备支持它,因此坚持使用MP3或AAC。

    无论使用哪种设备,最终都将压缩到目标比特率。如果我们假设您要使用MP3格式,那么以下是当前使用的五个最常见的比特率:

  • 64 kbps 是AM无线电质量。声音不像音乐那么复杂,因此非常适合只讲播客。
  • 96 kbps 是FM广播质量。音乐听起来不错,但是您可以分辨出它不是浓郁的,主要是因为某些可听频率已被删除。
  • 128 kbps 是CD音频质量。这是标准配置。在这种比特率下,音乐听起来对大多数人来说“足够好"。
  • 256 kbps 是高音频质量。您可能会注意到某些以较低比特率无法检测到的声音和乐器。
  • 320 kbps 是最好的音频质量。您可以走得更高,但即使您认为自己是发烧友,也可能无法分辨出差异。
  • 就减小文件大小而言,压缩为128 kbps的MP3大约会损失90%的原始声音数据,而压缩到320 kbps的MP3只会损失大约60%。

    此外,如果您同时将MP3和AAC压缩为相同的比特率,则AAC经常会发出声音更好,因为它使用了更高级的压缩算法。这意味着使用AAC可以获得比MP3更高的“每兆字节质量"。

    了解这五个因素不仅可以帮助您确定录制和压缩音乐和/或播客的最佳方式创建,但也可以帮助您决定购买哪种音乐格式或使用哪种流媒体服务。

    作为收听者,您首选的音乐文件格式和比特率是多少?作为创作者,您对音乐或播客使用哪些设置?通过下面的评论让我们知道!

    图像信用:通过Wikimedia的采样率,通过Wikimedia的位深度,通过Audacity手册的立体声跟踪

    标签: 文件压缩 MP3 播客 录制音频