MP3, AAC, WAV, FLAC: объяснение всех форматов аудиофайлов

источник>

Организуя свою коллекцию цифровой музыки, вы можете быть поражены количеством различных форматов аудиофайлов в вашей библиотеке. Почти все слышали о MP3, но как насчет OGG, AIFF или MQA?

Если список оставляет вам вопрос, все ли эти песни изучались в разных университетах, чтобы получить такие официальные буквы после их имен, не волнуйтесь. Мы здесь, чтобы раскрыть значение наиболее распространенных форматов музыкальных файлов, различия между ними и причины, по которым вам следует это волновать.

Независимо от того, слушаете ли вы файлы MP3 низкого качества, возможно, лучше треки AAC или аудио высокого разрешения в форматах FLAC или WAV, пора точно понять, что вы получаете — и что — лучший формат файла для вас.

Прочтите, чтобы узнать о плюсах и минусах каждого формата аудиофайлов …

Форматы файлов и кодеки at-a -glance

Хотите сразу перейти к делу? Вот удобное руководство по всем форматам файлов и различиям между ними. Если вы хотите узнать больше, прочтите ниже, чтобы подробнее узнать о различиях в размере, качестве звука и совместимости.

AAC (без высокого разрешения): альтернатива MP3 от Apple. Сдавлено и сжато, но звучит лучше. Используется для загрузок iTunes и потоковой передачи Apple Music.

AIFF (высокое разрешение): альтернатива Apple WAV с улучшенной поддержкой метаданных. Он работает без потерь и без сжатия (такие большие размеры файлов), но не очень популярен.

DSD (высокое разрешение): однобитовый формат, используемый для Super Audio CD. Он доступен в вариантах с частотой 2,8, 5,6 и 11,2 МГц, но из-за высокого качества кодека он (в настоящее время) непрактичен для потоковой передачи. Без сжатия.

FLAC (высокое разрешение): этот формат сжатия без потерь поддерживает частоту дискретизации высокого разрешения, занимает примерно половину места WAV и сохраняет метаданные. . Это бесплатный формат и считается предпочтительным форматом для загрузки и хранения альбомов в высоком разрешении. Обратной стороной является то, что он не поддерживается Apple (поэтому несовместим с iTunes).

MP3 (без высокого разрешения): популярный формат со сжатием с потерями обеспечивает небольшой размер файла, но далеко не лучшее качество звука. Удобно для хранения музыки на смартфонах и iPod.

(высокое разрешение): формат сжатия без потерь, который упаковывает привет -res файлы для более эффективной потоковой передачи. Используется для Tidal Masters потоковой передачи в высоком разрешении.

OGG (не в высоком разрешении): иногда называется по его полному имени , Ogg Vorbis. Альтернатива MP3 и AAC с потерями и открытым исходным кодом, не ограниченная патентами. Формат файла, используемый (320 кбит/с) в потоковой передаче Spotify.

WAV (высокое разрешение): стандартный формат, в котором закодированы все компакт-диски. Отличное качество звука, но без сжатия, что означает огромный размер файлов (особенно для файлов с высоким разрешением). У него плохая поддержка метаданных (то есть информации об обложке альбома, исполнителе и названии песни).

WMA Lossless (hi-res): воплощение Windows без потерь Media Audio, но больше не поддерживается смартфонами или планшетами.

Лучшие сервисы потоковой передачи музыки: бесплатные потоки в аудио высокого разрешения
MQA audio: все, что вам нужно знать
Что такое DSD audio?

Сжатые и несжатые аудиофайлы

Во-первых, давайте поговорим о трех категориях, в которые можно сгруппировать все аудиофайлы. Все сводится к тому, насколько сжаты данные (если они вообще есть), и, как следствие, насколько качественны или «потеряны» вы, как слушатель.

Если для сжатия звука в вашем файле не использовался алгоритм сжатия (или кодек), происходят две вещи: нулевая потеря качества звука и, достаточно скоро, предупреждение «загрузочный диск заполнен». на вашем ноутбуке.

По сути, несжатая дорожка — это воспроизведение исходного аудиофайла, где реальные сигналы преобразуются в цифровой звук.

WAV против AIFF против FLAC: несжатые форматы файлов

WAV и AIFF, возможно, самые популярные несжатые форматы аудиофайлов, оба основаны на PCM (импульсной кодовой модуляции), который широко известен как самый простой механизм хранения аудио в цифровой области. В файлах WAV и AIFF используется аналогичная технология, но данные хранятся немного по-разному. Они могут хранить аудиофайлы CD-качества или высокого разрешения.

WAV был разработан Microsoft и IBM, поэтому он используется на платформах Windows и является стандартным форматом, в котором закодированы все компакт-диски.

AIFF был разработан Apple как альтернатива WAV, и хотя он не так широко популярен, файлы AIFF имеют лучшую поддержку метаданных, что означает, что вы можете включать обложки альбомов, названия песен и т. д.

Недостаток? Эти малышки большие. Файл с качеством компакт-диска (16 бит, 44,1 кГц) будет занимать около 10 МБ на жестком диске в минуту.

ALAC против FLAC против WMA Lossless: аудиоформаты без потерь

Все любят FLAC. Файл без потерь, FLAC (Free Lossless Audio Codec) сжимается почти до половины размера несжатого WAV или AIFF эквивалентной частоты дискретизации, но не должно быть «потерь» с точки зрения звучания. Файлы FLAC также могут обеспечивать разрешение до 32 бит, 96 кГц, что лучше, чем качество CD.

Другие форматы аудиофайлов без потерь включают ALAC (Apple Lossless) и WMA Lossless (Windows Media Audio). ). Первый вариант является хорошей альтернативой FLAC, совместимой с iOS и iTunes, хотя файлы немного менее компактны, чем FLAC. Однако проверьте совместимость смартфонов и планшетов.

AAC против MP3: аудиоформаты с потерями

Кто слышал о MP3? Конечно, есть. MP3 — это наиболее распространенный аудиоформат, который удобен для хранения музыки на iPod или планшетах и работает практически на всех устройствах воспроизведения. Но чтобы сделать это, вы должны в процессе потерять массу информации. Чтобы сделать аудиофайлы в десять раз меньше, чем файлы качества компакт-диска, некоторые исходные данные должны быть отброшены, что приведет к потере качества звука.

Скорость передачи данных в формате MP3 также влияет на качество звука. MP3-файлы, закодированные со скоростью 128 кбит/с, несут больше потерь звука, чем MP3-файлы, закодированные со скоростью 320 кбит/с (килобит в секунду, где каждый «бит», по сути, является «частью» песни). Теперь, когда хранилище стало намного дешевле, мы бы любой ценой избежали 128 кбит/с, хотя MP3 со скоростью 320 кбит/с по-прежнему имеют свое предназначение, если ваше хранилище ограничено — и они остаются стандартом для магазинов загрузки.

Еще одна потеря с потерями. формат — AAC (Advanced Audio Coding), который сжимается так же, как MP3, но он немного более эффективен и звучит лучше. AAC используется для загрузок iTunes, потоковой передачи Apple Music (со скоростью 256 кбит/с) и потоковой передачи YouTube.

Формат Vorbis, часто называемый Ogg Vorbis из-за своего контейнера Ogg, является альтернативой MP3 и AAC с открытым исходным кодом с потерями, не ограниченной патентами. Ogg Vorbis — это формат файла, используемый (со скоростью 320 кбит/с) в потоковой передаче Spotify.

Если вы придерживаетесь режима с потерями, стоит помнить следующее: хотя больше «битов» обычно означает лучший звук, это зависит от эффективности кодека в вашем файле. Хотя вы можете заметить, что большая часть музыки в вашей коллекции закодирована со скоростью 128 кбит/с, поэтому MP3, вероятно, будет звучать немного хуже (посмотрите, что мы там сделали?), Чем файл AAC или Ogg Vorbis, из-за к неэффективности кодека в MP3.

А как насчет аудио высокого разрешения?

В отличие от видео высокой четкости, нет единого универсальный стандарт, когда дело доходит до звука высокого разрешения.

Однако, говоря простыми словами, звук высокого разрешения имеет тенденцию относиться к музыкальным файлам, которые имеют более высокую частоту дискретизации и/или битовую глубину, чем компакт-диски. — который указан как 16 бит/44,1 кГц. Таким образом, файлы с высоким разрешением могут иметь формат 16 бит/96 кГц или 24 бит/192 кГц, например.

Так зачем вам это нужно? Проще говоря, аудиофайлы высокого разрешения со всей этой дополнительной аудиоинформацией должны звучать намного лучше, чем сжатые аудиоформаты, которые теряют информацию в процессе сжатия. Они будут занимать больше места для хранения, но мы определенно думаем, что это того стоит.

Несжатые файлы, такие как AIFF и WAV, имеют высокое разрешение, как и файлы в форматах FLAC и ALAC без потерь.. DSD (несколько нишевый формат, используемый для Super Audio CD) также имеет высокое разрешение, но не так широко поддерживается. Когда дело доходит до потоковой передачи, MQA — это формат упаковки файлов, используемый такими компаниями, как Tidal Masters, который помогает передавать аудио высокого разрешения в потоковые службы, используя как можно меньшую полосу пропускания.

Что касается воспроизведения. аудио высокого разрешения, теперь его поддерживает все большее количество продуктов. Беспроводные динамики HEOS от Denon поддерживают воспроизведение 24-битных файлов, как и портативные музыкальные плееры премиум-класса, такие как отмеченные наградами Cowon Plenue D2 и Astell & Kern A & norma SR15.

Аудио высокого разрешения также можно воспроизводить на большинстве флагманских смартфонов Android, таких как пятизвездочный Samsung Galaxy S10 +, но вы не можете воспроизводить звук высокого разрешения на свежем в коробке iPhone. Мы нашли способы обойти это , но стоит помнить, что аудио высокого разрешения еще не так портативно, как его собратья с потерями. Дополнительную информацию о том, какие продукты Hi-Fi поддерживают аудио высокого разрешения, можно найти здесь.

Аудио высокого разрешения: наука за цифрами

Какой формат аудиофайла вам больше всего подходит?

Выбранный вами формат файла будет зависеть от того, что вас волнует — хранилище или качество звука. , а также какие устройства вы собираетесь использовать для воспроизведения.

MP3 стали чрезвычайно популярными, когда хранилище было в цене. Теперь, когда у телефонов, музыкальных плееров и ноутбуков гораздо больше места для хранения данных, мы думаем, что вам действительно стоит стремиться использовать файлы с качеством лучше, чем компакт-диск.

Если вы архивируете свои аудиофайлы, Тем не менее, FLAC или другой файл без потерь может быть хорошим подспорьем для копирования вашей музыки. Файлы без потерь обеспечивают хороший баланс между сжатием и качеством звука, позволяя вам слушать цифровую музыку наилучшего качества, не занимая все место на диске. Просто убедитесь, что все ваши устройства совместимы с выбранным форматом файлов.

Звук высокого разрешения: все, что вам нужно знать
Музыка высокого разрешения: лучшие магазины загрузки
Лучшие портативные музыкальные плееры 2020 года: от бюджетных до высоких res music

Руководство по веб-аудиокодекам

Даже скромное качество, высокое -fidelity стерео звук может использовать значительный объем дискового пространства. Для веб-разработчиков еще большее беспокойство вызывает пропускная способность сети, необходимая для передачи звука, будь то потоковая передача или загрузка для использования во время игры. Обработка аудиоданных для их кодирования и декодирования осуществляется с помощью аудиокодека ( CO der/ DEC или) . В этой статье мы рассмотрим аудиокодеки, используемые в Интернете для сжатия и распаковки звука, их возможности и варианты использования, а также дадим рекомендации по выбору аудиокодеков для использования в вашем контенте..

Кроме того, реализации WebRTC обычно используют подмножество этих кодеков для кодирования и декодирования мультимедиа, а также могут поддерживать дополнительные кодеки для оптимальной межплатформенной поддержки видео- и аудиоконференций, а также для лучше интегрироваться с устаревшими телекоммуникационными решениями. Подробнее см. Кодеки, используемые WebRTC.

Для получения информации о фундаментальных концепциях, лежащих в основе работы цифрового звука, см. Статью Концепции цифрового звука.

Общие кодеки

В приведенном ниже списке указаны кодеки, наиболее часто используемые в Интернете, и какие контейнеры (типы файлов) их поддерживают. Если все, что вам нужно знать, это то, какие кодеки вообще можно использовать, это для вас. Конечно, отдельные браузеры могут поддерживать или не поддерживать все эти кодеки, и их поддержка того, какие типы контейнеров могут их использовать, также может различаться. Кроме того, браузеры могут выбрать поддержку дополнительных кодеков, не включенных в этот список.

Название кодека (короткое)	Полное имя кодека	Поддержка контейнера
AAC	Расширенное кодирование звука	MP4, ADTS, 3GP
ALAC	Аудиокодек Apple Lossless	MP4, QuickTime (MOV)
AMR	Адаптивный мульти- Скорость	3GP
FLAC	Бесплатный аудиокодек без потерь	MP4, Ogg, FLAC
G.711	Импульсно-кодовая модуляция (PCM) голосовых частот	RTP/WebRTC
G.722	Кодирование звука 7 кГц в пределах 64 кбит/с (для телефонии/VoIP )	RTP/WebRTC
MP3	MPEG-1 Audio Layer III	MP4, ADTS, MPEG ¹ , 3GP
Opus	Опус	WebM, MP4, Ogg
Vorbis	Vorbis	WebM, Ogg

[1] Когда данные кодека MPEG-1 Audio Layer III хранятся в файле MPEG, и в файле нет видеодорожки, файл обычно называется файлом MP3, даже если он все еще является файлом формата MPEG.

Факторы, влияющие на кодированный звук

Есть две общие категории факторов, которые влияют на кодированный звук, который выводится аудиокодеком. кодировщик: подробные сведения о формате и содержимом исходного звука, а также о кодеке и его конфигурации во время процесса кодирования.

Для каждого фактора, влияющего на кодированный звук, существует простое правило, которое почти всегда верно : поскольку точность цифрового звука определяется степенью детализации и точностью выборок, взятых для преобразования его в поток данных, чем больше данных используется для представления цифровой версии аудио, тем точнее выборка звука будет соответствовать исходному материалу.

Влияние формата исходного звука на закодированный аудиовыход

Поскольку кодированный звук по своей сути использует меньше битов для представления каждого образца, исходный аудиоформат может иметь меньшее влияние на размер закодированного аудио, чем можно было бы ожидать. Однако ряд факторов все еще влияет на качество и размер закодированного звука. В таблице ниже перечислены несколько ключевых факторов формата исходного аудиофайла и их влияние на закодированный звук.

Влияние формата и содержимого исходного аудио на качество и размер закодированного звука
Функция	Влияние на качество	Влияние на размер
Количество каналов	Количество каналов влияет только на восприятие направленности, но не на качество.	Каждый канал может существенно увеличить размер закодированного звука, в зависимости от содержимого и настроек кодировщика.
Шум/шипение	Нежелательный фоновый шум или шипение имеют тенденцию к снижению качества звука как напрямую (за счет маскировки деталей звука переднего плана), так и косвенно (за счет усложнения формы звуковой волны и, следовательно, ее трудно уменьшить в размере при сохранении точности).	Шипение, статический или фоновый шум увеличивает сложность звука, что обычно снижает установка сжатия, которое возможно.
Частота дискретизации	Чем больше выборок доступно в секунду, тем выше результирующая точность кодирования звука скорее всего будет.	Увеличение частоты дискретизации увеличивает размер закодированного аудиофайла.
Размер выборки	Чем больше сэмплы, тем больше деталей может содержать каждый сэмпл, что приводит к более точному представлению каждого сэмпла.	Зависит от кодека; кодеки обычно имеют внутренний формат выборки, который может совпадать или отличаться от исходного размера выборки. Но более подробная информация об источнике может увеличить размер закодированного файла; он никогда не сделает его меньше.

Конечно, эти эффекты могут быть изменены решениями, принятыми при кодировании звука. Например, если кодировщик настроен на снижение частоты дискретизации, влияние частоты дискретизации на выходной файл будет уменьшено.

Для получения дополнительной информации об этих и других функциях аудиоданных см. Формат и структура аудиоданных в понятиях цифрового аудио.

Влияние конфигурации кодека на кодированный аудиовыход

Аудиокодеки обычно используют умно разработанные и очень сложные математические алгоритмы для получения исходных аудиоданных и их сжатия, чтобы занять существенно меньше места в памяти или пропускной способности сети. Помимо выбора типа используемого кодировщика, у вас может быть возможность настроить кодировщик, используя параметры, которые выбирают определенные алгоритмы, настраивают эти алгоритмы и указывают, сколько проходов применять при кодировании..

Влияние конфигурации аудиокодера на качество и размер
Feature	Влияние на качество	Влияние на размер
Сжатие без потерь	Без потери точности	Маловероятно получить более 40-50% сжатия
Сжатие с потерями	Всегда некоторая потеря верности; чем выше степень сжатия, тем больше потери	Возможное сжатие до 80-95%
Настройка качества	Чем выше качество, тем лучше точность закодированного звука	Чем выше точность, тем больше становится итоговый файл, хотя степень изменения варьируется от кодека к кодеку
Скорость передачи	Чем выше скорость передачи данных, тем выше может быть качество	Чем выше скорость передачи данных, тем больше, вероятно, будет закодированный файл
Полоса пропускания звуковой частоты	Если есть звук в удаленных частотных диапазонах может наблюдаться заметная потеря точности.	Удаление частотных диапазонов означает меньшее количество данных для кодирования, следовательно, кодированные файлы меньшего размера
Стерео кодирование	Простое стерео и среднее стерео кодирование не влияет на качество; Однако интенсивное стереофоническое кодирование приводит к потере деталей.	Совместное стерео может до некоторой степени уменьшить размер закодированного звука

Доступные параметры и диапазон возможных значений варьируются от кодека к кодеку и даже среди различных утилит кодирования для одного и того же кодека, поэтому прочтите документацию, которая поставляется с программным обеспечением кодирования, которое вы используете, чтобы узнать больше.

Возможности, влияющие на размер закодированного аудио

На размер закодированного аудио влияют несколько факторов. Некоторые из них зависят от формы исходного звука; другие связаны с решениями, принимаемыми при кодировании звука.

Кодеки без потерь и кодеки с потерями

Есть две основные категории сжатия звука. Алгоритмы сжатия без потерь уменьшают размер звука без ущерба для качества или точности звука. При декодировании аудио, сжатого с помощью кодека без потерь, такого как FLAC или ALAC, результат во всех отношениях идентичен исходному звуку, вплоть до бит.

Lossy кодеки, с другой стороны, используют тот факт, что человеческое ухо не является идеальным интерпретатором звука, и тот факт, что человеческий мозг может извлекать важную информацию из несовершенного или шумного звука. Они удаляют звуковые частоты, которые используются нечасто, допускают потерю точности декодированного вывода и используют другие методы для потери аудиоконтента, качества и точности для создания меньшего количества кодированных носителей. После декодирования результат в разной степени все еще понятен.. Конкретный используемый кодек и выбранная конфигурация сжатия определяют, насколько близким к исходному несжатому аудиосигналу будет выход, когда его слышит человеческое ухо.

Из-за различий в том, как кодеки с потерями работают по сравнению с кодеками без потерь, особенно тот факт, что кодеки без потерь должны быть гораздо более консервативными в отношении сжатия, кодеки с потерями почти всегда приводят к значительно меньшему сжатому аудио, чем кодеки без потерь.

В общем, Наиболее распространенные причины выбора аудио без потерь заключаются в том, что вам требуется хранилище архивного качества или потому, что образцы аудио будут повторно микшироваться и повторно сжиматься, и вы хотите избежать усиления артефактов в аудио из-за повторного сжатия. Для потоковой передачи звука в реальном времени обычно требуется кодек с потерями, чтобы поток данных мог не отставать от скорости воспроизведения звука независимо от производительности сети.

Максимальное количество каналов

Звук, доставляемый на каждый динамик в звуковой системе, обеспечивается одним аудиоканалом в потоке. Монофонический звук — это один канал. Стереозвука — два. Объемный звук 5.1 имеет пять аудиоканалов и один канал Low Frequency Enhancement ( LFE ).

Каналы LFE специально разработаны для хранения низкочастотных аудиоданных и обычно используются для передачи аудиоданных, например, для сабвуферов. Когда вы видите количество аудиоканалов, записанных в форме X.Y (например, 2.1 или 5.1), число после десятичной точки Y — это количество каналов LFE. Например, MP3 поддерживает один канал LFE, в то время как AAC поддерживает до 16.

Помимо предоставления звука для определенных динамиков в звуковой системе, некоторые кодеки могут позволять использовать аудиоканалы для обеспечения альтернативы. аудио, например вокал на разных языках или описательное аудио для людей с ослабленным зрением.

Полоса пропускания звуковой частоты

полоса звуковой частоты кодека указывает диапазон звуковых частот, который может быть представлен с помощью кодека. Некоторые кодеки работают специально, удаляя звук, выходящий за пределы заданного частотного диапазона. Существует корреляция между частотой дискретизации и максимальной частотой звука, которая может быть представлена формой волны, представленной кодеком. На теоретическом уровне максимальная частота, которую может представить кодек, равна частоте дискретизации, деленной на два; эта частота называется частотой Найквиста. На самом деле максимум немного ниже, но он близок.

Полоса пропускания звуковой частоты особенно ярко проявляется, когда кодек разработан или настроен для представления человеческой речи, а не широкого диапазона звуков. Человеческая речь обычно находится в диапазоне звуковых частот от 300 Гц до 18 кГц.. Однако подавляющее большинство человеческих вокализаций существует в диапазоне от 300 Гц до 8 кГц, и вы можете записать достаточно человеческих вокализаций в частотном диапазоне от 500 Гц до 3 кГц, чтобы их можно было понять.

по этой причине кодеки, специфичные для речи, часто начинают с пропуска звука, выходящего за пределы установленного диапазона. Этот диапазон — полоса пропускания звуковой частоты. G.722, например, удаляет звуки, выходящие за пределы полосы звуковой частоты от 50 Гц до 7 кГц. Это сокращает объем данных, которые необходимо кодировать с самого начала.

Сведения о кодеке

Ниже мы кратко рассмотрим для каждого из этих кодеков, глядя на их основные возможности и основные в

Файл