Вход на сайт

Имя:
Пароль:

· Забыли пароль?
logo
Портал Форум
Регистрация Вход


new_topic  reply_topic

  Характеристика звуковых форматов

Источники статьи:
ru.wikipedia.org
music4sale.ru


Звук — это физическое природное явление, распространяющееся посредством колебаний воздуха и, следовательно, можно сказать, что мы имеем дело только с волновыми характеристиками. Задачей преобразования звука в электронный вид является повторение всех его этих самых волновых характеристик. Но электронный сигнал не является аналоговым, и может записываться посредством коротких дискретных значений. Пусть они имеют малый интервал между собой и практически неощутимы, на первый взгляд для человеческого уха, но мы должны всегда иметь в виду, что имеем дело только с эмуляцией природного явления именуемого звуком.

Такая запись именуется импульсно-кодовой модуляцией и являет собой последовательную запись дискретных значений. Разрядность устройства, исчисляемая в битах, говорит о том сколькими значениями одновременно в одном записанном дискрете, берется звук. Чем больше разрядность, тем больше звук соответствует оригиналу.

Любой звуковой файл можно представить, чтобы Вам было наиболее понятно, как базу данных. Она имеет свою структуру, о параметрах которой указывается обычно вначале файла. Потом идет структурированный список значений по определенным полям. Иногда вместо значений стоят формулы, позволяющие уменьшать размер файла. Для того чтобы Вам было совсем понятно, скажу, что запись файла на жесткий диск подобна тому, как Вы набиваете таблицы в Microsoft Excel. Естественно данные файлы могут читать только специализированные программы, в которые заложен блок чтения.



MP3
WMA
WAV
Musepack
(mpp, mp+, mpc, MPEG+)
FLAC
Monkey’s Audio
(ape, apl)
WP
MP3
MP3 (более точно, англ. MPEG-1/2/2.5 Layer 3 (но не MPEG-3) — третий формат кодирования звуковой дорожки MPEG) — лицензируемый формат файла для хранения аудио-информации.

На данный момент MP3 является самым известным и популярным из распространённых форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для передачи музыкальных произведений. Формат может проигрываться в любой современной операционной системе, на практически любом портативном аудио-плеере, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.

История
MP3 разработан рабочей группой института Фраунгофера (англ. Fraunhofer Society) MPEG (англ. Motion Pictures Expert Group — группа экспертов в области кинематографа) состоящей из Джонсона, Штолла, Деери и Карлхайнца Бранденбурга. Основой разработки MP3 послужил экспериментальный кодек ASPEC (Adaptive Spectral Perceptual Entropy Coding). Первым кодировщиком в формат MP3 стала программа L3Enc, выпущенная летом 1994 года. Спустя один год появился первый программный MP3-плеер — Winplay3.

При разработке алгоритма тесты проводились на вполне конкретных популярных композициях. Основной стала песня Сюзанны Веги «Tom's Diner». Отсюда возникла шутка, что «MP3 был создан исключительно ради комфортного прослушивания любимой песни Бранденбурга», а Вегу стали называть «мамой MP3».

Описание формата
В этом формате звуки кодируются частотным образом (без дискретных партий); есть поддержка стерео, причём в двух форматах (подробности — ниже). MP3 является форматом сжатия с потерями, то есть часть звуковой информации, которую (согласно психоакустической модели) ухо человека воспринять не может или воспринимается не всеми людьми, из записи удаляется безвозвратно. Степень сжатия можно варьировать, в том числе в пределах одного файла. Интервал возможных значений битрейта составляет 8 — 320 кбит/c. Для сравнения, поток данных с обычного компакт-диска формата Audio-CD равен 1411,2 кбит/c при частоте дискретизации 44100 Гц.

MP3 и «качество Audio-CD»
Распространено мнение, что запись с битрейтом 128 кбит/c подходит для музыкальных произведений, предназначенных для прослушивания большинством людей, обеспечивая качество звучания Audio-CD. В действительности всё намного сложнее. Во-первых, качество полученного MP3 зависит не только от битрейта, но и от кодирующей программы (кодека). Во-вторых, помимо превалирующего режима CBR (Constant Bitrate — постоянный битрейт) (в котором, проще говоря, каждая секунда аудио кодируется одинаковым числом бит) существуют режимы ABR (Average Bitrate — усредненный битрейт) и VBR (Variable Bitrate — переменный битрейт) (в которых битрейт варьируется, обеспечивая более высокое качество звучания). В-третьих, граница 128 кбит/c является условной, так как она была «изобретена» в эпоху становления формата, когда на некачественных аудиокартах и компьютерных колонках было практически невозможно отличить MP3 от оригинала.

На данный момент считается, что неотличимое от оригинала звучание (при правильно выбранном и настренном кодеке) обычно достижимо при битрейте от 160 кбит/c и выше — в зависимости от исходного аудиофайла, слушателя и его аудиосистемы. Некоторые аудиофилы предпочитают сжимать музыку с «максимальным качеством» — 320 кбит/c. На самом деле известны семплы (фрагменты аудиозаписи), не поддающиеся качественному сжатию с потерями: на всех возможных битрейтах не составляет особого труда отличить сжатое аудио от оригинала.

Некоторые мелодии (из тех, что используют шум и акустические помехи в качестве фона) кодируются только как «стерео», но не как «объединённое стерео», иначе отличия слышны на любом битрейте.

Режимы кодирования и опции
Существует три версии MP3 формата для различных нужд: MPEG-1, MPEG-2 и MPEG-2.5. Отличаются они возможными диапазонами битрейта и частоты дискретизации:
  • 32 — 320 кбит/c при частотах дискретизации 32000 Гц, 44100 Гц и 48000 Гц для MPEG-1 Layer 3;
  • 16 — 160 кбит/c при частотах дискретизации 16000 Гц, 22050 Гц и 24000 Гц для MPEG-2 Layer 3;
  • 8 — 160 кбит/c при частотах дискретизации 8000 Гц и 11025 Гц для MPEG-2.5 Layer 3.


Режимы управления кодированием звуковых каналов

Так как формат MP3 поддерживает двухканальное кодирование (стерео), существует 3 режима:
  • Стерео — двухканальное кодирование, при котором каналы кодируются независимо друг от друга. Таким образом, заданный битрейт делится на два канала. Например, если заданный битрейт 192 кбит/c, то для каждого канала он будет равен только 96 кбит/c.
  • Моно — одноканальное кодирование. Если закодировать двухканальный материал этим способом, различия между каналами будут полностью стёрты, так как два канала смешиваются в один, он кодируется и он же воспроизводится в обоих каналах стереосистемы. Единственным плюсом данного режима может являться только выходное качество по сравнению с режимом Стерео при одинаковом битрейте, так как на один канал приходится вдвое большее количество бит, чем в режиме Стерео. Но различий между каналами вы не услышите, так как канал здесь только один.
  • Объединённое стерео (Joint Stereo) — оптимальный способ двухканального кодирования, при котором левый и правый каналы преобразуются в их сумму и разность. Для большинства звуковых файлов канал с разницей получается намного тише канала с суммой, поэтому на сумму отводится бо́льшая часть битрейта. Таким образом, качество выходного файла разительно отличается в лучшую сторону от режима Стерео при одинаковом битрейте, особенно при низком. Бытует мнение, что данный режим не подходит для звукового стереоматериала, в котором в двух каналах воспроизводится субъективно абсолютно различный материал, так как он стирает различия между каналами. Это ошибочное мнение, так как в действительности MP3-кодек оперирует частотами, а определенные частоты в большинстве случаев пересекаются в обоих каналах, то есть идентичная информация все же присутствует, а различная кодируется отдельно. Особенно эффективен этот способ двухканального кодирования при использовании переменного битрейта, речь о котором пойдет ниже.


CBR, VBR, ABR

CBR расшифровывается как Constant Bit Rate, то есть Постоянный битрейт, который задается пользователем и не изменяется при кодирования произведения, таким образом каждой секунде произведения соответствует одинаковое количество закодированных бит данных (даже при кодировании тишины). Данный режим кодирования не является оптимальным, так как он не годится для большинства динамичных музыкальных произведений при битрейте ниже 256 кбит/c.

VBR расшифровывается как Variable Bit Rate, то есть Варьирующийся Битрейт или Переменный Битрейт, который динамически изменяется программой-кодером при кодировании, в зависимости от насыщенности кодируемого аудиоматериала и установленного пользователем качества кодирования (например, тишина закодируется с минимальным битрейтом). Этот метод MP3-кодирования является самым прогрессивным и до сих пор развивается и улучшается, так как аудиоматериал разной насыщенности может быть закодирован с определенным качеством, которое обычно выше, чем при установке среднего значения в методе CBR. Плюс к тому, размер файла уменьшается за счет фрагментов, не требующих высокого битрейта. Минусом данного метода кодирования является полная невозможность предсказать размер выходного файла. Но этот недостаток VBR-кодирования незначителен в сравнение с его достоинствами. Также минусом является то, что VBR считает «незначительной» звуковой информацией более тихие фрагменты, таким образом получается, что если слушать очень громко, то эти фрагменты будут некачественными, в то время как CBR делает с одинаковым битрейтом и тихие, и громкие фрагменты.

ABR расшифровывается как Average Bit Rate, то есть Усредненый Битрейт, который является гибридом VBR и CBR: битрейт в кбит/c задается пользователем, а программа варьирует его, постоянно подгоняя под заданный битрейт. Таким образом, кодер будет с осторожностью использовать максимально и минимально возможные значения битрейта, так как рискует не вписаться в заданный пользователем битрейт. Это является явным минусом данного метода, так как сказывается на качестве выходного файла, которое будет немного лучше, чем при использовании CBR, но намного хуже, чем при использовании VBR. С другой стороны, этот метод позволяет наиболее гибко задавать битрейт (может быть любым числом между 8 и 320, против исключительно кратных 16 чисел метода CBR) и вычислять размер выходного файла

Кодеки

Типы программ, необходимые для преобразования форматов файлов. Наиболее распространённые кодеки мр3:
  • mp3PRO-codec
  • mp3LAME-codec


Теги

Метки в границах mp3-файла (в начале и\или в конце). В них могут быть записана информация об авторстве, альбоме, годе выпуска и прочая информация о треке. В более поздних версиях тегов возможно хранение обложек альбомов и текста песни. Существуют различные версии тегов.

Недостатки
MP3 является лидером по распространённости, но при этом не является лучшим по техническим параметрам. Например, существует формат, позволяющий получить качество лучше (субъективно) при большей плотности - Vorbis. Также в формате MP3 отсутствует режим кодирования без потерь англ. lossless, подходящий для профессионалов. Для домашней музыкальной коллекции (когда нет необходимости проигрывать композиции на музыкальном центре или распространять их через интернет) подходят и конкурирующие форматы.

Популярность MP3 представляет собой своего рода «порочный круг»: пользователи кодируют аудио в MP3 в основном из-за широкой поддержки формата производителями программного и аппаратного обеспечения, а производители, в свою очередь, вкладывают средства в наиболее популярный среди пользователей формат MP3.

MP3 не пригоден для профессионального использования музыкантами уже из-за того, что данные сжимаются с потерями, и при каждом редактировании файла качество ухудшается. При этом формат вполне подходит (с профессиональной точки зрения) для распространения демонстрационных композиций или иных способов «раздачи» своей музыки из-за повсеместной распространённости проигрывателей.

Компания Alcatel-Lucent обладает правами на MP3 и получает отчисления от тех, кто использует этот формат - производителей плееров и мобильных телефонов. Из-за этого лицензионная чистота формата под вопросом. В частности, Alcatel-Lucent предъявила претензии компании Microsoft за то, что в Windows была встроена поддержка MP3.
WMA
Windows Media Audio — лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудио-информации.

Изначально формат WMA позиционировался как альтернатива MP3, но на сегодняшний день Microsoft противопоставляет ему формат AAC (используется в популярном на западе онлайновом музыкальном магазине iTunes).

Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему «обходить» формат MP3 и конкурировать по параметрам с форматами Ogg Vorbis и AAC. Но как было показано независимыми тестами, а также при субъективной оценке качество форматов все таки не является однозначно эквивалетным, а преимущество даже перед MP3 однозначным, как это утверждается компанией Microsoft. Особенно стоит отметить что ранние версии формата (или его реализации) имели проблемы на низких скоростях потока. Также многие меломаны и владельцы цифровых плееров недолюбливают формат WMA за низкую стойкость к ошибкам. Если при кодировании/передаче файла WMA некоторая часть его повреждается, то воспроизведение файла становится невозможным, как после места повреждения, так и за несколько десятков секунд до него. (Для сравнения: при повреждении файла формата MP3, его всё ещё можно воспроизвести от начала до самого места повреждения, затем пропустить несколько секунд и воспроизвести дальше до конца; иногда же ошибки в несколько байт в файле MP3 бывают на слух малозаметны или не заметны вообще.) Однако данный формат постоянно развивается, так что можно предполагать, качество будет оптимизироваться.

Большинство портативных аудио-плейеров поддерживает формат WMA наряду с MP3. Данный формат очень плохо поддерживается на альтернативных платформах (вследствие его закрытости).

Microsoft включила в WMA поддержку цифровой системы управления авторскими правами (DRM) (система защиты). Основным следствием ее является невозможность прослушивать защищенные композиции на других компьютерах, кроме того, на котором композиция была загружена из музыкального магазина.

В последних версиях формата, начиная с Windows Media Audio 9.1, предусмотрено кодирование без потери качества англ. lossless, многоканальное кодирование объемного звука и кодирование голоса.
WAV
Microsoft Wave — формат аудио-файла, оцифрованной записи звука, чаще всего без применения компрессии данных. Один из типов файлов семейства RIFF.
WAV является самым точным воспроизведением записанного звука (в отличие, например от mp3, которые, хотя это и в большинстве случаев незаметно на слух, но все же искажают первоисточник).

Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали? это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.
Musepack
MusePack (mpp, mp+, mpc, MPEG+) — нелицензируемый формат файла для хранения аудио-информации, распространяемый по GNU General Public License.

Качество кодирования MPC на высоких битрейтах (160 Кбит/с и выше) заметно (если не сказать значительно) выше качества, обеспечиваемого MP3. При кодировании используется другой психоакустический алгоритм сжатия, в mpc не теряются звуки, которые MP3-кодеры игнорируют, так как по их мнению их все равно не будет слышно.

История
Musepack был создан Андре Бушман (англ. Andree Buschmann), в домашних условиях, «на коленке», во время учебы в свободное время. Разработка мотивировалась неудовлетворенностью качества первых MP3-кодеров (в 1997—1998 гг.). В настоящее время разрабатывается Франком Клемм (англ. Frank Klemm) и Musepack Development Team.

Кодек MPEGplus (MPEG+), переименованный позже в MusePack (MPC) из-за проблем, которые появились у автора кодека в связи с тем, что название последнего содержало в себе аббревиатуру MPEG, — это общее название группы стандартов, в которые входит MP3. MusePack не является продолжением MPEG-1 Layer III, а лишь, как и MP3, берет свое начало в MPEG-1 Layer II. Отсюда его направленность на кодирование преимущественно на более высоких битрейтах, нежели MP3. В то же время, кодек является совершенно самостоятельной разработкой. Кодеком предусмотрено кодирование только в режиме переменного битрейта (VBR). Скорость компрессии и декомпрессии в/из MPC заметно выше скорости выполнения этих операций применительно к MP3.

Характеристики
В Musepack’е применяется разбиение на полосы частот, поэтому он относится к так называемым subband-кодекам. Основная особенность — точная настройка психоакустики, что позволяет работать с чистым VBR-кодированием (кодирование с переменным битрейтом). Основной задачей Musepack является прозрачность звучания закодированной музыки.

В современных форматах, таких как: MP3, Vorbis, AAC, AC3, WMA производится второе dct-преобразование, что позволяет им добиться лучшего качества на средних и низких битрейтах, но не позволяет добиться высоких результатов на более высоких. MusePack не производит второго dct-преобразования, что позволяет достичь непревзойденного качества на битрейтах выше 180.

Так же как в AAC и некоторых других современных форматах, в musepack производится спаривание каналов по полосам частот, что незначительно отражается на качестве, но позволяет сильно сэкономить на размере. В MP3 спаривание каналов производится не по полосам частот, а для всей полосы целиком, разбивая сигнал на частотные подполосы, затем производит разложение сигнала в ряд косинусов (MDCT — частный случай преобразования Фурье) и записывает округленные (квантованные) значения полученных после преобразования коэффициентов (квантование происходит в соответствии с проводимым психоакустическим анализом). MPC же после разбиения сигнала на частотные подполосы просто производит переквантование (опираясь на психоакустику) амплитудного сигнала в каждой подполосе и полученные округленные (квантованные) значения записывает в выходной поток. Этим же фактом объясняется и большая скорость компрессии и декомпрессии MPC.

Качество и производительность
  • Кодирование с настройками по умолчанию выдает качество, превышающее качество MP3 с использованием кодека LAME.
  • С используемой версией — кодирование с помощью StreamVersion 7 (SV7) — средний битрейт (англ. bitrates) около 160—170 kbit/s. Некритичные сигналы идут в пределах около 100—120 kbit/s, более критичные сигналы могут быть больше чем 200 kbit/s.
В недалеком будущем ожидается поддержка формата musepack аппаратными плеерами.
FLAC
FLAC (англ. Free Lossless Audio Codec — свободный аудиокодек без потерь) — популярный свободный кодек для сжатия аудио. В отличие от кодеков с потерями Ogg Vorbis, MP3 и AAC, не удаляет никакой информации из аудиопотока и подходит как для ежедневного прослушивания, так и для архивирования аудиоколлекции. На сегодня формат FLAC поддерживается многими аудиоприложениями.

Существуют модификации FLAC кодера: Improved FLAC encoder и Flake.

29 января 2003 г. Xiphophorus (сейчас называется Xiph.Org Foundation) анонсировали включение формата FLAC в линейку своих продуктов, таких как Ogg Vorbis, Theora, и Speex.

Аппаратно поддерживается во многих устройствах. Среди них:
  • Rio Karma
  • iPod (Video, Nano, Photo, Color, Mini (2nd generation)), iRiver, Gigabeat (Toshiba) (через прошивку RockBox)
  • iAudio (Cowon)
и другие (полный список доступен на странице FLAC)
Monkey’s Audio
Monkey’s Audio — популярный формат кодирования цифрового звука без потерь. Распространяется бесплатно вместе с открытым исходным кодом и набором программного обеспечения для кодирования и воспроизведения, а также плагинами к популярным плеерам. Файлы Monkey’s Audio используют следующие расширения: .ape для хранения аудио и .apl для хранения метаданных. Несмотря на открытый исходный код, Monkey's Audio не является свободным, так как его лицензия накладывает значительные ограничения на использование.

Поддерживаемые платформы
Официально кодек Monkey’s Audio выпускается только для платформы Microsoft Windows, хотя существует ряд неофициальных кодеков для GNU/Linux и Mac OS X, которые в большинстве случаев позволяют лишь пережимать файлы из этого формата в какой-либо другой.
WP
WavPack — бесплатный аудио кодек c открытым исходным кодом для сжатия аудио без потери качества. Разработан Дэвидом Бриантом.

Особенности
WavPack формат (расширение .WV) позволяет сжимать (и восстанавливать) 8, 16, 24 & 32-битные аудио файлы в .WAV формате. Он также поддерживает потоки звук вокруг и высокие частоты дискретизации (sampling rate). Как у других способов компрессии без потери качества эффективность сжатия зависит от исходных данных, но обычно она лежит в диапазоне между 30 % и 70 % для обычной популярной музыки, немного выше для классической музыки и других источников с более широким динамическим диапазоном.

WavPack также включает уникальный «гибридный» режим, который предоставляет все преимущества сжатия без потерь с дополнительным бонусом: вместо создания одного файла, в этом режиме создается относительно небольшой файл высокого качества с потерей (.wv), который может проигрываться сам по себе, а также файл «коррекции» (.wvc), который (в комбинации с предыдущим .wv) позволяет полностью восстановить оригинал. Для некоторых пользователей это означает, что им никогда не придётся выбирать между сжатием без потерь и с потерей качества.

Резюме

  • Быстрое и эффективное сжатие и декомпрессия
  • Открытый исходный код, доступный по BSD-подобной лицензии
  • Мультиплатформенный
  • Устойчивость к ошибкам
  • Поддержка потокового вещания
  • Поддержка мультиканального аудио и высокого разрешения
  • Гибридный режим/режим с потерей качества
  • Аппаратная поддержка
  • Тэги (ID3v1, APE)
  • Поддержка RIFF
  • Replay Gain совместимость
  • Хорошая программная поддержка
  • Возможность создания самораспаковывающихся файлов для Win32
  • Поддержка 32bit потоков с плавающей точкой
  • Поддержка встраиваемых CUE sheets
  • Включает MD5 хэши для быстрой проверки целостности
  • Может кодировать симметрично и ассиметрично (=более медленное сжатие для ускорения декомпрессии)

Страница 1 из 1

new_topic  reply_topic

Текущее время: 29-Мар 01:30
Часовой пояс: GMT + 4

m Сделано с любовью