MP3
Как это воплощено
Далее разберемся с вариантами кодирования стереозаписей. Теоретически, MP3 (в своем варианте MPEG 2 layer 3) позволяет записывать в одном файле и пятиканальное звуковое сопровождение (например, к DVD-фильму), но подавляющее большинство существующих записей представлены в виде традиционного стерео.
Существует несколько вариантов записи двухканального звука в MP3. Dual Channel (варианты: Dual Stereo, 2 Channel). Каналы полностью независимы. Каждый использует ровно половину битрейта. Рекомендуется, когда левый и правый каналы несут абсолютно независимую информацию (например, в левом - звуковое сопровождение фильма, а в правом - речь переводчика). Также это бескомпромиссный по качеству вариант для сложных музыкальных произведений на самых высоких битрейтах (320 кбит/с).
Stereo.
В целом аналогично предыдущему случаю - каждый канал кодируется отдельно, но битрейт может расходоваться динамически. То есть, если в какой-то момент времени левый канал несет скудную звуковую информацию, часть его битрейта может быть отдана правому каналу, наполненному сложной музыкальной партией "под завязку". Выбор профессионала на битрейтах порядка 256 кбит/с. Возможно использование режима Stereo и на более низких битрейтах (128-160 кбит/с), особенно это оправдано в случаях заметных фазовых расхождений между каналами, когда Joint Stereo пасует.
Joint Stereo (MS Stereo). Из стереосигнала выделяется некий средний (Mid) сигнал, кодируемый большей частью битрейта, и разностный между каналами (Side) - для него отводится меньшая часть битрейта. Иногда это очень обоснованный метод, позволяющий максимально эффективно использовать емкость кодированного потока. Однако в случае фазового сдвига между каналами (который чаще всего встречается на оригиналах, изначально записанных на магнитофонную ленту), Joint Stereo MS резко сдает свои позиции - своеобразные фазовые искажения начинают просто резать слух. Вообще, даже при самых благоприятных условиях Joint Stereo, прямо скажем, не улучшает стереопанорамы.
Joint Stereo (MS/IS Stereo). Еще более упрощенный вариант предыдущего метода. Все также из исходного стереосигнала выделяется средний для обоих каналов. Но в некоторых частотных диапазонах вычисляется уже не разностный сигнал, а просто соотношение мощностей каналов (IntenSive). Это еще больше экономит место, но при этом полностью теряется фазовая информация, так как сигналы обоих каналов приводятся к одной фазе. Рекомендуется использовать в крайне тяжелых условиях низких битрейтов (64-96 кбит/с), в тех случаях, когда можно пожертвовать стереопанорамой в пользу общего качества звука.
Теперь о битрейтах применительно к качеству. Многочисленными тестами с привлечением широкого круга экспертов было доказано следующее: человек в большинстве случаев не может заметить ухудшения качества при переходе от оригинала формата WAV (PCM, 16 бит @ 44 100 Гц) к копии, сжатой в MP3, 256 кбит/с, Stereo (это компрессия в 5,5 раз. Потому что 256 кбит/с - это 128 000 бит/с на один канал, а оригинал - 44 100 х 16 = 705 600 бит/сек. В данном случае килобит = 1000 бит. Максимально же доступный битрейт для формата MP3, обеспечивающий наибольшее приближение к оригиналу, равен 320 кбит/с, что означает компрессию в четыре с половиной раза).
Разумеется, прослушивания производились на аппаратуре самого высокого качества в специально приспособленных для этого условиях. Кодирование, естественно, производилось программами-кодерами, обеспечивающими максимально достижимое качество в рамках заданного битрейта. Правда, все это - с многочисленными оговорками. Если предоставить для прослушивания одновременно оригинал и сжатую копию, причем с возможностью переключаться между ними, опытный эксперт, скорее всего, найдет отличия (например, на струнных инструментах, которые, кстати говоря, немало теряют в качестве и при переходе с мастер-ленты на CD).
Однако если не говорить ему, какая из записей является оригиналом, он вряд ли сможет это определить - отличия не всегда означают ухудшение качества. И, наконец, если сравнивать не с чем, вряд ли хоть один эксперт сможет назвать формат хранения звука MP3, 256-320 кбит/с ущербным с точки зрения качества.
Просто при кодировании, за счет вмешательства психоакустической модели, звук немного меняется - можно сравнить это с изменением фотографии на мониторе при изменении цветовой температуры в меню с 9300 до 9000 К. Различия между этими режимами есть - однако поди ж ты скажи, что во втором случае картинка стала хуже. И попробуй, подойдя к другому монитору, определить, какой режим сейчас на нем стоит - 9300 или 9000 К.
Еще раз повторю: какие-то отличия от оригинала в сжатой копии всегда будут. Но вся соль психоакустики как раз состоит в том, что для человека они абсолютно несущественны (на высоких битрейтах). И все отличия, о которых говорится в предыдущем абзаце, настолько малы и настолько некритичны для восприятия, что представляют скорее теоретический интерес. Смена колонок на другую модель, например, даст куда большую разницу в звучании, чем переход от CD-Audio к MP3, 256 кбит/с, Stereo, сжатому хорошим кодером.
На средних битрейтах (диапазон от 160 до 192 кбит/с) ряд экспертов отмечает уже заметное на слух ухудшение качества.
При этом основные претензии высказываются вовсе не к частотному диапазону, и не к появлению каких-то шумов. В первую очередь страдает динамический диапазон записи и мелкие детали, находящиеся на грани слышимости. Это приводит к потере "кристальной чистоты звука" и "ощущения пространства" - термины трудно определимые, но очень точные. Одновременно с этим слегка ухудшается стереопанорама, что приводит к менее точной локализации источников звука и к общей смазанности звуковой сцены. Кстати, такие же впечатления остались у меня самого, когда я долго пытался уловить разницу между разными битрейтами в промежутке 160-320 кбит/с. Опыты я проводил на альбоме "Magnetic Fields" Жана Мишеля Жарра, который богат стереоэффектами. Действительно, первой страдала как раз стереопанорама.
Наконец, на низких битрейтах (диапазон 96-128 кбит/с) начинается полный кошмар для уха аудиофила. Режим Joint Stereo, применение которого на данных битрейтах вполне оправдано, приводит либо к фазовым искажениям (своеобразная металлизированная "шепелявость", "мутации звука"), либо к смазанности стереопанорамы вместе с другими артефактами сильной компрессии (неестественность, "роботизированность" звука). При использовании режимов Stereo или Dual Channel на таких низких битрейтах уже элементарно не хватает информационной емкости потока для сохранения более-менее значимых сигналов из исходной записи. В результате качество хуже, чем при использовании Joint Stereo.
Сверхнизкие битрейты (32-64 кбит/с) годятся лишь для записи речи в монофоническом формате. С этой задачей они справляются неплохо.
Таким образом, становится очевидна несостоятельность утверждений многих производителей MP3-плейеров типа: "Наш продукт Х обеспечивает два часа непрерывного звучания на битрейте 96-128 кбит/с с качеством CD-Audio". Господа! Расставим точки над "i" в очередной раз. "Качество CD-Audio" - это запись на 256-320 кбит/с, причем сжатая очень хорошим кодером, который еще долго нужно выбирать. "Близко к качеству CD-Audio" - это 160-192 кбит/с. А запись в 96-128 кбит/с даже близко не стояла рядом с оригиналом.
Это близко к качеству записи магнитофона "Электроника-302", выполненной на раздолбанной кассете МК-60. Только с очень низким уровнем шумов, ибо MP3, слава Богу, их практически не добавляет, и с неплохим частотным диапазоном. Заметные искажения присутствуют в обоих случаях, различие в том, что в магнитофоне они появляются за счет большого коэффициента детонации и неидеальной АЧХ тракта записи-воспроизведения, а в случае MP3 вызваны компрессией.
Хочу обратить ваше внимание: зависимость качества от битрейта совсем не линейна. Если от 320 до 256 кбит/с разница почти отсутствует, то при уменьшении ширины потока со 160 до 96 кбит/с качество падает просто катастрофически.
На основании вышесказанного можно сделать вывод (который я для себя сделал года три тому назад): если вы хотите хранить свою фонотеку в цифровом сжатом виде и не желаете мириться даже с мизерным ухудшением качества - пользуйтесь качественным кодером и форматом 320 кбит/с, Dual Channel. Если уж многие эксперты на аппаратуре высшего класса не могут определить отличий копии 256 кбит/с от оригинала, то использование битрейта 320 кбит/с дает дополнительный запас прочности. Кстати, такие высокие битрейты просто жизненно необходимы для сложных, насыщенных музыкальных произведений, богатых полифонией и живыми инструментами: примеры такого рода - оркестр Поля Мориа, Эннио Морриконе (и симфоническая музыка вообще) или некоторые вещи Pink Floyd.
Не очень сложную в плане звуковой насыщенности музыку (к таковой можно отнести даже "Крематорий", "Машину времени" или Никольского, не говоря уж о попсе любого калибра) можно консервировать и в 160-192 кбит/с, Stereo, причем кодер тут нужно использовать уже другой, заточенный именно под эти битрейты. Правда, запаса по качеству в этом случае уже не будет. Такие компромиссы имеют смысл, если вы являетесь владельцем плейера с ограниченным объемом памяти, но все же хотите слушать музыку высокого качества.
Ну а то, что скачано из интернета (как правило, это 96-128 кбит/с, Joint Stereo + кодер неизвестного происхождения), всерьез воспринимать, конечно же, не стоит. Этот мутноватый эрзац годится лишь для ознакомительного прослушивания.