Рубрикатор

Все материалы, относящиеся к технологиям сжатого звука.
Раздел "mpeg".

(материалы даны в хронологической последовательности, как они появлялись в номерах)


из номера за 11 мая 1998

Вообще, про MP3 много написано, и даже автор этих строк сам писал. Что преобразовывать, как преобразовывать и откуда берутся файлы формата WAV для преобразования. Очень важен выбор преобразователя, так как не все они одинаковы и досовский l3enc.exe, который кодирует дольше всех, почему-то ошибочно считается лучшим - совсем вот не самый лучший по качеству. А считает долго потому что алгоритмы там устаревшие и сделаны не под 32-разрядную систему. Вот, полюбуйтесь, как l3enc.exe "круто" обрезал высокие частоты выше 16кГц, которые вообще-то еще слышатся ухом! По сравнению с MPEG Producer'ом.

Картинки взяты из: http://members.xoom.com/kandid/ - сайт, на который любителям (и знатокам) стоит сходить вне всякого сомнения! Причем все необходимы программы там можно скачать совершенно свободно! В частности, там есть и объяснение про Layer I,II,III и как на самом деле происходит "сжатие" звука.

Mpeg Producer можно скачать и отсюда. (365kb)


из номера за 16 февраля 1999

Преобразовывать из MP3 в WAV обычно можно и winamp'ом, но есть специальные программы. Я выложу на сервер одну из них. Скачать здесь (480kb). Для чего нужно преобразовывать? Ну, например, для того чтобы переслать другу компакт-диск по FTP. Только делать это надо в битрейте 256kbps, чтобы получилось достаточно хорошее качество. А друг просто декодирует это обратно и запишет на чистую матрицу. Очень удобно, и не надо мучиться с почтой.

 


из номера за 1 апреля 1998

http://kk-research.hypermart.net/ - поэтому адресу находится сайт, где анонсируется (очередной?) серьезный кандидат в команду по закапыванию MP3 - новый кодек AAC MP01 (Music Publisher). Как утверждается, при 128kbit/s пакует с качеством "full CD". Ну, примерно сравнивают его 128 со 192kbps от mp3. Но кодера самого в свободном распространении нет. Есть только плагин к винампу. И поэтому проверить, насколько кодек хорош, не представляется возможным.
Похоже, что народ просек, что чем сильнее и качественннее научиться жать звук - тем больше денег можно срубить. Только вот про популярность как-то забывает. Что там было... Liquifier, Quartex, PAC... либо нет поддержки нормальной, либо только за деньдюжку. Обламывают круто, кстати.
Я рискнул по совету написать письмо хозяину сайта KK-research, типа "а да-а-айте кодек потестировать, а?" :)) - вроде у них демка была для страждущих типа меня. Мне сказали, что демки у них отродясь не было, но они об этом подумают. Зато, чтоб я не расстраивался, предложили мне скачать с их сайта свободные AAC файлы для тестирования. Хм.... странные какие-то. Мне ведь хочется сравнить с mp3, а не просто послушать :))

Это у них график там такой. Сравнение результата с оригиналом. А хочется, вообще-то, послушать одну и ту же композицию в mp3, в AAC же, да и в оригинале, конечно. Тогда можно выводы делать.

Итого, завершая сегодняшнее напоминание насчет ужимки звука и обобщая предыдущие заметки:
1. VQF - несостоялся. Жмет долго, кодирование последовательное (сложность свободного позиционирования), нарекания по качеству.
2. Liquifier (AAC) - для него нет кодека (свободного), как собственно, и проигрывателя.
3. Quartex (AAC) - кодек есть, для winamp'a нет плагина, единственный, кто его играет (кроме родного глюкавого плейера) - K-Jofol, но он неустойчив.
4. PAC - достаточно перспективный формат, но, опять же, ничего для него нет.
5. K+K MP01 (AAC)- даже лучше Liquifier'а, свободного кодека нет, зато есть плагин (60kb) для winamp'a. Видимо, для раскодировки требуется ощутимое количество процессорных ресурсов. Мой P150 не потянул! Получались рывки. При установке приоритета real-time у приложения ситуация улучшилась, но не слишком. Может это у меня глюк... хотя, не думаю. При буферизации-то кусок играется хорошо. Значит, не успевает распаковывать. Кстати, звук оставляет очень хорошее впечатление (скачал-таки у них композицию).

Есть еще кодек от PsyTel. Тоже выдает AAC. Жмет неплохо (проигрывается в winamp'e этим же плагином), но опять таки, при проигрывании рывки. По той же причине. Сам кодек я выложил к себе - качайте (840kb).

Ждем дальше.
Хотелось бы, разумеется, ужимать хотя бы в 96kbps и с качеством, как у mp3, 128k. Лучше, как говорится, меньше, и - лучше.

 


из номера за 1 июля 1999

Еще не попробовали кодер CDex? Настоятельно рекомендую. Последняя версия 1.20 beta4. Замечателен тем, что в него входит кодек LAME (психоаккустическая модель GPSYCHO для ISO mp3 кодеков. by Mark Taylor, 1999) с переменным значением скорости потока бит/сек (VBR - variable bit rate).
Позволю себе напомнить, что существуют два основных режима стерео для кодирования звука: stereo и jstereo. Stereo - это кодирование правого и левого каналов независимо друг от друга. Jstereo может включать в себя как нормальное стерео кодирование, так и mid/side stereo (ms_stereo). Т.е. при кодировании ms_stereo вычисляется среднее между двумя каналами (это mid) и разница от одного из каналов (side). В этом режиме кодирования, например, в FhG кодере всегда применяется до 128kbps (меня поправили - даже до 192kbps!) включительно, а это сами понимаете, не фонтан по той прочтой причине, что первое: у вас каналы могут быть в разной фазе, даже в противофазе - что в результате услышите? Правильно, ничего. Но это редко бывает, и даже не это главная беда. Самое плохое в том, что если после такого разделения получится, что для кодирования side канала понадобится много бит, то либо будет уменьшено количество бит у основного канала (что вряд ли), либо сильно подрезан как раз side канал. Чувствуете? Конечно, когда все хорошо, т.е. на mid канал уходит столько бит, сколько запланировано, а side каналу требуется немного, то этот трюк ms_stereo проходит. Но вот если правый и левый каналы сильно различаются, то после раскодирования (прослушивания) возможны шумы из-за нехватки скорости потока :(

Что делать? Правильно. Выбирать для каждого фрейма конкретно, будет он кодироваться по разным каналам отдельно либо можно смело для усиления сжатия использовать ms_stereo без боязни потерять информацию (соотносясь с данной скоростью потока, конечно). Вот LAME кодек как раз так и делает. Он-то и применяется среди остальных в рипере-кодере CDex. Причем, там есть много гибких настроек, которыми можно выставить наконец, хочу я точно на 128kbps ms_stereo или не хочу. Между прочим, принцип выбора критерия для mid/side stereo в LAME кодеке основывается на выкладках книги Джонстона и Ферейры "Sum-Difference Stereo Transform Coding". И MPEG AAC стандарт как раз ссылается на эту же книгу.

CDex LAME codec control panel
Stereo - всегда real stereo, J-stereo - выбирает кодек по фреймам,
Forced Stereo - всегда mid/side stereo

Надо сказать, что переменный битрейт давно напрашивался, как способ обойти неудобства с кодированием пустоты и насыщенного звука в одной композиции. Сами посудите - если звук недостаточно насыщен - его что, тоже кодировать с тем же bps? Зачем, если можно увеличить степень "сжатия", а этот выйгрыш потратить на критичный участок, временно повысив bps до приемлемого значения. Как эта штука будет работать на реальной скорости потока - не представляю, но для нас это не важно - все равно файл обычно сначала скачиваешь, а потом слушаешь.
Попробуйте - довольно весело наблюдать, как Winamp например, проигрывает mp3 с VBR - обратите внимание на окошечко с цифрами, показывающие текущий битрейт у композиции - как он прыгает в такт насыщенности и сложности звука(!) Т.е., если я при кодировании выставил 96kbps, то я указал _нижний_ предел, ниже которого кодек кодировать не должен. А выше - пожалуйста. Хоть 160kbps, хоть 256kbps. В чем прикол - ?. Хм, выгода очевидна. При кодировании 96kbps обычным кодером получаем плохое качество. А вот с VBR - нет. Иногда даже лучшее, чем обычным при 128kbps. Потому что критичные участки, падение качества которых мы слышим сразу, кодек с VBR уже обрабатывает с повышенным bps. Кстати, в инструкции по пользованию кодеком указан оптимальный коэффициент VBR - 4. Критерий выбирается от 0 до 9 - ноль - лучшее, 9 - худшее. Т.е. насколько кодек будет часто отклоняться от выставленного bps.
Размеры файлов с VBR несколько больше, чем обычно - оно и понятно, за все надо платить. Но самое главное, при 96kbps размеры получаются все равно чувствительно меньше, чем при 128kbps обычных. А это значит, что LAME кодек составит сильную конкуренцию VQF, AAC и Liquid с их стандартными 96kbps. Mp3 с VBR играется отлично Winamp и K-Jofol (Windows платформа) и mpg123 (Unix платформа). А вот NAD не поддерживает формат mp3 с VBR.
Итак, приверженцы формата Mp3 могут порадоваться - найден неплохой компромисс между размером и качеством. Я попробовал сравнивать 96kbps VBR4 с FhG 128kbps - различий не заметил. Более того, при 128kbps c VBR качество точно лучше, чем у например, ISO psy-моделей при том же битрейте.
В разделе OneMp3 я выкладываю композицию, сжатую LAME кодеком, 96kbps со значением VBR=4. Но размер файла, я еще раз повторюсь - зависит от содержания. Вообще-то, это логично.

4 июля: Добавлю еще вот что: после преобразования обратно в WAV файла, закодированного с VBR4 96kbps (LAME, флажок "On the fly mp3 encoding" снят!) я не наблюдал никаких ненормальностей в АЧХ (среза на 16kHz нет).

Скачать CDex beta4 можно и у меня (850kb).

 


из номера за 9 сентября 1999

Player C-4. Достаточно шустрый проигрыватель mp3 файлов. В принципе, ничего нового, за исключением того, что он мало грузит процессор - утверждается, что раза в четыре меньше NAD'a. Плейер сделан на движке Xaudio от MpegTV, который разрабатывался первоначально для Линукса.

Может тихонечко занять место в любом из углов, "принимая форму сосуда, в который помещен"... :) И еще одна приятная особенность - можно запустить одновременно несколько копий этого плейера (не больше трех) - и перещелкивай себе на здоровье (жалко микшировать не получается). С NAD'ом или winamp'ом такие фокусы не проходят.
Родной сайт, где можно его скачать (1.0Mb) - http://www.surfidaho.com/c-4/.

 



 Пишите! Мне интересно будет Ваше мнение, замечания и пожелания. Указывайте в письме НЕсогласие на опубликование. Если ничего не будет указано - публикую по своему усмотрению. Если письмо не личное, конечно...

Журнал поддерживается ISP Деловая Сеть Иркутск