Материал опубликован - 10/02/2004
Автор Alexander Nagorny aka [.m0r+al]
Vorbis против... всех?,
или какой кодек выбрать для сжатия аудио
Эта статья прислана для участия в нашем конкурсе
статей.
Задача качественного сжатия аудиоинформации во многом имеет прикладное значение,
и это, естественно, привело к тому что в последнее время появилось множество
различных кодеков, позволяющих достаточно качественно кодировать аудиоданные.
Можно заметить, что ситуация с разнообразием инструментов весьма напоминает
путаницу с алгоритмами кодирования видеосигнала, где на одну спецификацию MPEG4
приходится чуть ли не десяток реализаций.
На данный момент на рынке имеется шесть наиболее популярных форматов:
- MP3 (MPEG-1 layer
3)
- Ogg Vorbis
- WMA
(Windows Media)
- Musepack
(MPC, основаный на стандарте MPEG1 layer 2)
- AAC
(Advanced Audio Coding)
- RealAudio8 (ATRAC3, Adaptive
Transform Acoustic Coding)
Каждый из них чем-то лучше, а чем-то - хуже других, и выбрать лидера непросто.
Реальные отличия кодеков не лежат на поверхности, и рядовому пользователю достаточно
сложно разобраться в явных и скрытых свойствах этих форматов.
Безусловно, MP3 сейчас является самым распространённым форматом сжатия
аудио. Но вовсе не потому, что он - лучший по качеству звучания или компрессии.
Просто исторически сложилось так, что он появился на рынке намного раньше других
форматов. Еще одна весомая причина - это инертность производителей разнообразной
мультимедийной техники, не желающих вводить новые аудиоформаты. К сожалению,
нельзя забывать и об отсутствии нормальной информации о выходе новых кодеков,
а также о том, что в Рунете невозможно найти адекватное и актуальное
объяснение технологий сжатия аудиоданных. Последнее нормальное сравнение
MP3 с Ogg (что не совсем корректно, поскольку Ogg -
это контейнер для аудиоданных, сжатых с использованием алгоритмов Vorbis, FLAC
или Speex) датировано
2001 годом и относится к одному из бета-релизов Ogg Vorbis, в то время как финальный
релиз вышел 19 июля 2002 года, и с тех пор у нас ничего о нём не было слышно.
Так что же такое Ogg Vorbis?
Ogg (именно Ogg, а не OGG! Ogg - это слово,
в то время как OGG воспринимается как акроним. Произносится Ogg как "ог"),
как я уже писал, - это контейнер. Такой же, как OGM,
как Matroska,
как AVI или MP4.
Контейнер представляет собой виртуальный ящик, позволяющий хранить в себе различные
данные. В случае с Ogg - это аудиопоток и текстовые данные: наименование песен,
альбома, исполнителя и другие комментарии. В других случаях в контейнере может
хранится несколько видео- и аудио-потоков с разными характеристиками, а также
субтитры, меню, данные о главах, статичные изображения и так далее. Контейнер
MP3 в этом смысле несколько ограничен, туда невозможно добавить дополнительные
поля. Контейнер Ogg поддерживает ограниченое количество предопределённых полей
(Title, Artist, Album, Track, Date, Genre, Comment), и неограниченное число
полей Other с собственными заголовками и содержимым (к сожалению, пока только
текстовым).
Соответственно, Vorbis - это название алгоритма сжатия звука. То есть, это
CODEC (кодер/декодер), который в зависимости от настроек пользователя и своих
алгоритмов решает, как именно нужно сжимать звуковые данные. Адаптивный цельнопреобразовательный
алгоритм кодека Vorbis основан на том же принципе, что и MP3, а именно на MDCT
(Modified Discrete Cosine Transform, модифицированное дискретное косинусное
преобразование), но на этом сходство форматов заканчивается. Vorbis, в отличие
от, например, MP3, поддерживает разрядность до 24 бит, частоту дискретизации
до 192kHz и до 255 звуковых каналов (включая 5.1), таким образом опережая MPEG-2,
WMA и Musepack. Не буду перегружать текст техническими подробностями - любителям
они неинтересны, а профессионалы могут и сами посмотреть спецификации.
Теперь перейдём к преимуществам Ogg Vorbis, которые можно понять и пощупать:
- Ogg Vorbis является open-source проектом, то есть это открытый, свободный
стандарт, не защищённый патентами. Отсюда следует, что:
- его использование не требует лицензионных отчислений разработчику, в
отличие от того же MP3, ключевыми патентами на который обладает немецкая
Fraunhofer Gesellschaft
(FhG), с удовольствием взымающая плату за возможность реализации алгоритма
MP3 в мультимедийной технике;
- он постоянно развивается и совершенствуется, причём обновления выходят
чаще, чем у закрытых (проприетарных) форматов (последнее обновление, повысившее
качество звучания при качестве кодирования 5..10 - неофициальная модификация
Garf Tuned 3
beta 1). Кстати, во второй реализации Vorbis ожидается появление волновой
(wavelet) технологии сжатия цифровых аудиоданных;
- он не подвержен пагубному влиянию DRM
(Digital Rights Management) и алгоритмов "защиты"
содержимого;
- кроме всего прочего, он легко переносится на любую платформу;
- Формат Ogg Vorbis изначально оптимизирован для потокового вещания: степень
сжатия может менятся автоматически в зависимости от условий передачи, пакеты
не имеют предопределённого размера (минимального, максимального или ожидаемого),
они (пакеты) могут быть обрезаны или повреждены
- ничто из этого не вызовет сбоя воспроизведения, к тому же в контейнер встроен
механизм коррекции ошибок;
- Благодаря тому, что Vorbis - "урождённый" VBR (variable bitrate)
формат, он не привязан к "ступеням" битрейта (96, 112, 128, 160,
192...), а кодирует каждый кадр (frame) с тем
битрейтом, который больше всего соответствует текущим условиям (это может
быть и 113, и 178, и 234);
- В алгоритм кодека встроена функция "bitrate peeling" - возможность
уменьшения битрейта без перекодирования;
- Данные, сжатые по алгоритму Vorbis, в среднем занимают меньше
места по сравнению с данными, сжатыми по алгоритму MP3. Или, при одинаковом
размере, будут звучать лучше;
- Ogg Vorbis идеально подходит в качестве стандарта передачи аудиоданных в
глобальной сети, то есть является реальной заменой MP3 и WMA, а также подходит
для хранения записей с качеством, близким к CD. Это доказывают многочисленные
"слепые" тесты (когда участники теста не знают,
каким алгоритмом зажат тот или иной файл - все они предварительно декодируются
и предоставляются в формате WAV), проведённые независимыми исследователями:
- Эти исследования показывают, что на низких битрейтах (96
и менее) у Vorbis нет конкурентов, на средних он звучит идентично с
WMA, а на высоких битрейтах (от 170 и выше) Vorbis
опережают только AAC, Real Audio 8 и - иногда - Musepack. В то же время, качество
MP3 на всех битрейтах отмечено как наихудшее.
- Ogg Vorbis всё чаще используется разработчиками программного обеспечения
в своих продуктах (преимущественно в играх: LockOn, Heroes of Might and Magic
IV, Unreal Tournament 2003, Vietnam, Код доступа: Рай, Crimsonland).
- кодек нашёл применение в качестве стандарта для китайского EVD - Enhanced
Versatile Disc, замене DVD.
Теперь рассмотрим слабые стороны, их немного:
- важнейшим препятствием на пути Ogg Vorbis (как, в принципе, и любого другого
формата) стоит консерватизм пользователей. Но это - от незнания :)
- немалую роль играет сопротивление софтверных компаний (как гигантов, так
и компаний помельче): несмотря на наличие всех исходных кодов и отсутствие
лицензионных отчислений, разработчики или упорно игнорируют наличие альтернативных
форматов, или вставляют им палки в колёса. Microsoft же, как всегда, агрессивно
рекламирует своё детище - WMA, при этом выставляя худшие стороны в лучшем
свете: поддержка DRM, по мнению Microsoft, является величайшим благом для
пользователя. Кстати, Windows кроме "родных" форматов WMA, MP3 и
WAV наотрез отказывается воспроизводить прочие аудиофайлы без совершения нетривиальных
телодвижений, хотя, казалось бы, встроить поддержку свободного (!) формата
было бы проще простого...
- свою лепту вносят и производители мультимедийной техники, которые только
к концу 2003 года начали потихоньку "раскачиваться" и встраивать
поддержку Ogg Vorbis в плеера, диктофоны и блочные проигрыватели DVD. Иногда,
правда, это делается за счёт других форматов (как поступила iRiver
- пользователь может выбирать между WMA и Ogg, но вместе они быть не могут).
Непонятно, почему это не делалось раньше.
В принципе, эти три пункта свидетельствуют об одном: Ogg Vorbis ещё слабо распространён,
но ситуация очень быстро меняется, и с каждым годом этот формат становится всё
более и более популярным.
Итак, что мы имеем? На одной чаше весов - открытость стандарта, великолепная
реализация алгоритма, оптимизация для потокового вещания, малый объём файлов
и прекрасное качество звучания. На другой - лень производителей и пользователей,
а также агрессивная рекламная политика конкурирующих форматов. Не повод ли задуматься?
Тем более, что позиционируется Ogg Vorbis именно как замена MP3 для передачи
аудиоданных в сети (из-за меньшего размера и лучшего качества), в том числе
и для потоковой передачи, а также как стандарт де-факто для операционных систем
"не-от-Microsoft".
Как же можно получить файлы Ogg? Для начала покажу простой способ на примере
CDex (тоже, кстати,
open-source проекта). Для того, чтобы сконвертировать аудиотреки с CD в Ogg
Vorbis, надо в настройках CDex указать Encoder: Ogg Vorbis DLL Encoder (идущий
в поставке с CDex, так что вопросов возникнуть не должно) и указать желаемое
качество. Voila!

Конечно, можно пойти и более сложным путём (например, в том случае, если нет
динамической библиотеки или она не подходит). Для этого есть Vorbis
Tools, набор утилит, работающих из командной строки. "Подцепить"
его к EAC (или любому
другому грабберу) также не составит особых трудностей: в разделе "Compression
options" выбираем "Passing scheme: Ogg Vorbis Encoder", указываем
путь к файлу oggenc.exe, добавляем своих настроек по вкусу - и готово!

Для воспроизведения Ogg Vorbis вам потребуется или WinAmp,
или этот DirectShow
плагин - для того, чтобы иметь возможность проигрывания файлов в Windows
Media Player.
Закончить мне хотелось бы словами Ричарда Столлмана (Richard Stallman): "Самый
эффективный способ упрочить наше сообщество в будущем — нести в массы понимание
ценности свободы — заставить как можно больше людей осознать неприемлемость
несвободного ПО. В долгосрочной перспективе лучшей и самой надежной защитой
служат люди, которые ценят свободу."
Special thanks to (in order of appearance):
Axbat
Skorokhod
Cyr_P
Lazylast
участникам форума iXBT
Hardware BBS » Мультимедиа
(Stas_1, Eugene N., Eeeek!, Moneo)
Новости по теме:
- История развития мобильных ПК: любопытные факты из прошлого и настоящего [06.06.2005]
- Google наступает на фронте цифровых фотосервисов [20.01.2005]
- Представлен первый в мире мобильный телефон с детектором движения [14.01.2005]
- Удобное дополнение для Google - Lost Goggles 10b2 [04.12.2004]
- Шведский mp3-плеер с OLED дисплеем [07.11.2004]
- Плеер MP-400 Excentrique: золотой \"прикид\" [05.11.2004]
- Возможно Google делает собственный браузер [21.10.2004]
- 1 Гб MP3 плеер весом 30 грамм [18.10.2004]
- Google готовит к выпуску собственный браузер [18.10.2004]
- MX-100: новый MP3-проигрыватель Median [16.10.2004]
- Google празднует шестилетие [29.09.2004]
- Google поделится рекламными доходами с блогерами [22.09.2004]
- Rover Computers анонсировал МР3-плеер с цветным дисплеем [21.09.2004]
- Первая заплатка для Doom 3 - КАЧАЕМ ВСЕ! [11.09.2004]
- Аудиоплеер NHJ VHD-1500 [05.08.2004]
- МР3-плеер DMC 800 Ultra с винчестером на 20 Гб [26.07.2004]
- Миниатюрный MP3-плеер с жестким диском [25.07.2004]
- Медиаустройство Neuston Virtuoso MC-500 [21.12.2003]
- Ogg Vorbis в «железе» [05.08.2003]
- PlayStation 2 превращается в домашний аудио-видео-центр [15.05.2003]
