Что такое формат MP3? Аудио конвертер

На iOS - iPhone, iPod touch 24.06.2019
На iOS - iPhone, iPod touch
(Описание популярного формата аудиосжатия MP3)

Вступление

Этот самый популярный на сегодняшний день цифровой формат аудиосжатия, был разработан несколько лет назад небольшой немецкой фирмой Fraunhofer IIS. Европейская корпорация THOMSON активно поддержала новоявленный формат и приложила все усилия к его быстрейшему распространению. В частности при ее поддержке новичок стал одним из стандартов аудиосжатия семейства MPEG1, MPEG2 и получил название MPEG Layer3 или более привычное нам MP3.

Революция звука

Появление этого формата на свет уместнее всего назвать тихой революцией. Революцией – потому что до MP3 ни один формат звуковых файлов не мог обеспечить такое качество при таком относительно небольшом размере. Единственный на тот момент сетевой формат.RA (real audio) иначе чем издевательством над слухом не назовешь. MPEG Layer3 задумывался именно как "убийца" этого убогого монополиста, великана на глиняных ногах. MP3 – это формат, разработанный специально для сети Internet, для быстрой пересылки качественного звука куда угодно. Именно поэтому MP3 является потоковым форматом, что это значит будет рассмотрено в дальнейшем. Способность этого алгоритма сжатия уменьшать размер звуковых файлов практически без потери качества, выглядела по тем временам совершенно фантастически. Ведь даже при кодировании с максимальной шириной потока (bitrate) равной 320 kbs (килобит в секунду), а это качество звука практически неотличимое от оригинального, размер исходного WAV файла уменьшается в четыре раза!

Да, это была революция, но очень странная революция. Ведь этот уникальный алгоритм в начале своего существования висел буквально на волоске. Полное отсутствие рекламы, никаких проигрывателей музыки данного формата, кроме фирменного от Fraunhofer IIS, который отличался крайней убогостью дизайна, жутким управлением и непомерными системными требованиями. Прибавьте еще и колоссальные аппетиты самих разработчиков, которые хотели за свои кодеки (CODEC – COder/DECoder) довольно немалые суммы (схожая ситуация сейчас с некоторыми форматами семейства AAC) и отсутствие музыки как таковой, в отличие от солидных залежей музыки в формате RA. Эти факторы вполне могли загубить новорожденного сразу же после родов. И все любители хорошей музыки должны сказать огромное спасибо тем известным и безымянным разработчикам freeware MP3 CODEC, которые не дали создателю этого формата фирме Fraunhofer IIS из-за своей маркетинговой глупости и жадности погубить гениальное творение.

Так же следует отметить ту важную роль которую сыграл популярный проигрыватель WinAMP в распространении формата MP3. Этот плеер первым предоставил то удобство, которого так не хватало фирменным проигрывателям. Потом, как я уже говорил, этот формат заметила компания THOMSON, и с этого начался победный марш MP3 по всему миру.

МР3 изнутри: психофизиология звука

Данный формат использует крайне сложный алгоритм кодирования. В отличие от обычных архиваторов, которым нужно ухитрится сжать информацию таким образом, чтобы после извлечения из архива в ней не изменилось ни одного бита, MP3 преследует несколько иные цели. Помимо математических алгоритмов сжатия, в этом формате присутствует так же сложнейший алгоритм удаления ненужной звуковой информации, основанный на психолого-физиологических особенностях организма человека. Попытаюсь остановится на данном моменте несколько подробнее.

Как уже говорилось, MP3 является потоковым форматом. Это означает, что звуковая информация при кодировании разбивается на равные по продолжительности участки, которые называются фреймами. Все фреймы взаимно независимы. Каждый из этих фреймов кодируется отдельно со своими параметрами и имеет заголовок, в котором эти параметры описаны. При воспроизведении последовательность декодированных фреймов и порождает непрерывное звучание записанного звука.
Какие преимущества дает данный подход? Во-первых, возможность перемотки, так как возможен легкий переход к произвольному фрейму, и воспроизведение звука именно с этого места. Во-вторых, именно эта структурная особенность и делает MP3 по настоящему сетевым форматом. Загрузив первые несколько фреймов в оперативную память или дисковый кэш, проигрыватель начинает их воспроизводить, при этом одновременно подгружая новые фреймы, чем достигается непрерывность воспроизведения. И наконец, если вы не смогли целиком скачать MP3 файл из сети Internet, то ничего страшного, музыку все равно можно будет слушать, просто проигрыватель дойдет до того места, на котором оборвалась связь и остановится.

Так вот вернемся к нашим фреймам. При высоком качестве MP3, а это bitrate ~ 320 кbs, для кодирования фреймов применяются только математические алгоритмы сжатия. Качество при этом совершенно не страдает, но и размер уменьшается всего в четыре раза, то есть коэффициент сжатия такой, какой бы дал обычный архиватор; именно поэтому файлы формата МР3 практически не ужимаются обычными архиваторами. При уменьшении полосы пропускания (bitrate) до 256 kbs и ниже, в дело вступают те самые алгоритмы удаления "ненужных" звуков, которые основаны на особенностях восприятия звука человеческим ухом, так называемая "психоакустическая модель". Процессы удаления "ненужных" звуков называются квантованием . Чем меньше bitrate, тем жестче идет квантование.

По каким же критериям оценивается "нужность" и "ненужность" звуков? Подавляющее число кодеков выбрасывает звуки, которые считаются выходящими за порог слышимости человека. При этом за значение порога, так сказать de fakto, принимается величина равная 16kHz. Несмотря на то, что этот порог признан азбучной величиной и вписан во все учебники по физике, этот подход неверен. Люди весьма разнообразны по своим физиологическим особенностям. Кроме того, нужно учитывать, что у молодежи слуховой порог гораздо выше, чем у пожилых людей, и запросто может превышать эту среднестатистическую величину. Так же многое зависит от интенсивности сигнала. Следовательно, удаление частот выше 16kHz абсолютно неприемлемо для высоких битрейтов претендующих на CD качество, но вполне уместно для низких битрейтов, где качество приносится в жертву размеру.

Другим критерием, по которому оценивается "ненужность" звука, является условие основанное на такой особенности человеческого слуха, как неспособность большинства людей различать сигналы, по мощности лежащие ниже определенного уровня, причем этот уровень различен для разных частотных диапазонов. При использовании психоакустической модели кодирования MP3 CODEC автоматически выбрасывает маломощные, неслышимые частоты. К сожалению, опять таки, люди не одинаковы и те, кто в состоянии различить именно эти частоты, часто жалуются на потерю качества звучания при кодировании, тогда как среднестатистическое большинство этого не замечает.

Но самой главной особенностью психоакустической модели кодирования MP3 является так называемый эффект маскирования. Именно благодаря этому эффекту удается так сильно сжимать исходные аудиоданные. Суть этого эффекта в том, что слабый сигнал одного диапазона частот зачастую маскируется более мощным сигналом соседнего диапазона, если он присутствует в аудиозаписи, или мощным сигналом, предыдущего фрейма. Этот сильный сигнал вызывает временное понижение чувствительности уха к сигналу текущего фрейма. По сути, имеет место явление "временного оглушения". Для каждого звукового диапазона определяется величина маскирующего эффекта, создаваемого сигналом соседних диапазонов и сигналом предыдущего фрейма. Если маскирующий сигнал превышает мощность сигнала текущего диапазона, то данный диапазон сигнала не кодируется, что позволяет психоакустической модели удалить часть данных из этого фрейма. Для оставшихся данных каждого диапазона определяется, сколькими битами на фрейм мы можем пожертвовать, чтобы потери от дополнительного квантования были ниже величины маскирующего эффекта. Несомненно, все отмечали, что звук, кодированный при низких битрейтах, отличается крайней нечеткостью и глухостью. Это происходит из-за того, что при потере одного бита информации в общее звучания вносится шум квантования величиной порядка 6 dB.

Все эти ухищрения суммарно называются адаптивным кодированием. Используя тот факт, что подавляющее большинство людей не обладают идеальным слухом, технология адаптивного кодирования позволяет существенно уменьшить размер кодируемого файла выбросив наименее значимые с точки зрения слухового восприятия детали звучания.

Надо заметить, что в случае низких битрейтов кодирование начинается с адаптивного кодирования. После дополнительного квантования формируется итоговый поток, который затем и сжимается по алгоритму Хаффмана (аналогично алгоритму RAR).

Чем замечателен этот формат, так это тем, что степень сжатия, то есть, соотношение размер/качество полностью во власти пользователя. Ширина потока (bitrate) способна изменяться от наибольшего значения в 320kbs, до 64 kbs и ниже, соответственно варьируется и размер.

С технологиями сжатия используемых в MP3 CODEC мы ознакомились, настало время поговорить о разных битрейтах.

Качество требует жертв

Очевидно, что различные битрейты даже одного и того же CODECa дают далеко неодинаковое качество. Причем разные люди совершенно по-разному оценивают качество приемлемости одних и тех же битрейтов, высказывая свое собственное сугубо субъективное мнение. При оценке качественности звучания зачастую возникает путаница, так как многие путают факт наличия низкого или высокого уровня шумов с высоким или низким качеством сигнала. Такой дуболомный подход в принципе неверен, так как это характеристика обычной, некомпьютерной аппаратуры, которую некоторые лихо по аналогии переносят на цифровое аудио, забывая, что для компьютера это всего лишь характеристика конкретного программного MP3 плеера. Отсюда следует, что в некоторых случаях, сменив плеер можно существенно улучшить качество воспроизведения.

Так же, почему-то многие пользователи считают, что мнение профессионалов, так сказать "дегустаторов" от звука, обладающих хорошо развитым слухом и чувством фальши, не является авторитетным, а важно мнение середнячков со слухом отравленным дешевой аудиоаппаратурой уровня ESS. Это мнение может повлиять только на звание которое дают тому или иному CODECу – например "массовый", "народный", "популярный", но при оценке качественности кодировщика оно абсолютно неуместно.

При разработке формата MP3 его разработчики наняли команду профессиональных звуковых "дегустаторов", которые прослушали определенный набор тестовых композиций закодированных с разными битрейтами. Профессионалы единогласно указали, что битрейт 256kbs в большинстве случаев сохраняет качество звучания, которое практически не отличается от исходного. И так же единодушно указали, что уже битрейт 192kbs довольно ощутимо отличается от оригинала и не может претендовать на непогрешимость.

Но вы должны обратить внимание на оговорку "в большинстве случаев" которую эксперты сделали для битрейта 256kbs. В некоторых случаях, особенно при кодировании классической музыки этот битрейт проявляет себя не лучшим образом.

Если вы хотите точного соответствия сжатого файла оригиналу, пользуйтесь максимальный для кодирования CD Audio битрейтом - 320kbs. Коэффициент сжатия 4:1, для битрейта 256 kbs – 6:1. Размер несколько больше, зато качество смело можно считать непогрешимым.

Многие пользователи-меломаны уже создали себе обширные фонотеки на CDR или просто на винте, используя MP3 256kbs и 320kbs. Кстати, именно в этой связи повсеместно приобрели огромную популярность домашние компьютеры, оснащенные приводами CD-RW (пишущий CD-ROM).

Но самый популярный на текущий момент все же битрейт 128 kbs, который весьма быстро занял место формата RA. Причина такой популярности – в относительно небольшом размере (сжатие 12:1), что является определяющим фактором в условиях медленной передачи данных и дороговизны услуг провайдеров. Так же по размеру файла MP3 легко определить продолжительность звучания. У этого битрейта 1 минута звучания занимает примерно 1 мегабайт. Но качество у этого новоявленного "сетевого короля" на СD даже не претендует. Это качество средней аудиокассеты. В сети Интернет можно в основном найти MP3 только с битрейтом 128 kbs, MP3 с этим битрейтом и создавался первоначально как сетевой формат.

Путь к победе: триумф звука

После долгой раскачки данного формата, постепенно тысячи и тысячи пользователей наконец его оценили. Как грибы после дождя появилось множество сайтов, специализирующихся исключительно на распространении музыки в модном формате. Разумеется, практически все MP3-файлы были нелегальны или полулегальны, так как до пользователей не доходило, что распространяя купленную за свои деньги и переведенную в MP3 формат музыку, они нарушают законы об авторских и смежных правах. Или доходило, но... Но вот поймать и тем более наказать нелегальных распространителей оказалось невероятно сложно. Более того, благодаря небольшому размеру MP3 с bitrate 128 kbs оказалось возможным записать на один компакт-диск не 74 минуты музыки как раньше, а более 650 минут! Этим немедленно воспользовались пираты. Они стали производить диски типа "все альбомы хитовой группы на одном диске". Аудиозаписывающие компании стали нести убытки. Зачем покупать один альбом, если за те же деньги можно купить десять альбомов на одном CD?
Попытку побороть нелегальное распространение музыки MP3 недавно предпринял звукозаписывающий гигант RIAA. Но было уже поздно. MP3 индустрия достигла невиданного размаха. Стали появляться аппаратные мини-плееры с памятью на 32 мегабайта и возможностью подключения к компьютеру, их уже появилось более 40 моделей. Плееры для автомобилей на базе небольших по объему (1Гб) винчестеров. Даже звуковые карты с аппаратной поддержкой MP3. С этой волной бороться стало невозможно. MP3 стал первым признанным форматом хранения аудиоданных после CD-Audio. Это была победа.

Эта музыка будет вечной...

Пусть MP3 уже не лучший. Ему на смену идут новые формать: семейство AAC (advanced audio codec), VQF, PAC (perceptual audio codec). Но он был первым. Кроме того, многочисленная аудитория пользователей MP3 весьма консервативен, MP3 удалось глубоко поразить своих поклонников, тогда как его конкуренты способны их разве что слегка удивить. Так что думаю этому стандарту уготованы еще долгие годы существования, прежде чем его сменит более достойный.

Глоссарий

  • MP3 (MPEG Layer3) - цифровой формат мультимедиасжатия семейства MPEG, предназначенный исключительно для кодирования звука. Имел предшественников в лице МР1 и МР2, отличатся высокой сложностью алгоритма, как следствие высокими требованиями к системным ресурсам. Лучший в своем классе по соотношению размер/ качество.
  • CODEC - расшифровывается как COder/DECoder. Это не что иное как совокупность алгоритмов кодирования и декодирования звука.
  • Bitrate - ширина потока. Количество бит, использующиеся для кодирования звукового потока. Измеряется в kbs, т.е. число килобит в секунду.
  • Квантование – процесс удаления частот, не воспринимаемых обычным человеческим слуховым аппаратом (ухом).
  • CD Audio - старейший формат цифрового звука, существует более 20 лет. Параметры 44Khz, 16-bit стерео.
  • RA - формат, расшифровывается как Real Audio. Первый сетевой формат, обеспечивающий передачу и воспроизведение звука в реальном времени. Если сравнивать с МР3, то имеет битрейт 8 и 16 kbs, и соответственно ужасное качество звука.

Сегодня большинство аудиозаписей, которые человек слушает практически каждый день, представлено в виде универсальных MP3-файлов, поскольку именно они являются наиболее распространенными и востребованными в плане формата хранения звуковой информации. Сейчас будет рассмотрена природа такого типа данных, история возникновения самого кодека и принципы кодирования. Кроме того, будут приведены практически советы по поводу того, как переконвертировать MP3-файл в другой формат или создать MP3 из файлов другого типа, отличного от упомянутого. Делается это достаточно просто, правда, при условии использования специальных программ.

Что представляет собой MP3-формат?

На сегодняшний день мало кто задумывается над тем, что собой представляет звук в таком формате. В принципе, если не лезть в дебри принципов кодирования аудио, достаточно сказать, что это звуковая информация в сжатом виде.

Раньше базовым форматом, в котором хранились музыкальные файлы, был WAV. Такая информация занимала уж слишком много места на жестком диске, и со временем этот тип данных стал достаточно неудобным. В частности, это коснулось тех времен, когда музыка начала активно размещаться в сети Интернет. Именно тогда и назрела необходимость сжатия аудио с целью уменьшения объема исходного материала. Действительно, если перевести формат из WAV в MP3, экономия места становится заметной сразу же (трек занимает раз в 10 меньше места, к тому же структура нового формата была таковой, что в описании можно ввести даже определенную информацию о треке, скажем, название исполнителя, самого трека, альбома, года выпуска, а также разместить некоторые основные технические характеристики аудио).

За это в структуре файлов отвечают специальные текстовые поля, называемые ID3-тегами, после заполнения которых вся информация может быть отображена в окне проигрывателя.

История возникновения

В современном мире существует достаточно много разногласий по поводу того, кто именно создал этот тип данных. Хотя и принято считать, что MP3-формат является, так сказать, разновидностью более общего понятия MPEG, созданного корпорацией истинным разработчиком технологий кодирования в MP3 стала группа института Fraunhofer, которая первой предложила использование кодека Lame MP3 Encoder. Он-то и явился первым стандартом в этой области.

Случилось это в середине 90-х, правда, тогда такое аудио (файлы MP3) можно было воспроизвести исключительно при помощи программных проигрывателей, так что о повсеместном внедрении новой технологии речь пока не шла. Только после того, как были выпущены первые бытовые проигрыватели и портативные плееры, этот стандарт начал применяться в качестве единого. Однако и у него сегодня есть достаточно много конкурентов. Связано это только с основными принципами кодирования, за счет которых можно уменьшить объем исходного материала.

Принципы кодирования и сжатия звука

Самое главное в процессе, когда исходный материал требуется перевести в формат MP3, - это вырезание всего того, что на бытовом уровне человеческим ухом не воспринимается. Грубо говоря, что трек будет иметь битрейт 320 кбит/с, что 128 кбит/с при стандартной частоте дискретизации 44 100 Гц - заметить разницу в звучании достаточно трудно. Именно поэтому в процессе сжатия понижается определенная характеристика аудио.

Воспринять такую разницу может только человек с уж очень тонким слухом или же звукорежиссер, использующий в работе специализированные программы. Де-факто со сжатым форматом MP3 в студии практически никто не работает. Он задействован только на стадии финального мастеринга и пост-продакшна, когда все треки нужно выровнять по громкости, произвести нормализацию, поле чего выпустить полноценный альбом. На этом остановимся чуть позже.

Основные звуковые характеристики

Как известно, любой аудиоматериал имеет несколько основных параметров, по которым определяется качество его звучания. И MP3-формат здесь исключением не является. Самыми главными характеристиками считаются частота дискретизации (наиболее распространенный стандарт 44,1 кГц), битрейт (за основной стандарт принято значение 128 кбит/с) и режим звучания (моно, стерео, surround 5.1, 6.1 или 7.1). В общем-то, последний параметр учитывается не всегда, а основной упор при определении качества любого трека сводится исключительно к первым двум характеристикам.

Самые распространенные форматы музыки, других звуковых файлов и связь между ними

Что же касается прямых конкурентов универсального формата MP3, сегодня их можно насчитать достаточно много. Как уже понятно, в иду своей несостоятельности в плане бытового хранения формат WAV в качестве конечного уже давно не используется. Зато для профессиональных звуковых студий он остается, так сказать, базовым вариантом для работы. Особенно при записи вокала или живых инструментов. Переводится записанный материал из WAV в MP3 только на финальной стадии.

Однако музыка может быть представлена и в некоторых других популярных сегодня форматах. Так, например, очень часто (особенно в интернете) используются такие типы данных, как OGG, AIFF, AMR и многие другие. Но настоящим конкурентом для MP3 стал новейший и более качественный типа аудио FLAC. Конечно, и для MP3 можно довести все показатели до максимальных значений, однако FLAC по качеству воспроизведения стоит на порядок выше. Кроме того, он представляет собой единичный файл, а разделение на треки происходит непосредственно за счет программного или бытового плеера. Иными словами, каждую дорожку отдельно слушатель не видит, но может переключаться между треками в проигрывателе. Для MP3-формата, казалось бы, тоже можно создать один файл, объединив в нем несколько треков. Но вот быстрое переключение между дорожками в таком варианте станет невозможным (придется использовать обычную ускоренную перемотку, не более того).

Однако не все так плохо. Дело в том, что все известные сегодня форматы музыки или аудиокниг можно запросто конвертировать между собой, причем даже с сохранением начальных параметров звукового материала. На этом и основаны практически все программы для обработки и конвертации звука, называемые аудиоредакторами и конверторами. Любая программа такого типа (редактор MP3 или конвертер) распознает и исходный, и конечный тип звукового файла, а также, как уже понятно, может производить и прямое, и обратное преобразование. Поясним это на конкретном примере.

Волновое представление файлов MP3 в аудиоредакторах

Для обработки звука сегодня применяется несколько типов программного обеспечения. Для начала остановимся на узконаправленных приложениях, называемых аудиоредакторами. Среди них наиболее видными представителями можно назвать таких грандов, как Sony Sound Forge, Sintrillium Cool Edit Pro, впоследствии выкупленного корпорацией Adobe и сменившего название на Audition, Acoustica Mixcraft, ACID Pro и многих других.

Принцип работы в них состоит в том, что для удобства любая программа MP3-аудио представляет в классическом волновом виде, как это изначально использовалось для WAV-файлов. Такой подход и предопределяет появление достаточно широких возможностей для редактирования звукового материала любого типа как обычного формата WAV. Кроме того, что здесь можно осуществлять простейшие операции копирования, вырезания, вставки и т. д., совершенно простым дело становится изменение частотных характеристик и битрейта, не говоря уже об использовании огромного количества дополнительных эффектов, которые подключают к студии через мост DirectX или универсальных хост VST.

В самом простом варианте перевести формат в MP3 можно с использованием стандартного файлового меню, в котором имеется строка «Сохранить как…» (Save As…) или же присутствует функция экспорта. Таким образом, весь процесс сводится только лишь к выбору конечного формата (у нас в качестве примера MP3) и активации режима сохранения. При будет произведено автоматически с сохранением текущих настроек параметров и частотных характеристик. Не нравится начальный вариант? Нет ничего проще изменить формат на MP3, предварительно указав более высокие параметры. Однако тут стоит учесть один момент: если качество исходного материала уж слишком плохое, добиться его особого улучшения даже профессиональными средствами не получится. Тут придется применять специальные инструменты для реставрации аудио, задействования разного рода фильтров и т. д. У человека непосвященного это вызовет достаточно много трудностей.

Как уже понятно, нет абсолютно никакой разницы, что перед нами - аудиокниги в формате MP3, музыка или просто записанная речь или шумы. Кстати сказать, негласно принято, что аудиокниги имеют намного более низкое качество звучания. Это и понятно, ведь файл должен занимать минимум места, а характеристики звука при восприятии речи, в общем-то, не так уж и важны. В конце концов, это же не профессиональная запись какого-то альбома известной группы?

Впрочем, если использовать некоторые стандартные операции даже без специфических знаний, добиться неплохого результата все-таки можно, тем более что в любом приложении такого типа есть встроенные шаблоны, на основе которых производится то или иное действие. Конечно, идеального звучания с первого раза добиться будет очень сложно, однако, если изучить программу и освоить принципы ее работы, дальше дело пойдет как по маслу, а результат не заставит себя ждать.

Конверторы аудио

С конверторами аудио ситуация и того проще. Программы этого типа были разработаны специально для того, чтобы преобразовывать звуковые форматы между собой быстро и без явного участия пользователя. В отличие от аудиоредакторов, конверторы, можно сказать, используют некий пакетный режим, то есть позволяют в одной операции, например, переконвертировать MP3-файл не в единичном экземпляре, а сделать несколько штук сразу. В зависимости от возможностей самого приложения, их может быть от нескольких десятков до нескольких сотен.

Опять же, принцип работы с такими программными пакетами достаточно прост. Необходимо всего лишь выбрать начальный материал (причем, зачастую это могут быть файлы совершенно разных типов), а затем установить конечный формат. Далее нажимается специальная кнопка начала процесса, а на выходе пользователь получает все файлы одного заданного типа. Их сохранение, как правило, происходит в папке, установленной в настройках приложения по умолчанию, но место сохранения, естественно, можно поменять по своему усмотрению. Кстати, то же самое касается и основных характеристик, которые будут применяться в процессе преобразования. Но любая программа изначально предлагает пользователю определенный набор стандартов, которые используются для звуковых файлов того или иного типа. Их тоже можно изменять.

Преимущество таких приложений состоит в том, что они весь процесс конвертирования максимально автоматизируют, а на выполнение всех процессов требуется не так уж много времени. Правда, если сравнить их с музыкальными или аудиоредакторами, в плане повышения того же качества звучания здесь особо не разгонишься.

Музыкальные секвенсоры

Перед нами еще один тип программных продуктов, которые в большинстве своем имеют встроенный редактор MP3, WAV и т. д. В этом смысле работают они по схожим с аудиорекаторами принципам, однако их возможности несколько шире.

Прежде всего это касается того, что вся музыкальная композиция может состоять из фрагментов разных типов (MP3, MIDI, WAV, OGG, библиотеки VST- или DX-инструментов и т. д.). После или прописывания партий всех дорожек, например, с виртуальными синтезаторами, произведя результирующий файл можно сохранить в нужном формате. Чаще всего это либо MP3, либо WAV, либо файл проекта самой программы. В некоторых приложениях имеется еще и функция записи на диск. Хотите сделать аудио CD? Нет проблем! Равно как и в аудиоредакторах, можно за несколько минут произвести нужные операции и получить на выходе диск с дорожками в

Если говорить о преимуществах этого типа приложений, очевидно, что как раз таки объединение нескольких форматов с последующим сохранение или экспортом в какой-то из самых распространенных и является их самой сильной стороной. Кроме того, следует обратить внимание и на то, что то же наложение эффектов или изменение любого параметра звуковой дорожки происходит в режиме реального времени, то есть результата ждать не нужно - его можно услышать моментально, допустим, при повороте какой-то ручки, регулирующей тот или иной параметр. Естественно, это только малая часть из того, на что способны такие программные пакеты.

Что лучше использовать?

Наконец, мы подходим к вопросу выбора программного обеспечения для работы с MP3-форматом или любым другим, в котором записан звук. Как уже понятно, для обычного прослушивания музыки или аудиокниги хватит и простенького плеера (программного или «железного») или же самого обычного DVD-проигрывателя.

Для преобразования файлов в другие форматы, так сказать, по-быстрому, прекрасно подойдут конверторы аудио. Но вот если на выходе необходимо получить кристально чистый звук, даже путем преобразования одного типа файла в другой, без мощного специализированного ПО не обойтись. Конечно, времени это займет на порядок больше, да и без специальных знаний получить тот же MP3-файл высшего качества с первого раза может и не получиться. Впрочем, если основательно изучить хотя бы аудиоредакторы, не говоря уже о профессиональных музыкальных студиях, результат превзойдет все ожидания.

Вместо послесловия

Остается добавить, что формат MP3 здесь был рассмотрен достаточно кратко, ведь если копнуть глубже, особенно залезть в технологии реставрации и восстановления звука с использованием средств повышения качества материала, тут можно целую монографию написать.

Но что касается понимания структуры самого MP3-формата, думается, большинству пользователей будет понятно, что это такое и какие принципы заложены в его формирование и преобразование. Однако же, если заглянуть в будущее, пока можно прогнозировать только то, что и этот тип аудио, считающийся сегодня стандартом, в ближайшее время претерпит кардинальные изменения. Причем, судя по всему, основной упор будет сделан именно на повышение качества звука без существенного увеличения размера самих файлов. Впрочем, для таких предпосылок есть все основания, ведь те же компьютерные технологии сегодня развиваются бешеными темпами.

Однажды мне понадобилось решить простенькую (как мне тогда казалось) задачу – в PHP-скрипте узнать длительность mp3-файла. Я слышал о ID3 тегах и сразу подумал, что информация о длительности хранится либо в тегах, либо в заголовках mp3-файла. Поверхностные поиски в интернете показали что за пару-тройку минут решить эту задачу не получится. Поскольку от природы я довольно любопытен а время не поджимало - решил не использовать сторонние инструменты а разобраться в одном из самых популярных форматов самостоятельно.

Если Вам интересно, что там внутри – добро пожаловать под кат (трафик).

В данной статье мы не будем подробно останавливаться на извлечении ID3v2 тегов – это можно вынести в отдельную статью, так как там есть различные нюансы. А так же на фрагментах заголовков, которые практически не используются в настоящее время (например, часть Emphasis заголовка mp3-фрейма). Так же мы не рассматриваем структуру самих аудиоданных - тех самых, которые слышим из колонок.

ID3 теги

ID3 (от англ. Identify a MP3) - формат метаданных, наиболее часто используемый в звуковых файлах в формате MP3. ID3 подпись содержит данные о названии трека, альбома, имени исполнителя и т. д., которые используются мультимедиапроигрывателями и другими программами, а также аппаратными проигрывателями, для отображения информации о файле и автоматического упорядочивания аудиоколлекции.

Wikipedia

Существует две абсолютно разных версии ID3-данных: ID3v1 и ID3v2.

ID3v1 – имеет фиксированный размер в 128 байт, которые дописываются в конец mp3-файла. Там можно хранить: название трека, исполнитель, альбом, год, комментарий, номер трека (для версии 1.1) и жанр.

Довольно быстро всем стало понятно, что 128 байт – очень уж небольшое место для хранения таких данных. И поэтому, со временем, появилась и успешно используется вторая версия данных – ID3v2 .
В отличии от первой версии, теги v2 имеют переменную длину и размещаются в начале файла, что позволяет поддерживать потоковое воспроизведение. (Формат ID3v2.4 позволяет так же хранить данные и в конце файла).
Данные ID3v2 состоят из заголовка и последующих фреймов ID3v2. Например, в версии ID3v2.3 существует более 70 типов фреймов.

  • маркер всегда равен ‘ID3’
  • В данный момент имеются три версии ID3v2.2, ID3v2.3 и ID3v2.4
    Версия v2.2 считается устаревшей.
    v2.3 – самая популярная версия.
    v2.4 – набирает популярность. Одно из отличий от v2.3 в том, что позволяет использовать кодировку UTF-8 (а не только UTF-16)
  • Флаги . В настоящее время используются только три (5,6,7) бита:
    bin: %abc00000
    a ‘unsynchronisation’ – используется только с MPEG-2 и MPEG-2.5 форматами.
    b ‘Extended header’ – указывает на наличие расширенного заголовка
    с ‘Experimental indicator’ – эксперементальный индикатор
  • Длина . Особенность указания длины данных ID3v2 в том, что в каждом байте 7-й бит не используется и всегда установлен в 0.
Рассмотрим пример:

В данном случае вместе с заголовком ID3v2 (10 байт) – данные ID3v2 занимают 1024 байта.

После ID3v2-заголовка идут собственно теги. Подробный разбор чтения тегов ID3v2, как сказано выше, я решил не включать в эту статью.

Теперь у нас есть информация о наличии и длине тегов ID3 и мы можем приступать в разбору mp3-фрейма и понять-таки – где же хранится длительность. А заодно понять и всё остальное.

MP3-фрейм

Весь mp3-файл состоит из фреймов, которые можно извлекать только последовательно. Фрейм содержит в себе заголовок и аудио-данные. Поскольку мы не ставим себе целью написать прошивку для магнитофона – нас интересует именно заголовок фрейма.

О нем подробнее (куча таблиц и сухой информации)

Размер заголовка – 4 байта.

Описание:

Режимы сжатия данных или какой бывает битрейт

Существует 3 режима сжатия данных:

CBR (constant bitrate) – постоянный битрейт. Не меняется на всем протяжении трека.

VBR (variable bitrate) – переменный битрейт. При этом сжатии битрейт постоянно меняется на протяжении трека.

ABR (average bitrate) – усредненный битрейт. Это понятие используется только при кодировании файла. На «выходе» получается файл с VBR.

CBR

Если файл закодирован с постоянным битрейтом – то мы уже можем наконец-то! получить длительность нашего трека по следующей формуле:
Длительность = Размер аудиоданных / Битрейт (в битах!) * 8

Например, файл имеет размер 350670 байт. Есть ID3v1 теги (128 байт) и ID3v2 теги (1024 байта). Битрейт = 96. Следовательно размер аудиоданных равен 350670 – 128 – 1024 = 349518 байт.
Длительность = 349518 / 96000 * 8 = 29,1265 = 29 секунд

VBR

Необходимо пояснить – как определить режим сжатия. Всё просто. Если файл сжат с VBR – то добавляется VBR-заголовок. По его наличию мы и можем понять, что используется переменный битрейт.
Есть два вида заголовков: Xing и VBRI.
Xing размещается со смещением от начала первого mp3-фрейма в позиции, согласно таблице:

Например: у нас ID3v2 тег занимает 1024 байта. Если наш mp3-файл имеет режим канала «Стерео» - то заголовок VBR Xing будет начинаться со смещения 1024 + 32 = 1056 байт.

Заголовок VBRI всегда размещается со смещением +32 байта от начала первого mp3-фрейма.

Первые четыре байта в обоих заголовках содержат маркер ‘Xing’ или ‘Info’ для Xing. И ‘VBRI’ для VBRI.

Эти VBR заголовки имеют переменную длину и содержат различную информацию о кодировании файла. Подробнее о структуре заголовков VBR (и не только) можно почитать, например, .

Я же расскажу только о том, что нас интересует в данный момент. А именно – количество фреймов (Number of Frames). Это число длиной 4 байта.
В заголовке Xing оно содержится по смещению +8 байт от начала заголовка. В VBRI +14 байт от начала заголовка.

Используя таблицу Сэмплов на фрейм (Sampler Per Frame) мы можем получить длительность mp3-файла, закодированного с переменным битрейтом.

Длительность = Количество фреймов * Сэмплов на фрейм / Частоту дискретизации

Например: из заголовка VBRI получили количество фреймов 1118, сэмплов на фрейм = 1152. Частота дискретизации = 44100.
Длительность = 1118 * 1152 / 44100 = 29.204 = 29 секунд.

На этом на сегодня всё. Если был кому-то полезен - спасибо .

Для тех, кто захочет немедленно поковырять внутренности mp3 -

Free Audio Converter – бесплатный конвертер, который работает с массой известных аудио форматов. Работая с Free Audio Converter на русском языке Вы самостоятельно делаете MP3 файлы прекрасного качества через альтернативные пресеты. Еще одна полезная функция – сжимать файлы, причем абсолютно не теряя в качестве записи. Фишка Free Audio Converter для Windows 7, 8, 10 в его гибких настройках. При работе с отдельным форматом предлагается своя подборка профайлов, а также редактор изменения настроек.

То есть, в процессе работы Вы самостоятельно имеете возможность создавать новые, изменять и даже удалять старые настройки. Конвертируя с Фри Аудио Конвертер, Вы без проблем работать единовременно с несколькими файлами. Учитывая, что это на сто процентов бесплатная программа, безопасная в установке и эксплуатации, конвертер чист от вирусов и программ — шпионов. Последнюю версию Free Audio Converter скачать бесплатно на русском языке по прямой ссылке с официального сайта без регистрации и смс Вы можете у нас на сайт.

Главные особенности Free Audio Converter на русском языке:

  • Всевозможные операции с записями расширения aac, ac3, aiff, ape, flac, m4a, m4b, mka, mp3, ogg, ra, tta, wav, wma;
  • Самостоятельное создание записей в формате mp3;
  • Манипуляции с настройками программы;
  • Стопроцентная безопасность Вашего компьютера, при установке конвертера, от вирусов и программ-шпионов.

Приложение позволяет преобразовывать любые аудиофайлы в удобный вам формат совершенно бесплатно. Веб-сервис поддерживает синхронизацию с Google Drive и Dropbox для получения файлов из данных систем. Извлечь их можно также из внешних источников посредством URL ссылок.

Удобный интерфейс

Пользование сервисом не требует больших усилий. Достаточно выполнить 3 шага: загрузить нужную аудиозапись на сайт, затем выбрать качество будущего трека и нажать «Конвертировать» для завершения процесса.

Пакетная конвертация

В отличие от многих прочих программ такого типа аудио конвертер онлайн может конвертировать сразу несколько записей за короткий промежуток времени, помещая готовую работу в архив.

Работа с любыми форматами

Для работы в этом приложении можно выбрать практически любой первичный формат файлов для конвертирования (около 300 вариантов). Аудиозапись можно преобразовать в 8 форматов, среди которых mp3, wav, m4a, mp2 и другие.

Расширенные настройки

Каждому пользователю предоставлена возможность выбирать дополнительные характеристики будущего трека. Например, можно изменять частоту и объём памяти, которую будет занимать файл, а также устанавливать мягкое вступление или вовсе удалять голос из композиции, оставив лишь мелодию.

Работает в браузере

Для того, чтобы начать работу с конвертером достаточно загрузить на компьютер браузер, если у вас его нет, и начать конвертирование. Возможность работать без скачивания сохраняет память компьютера и освобождает её для важных данных. Кроме того, непосредственная работа в браузере сокращает время, затраченное на подготовку программы к созданию треков.

Извлечь звук из видео

Система способна вырезать музыку из любого видео. Так можно получить саундтреки из фильмов и различных видеороликов сети. Это очень удобно для случаев, когда нужно получить музыку, название которой вы не знаете.

Безопасность

Сервис гарантирует полную безопасность ваших данных. Это обеспечивается системой мгновенного удаления полученной от клиента информации сразу же после окончания работы.

Поддержка тегов

Дополнительной опцией является введение тегов на некоторые форматы (AAC, AIFF, FLAC, M4A, M4R, MMF, MP3, OGG, OPUS, WAV, WMA). Изменение названия, трека, альбома и даже исполнителей – всё это также обеспечивается ресурсом аудио конвертер онлайн.



Рекомендуем почитать

Наверх