Advanced Audio Coding — Википедия

Advanced Audio Coding
Расширение .aac, .m4a, .m4p, .m4b, .mp4 или .3gp
MIME-тип audio/aac[2], audio/aacp, audio/mp4a-latm, audio/mpeg4-generic, audio/x-aac, audio/x-m4a, audio/x-m4p, audio/x-m4b, audio/mp4a, audio/mpga и audio/x-mp4a-latm[3]
Разработчик Bell Labs, Институт интегральных схем общества Фраунгофера, Dolby Laboratories, Sony, Nokia, Coding Technologies[вд] и Общество Фраунгофера[4]
Опубликован 1997 (1997)[1]
Тип формата Формат сжатия аудио, сжатие данных с потерями
Содержится в MPEG-4 Part 14, 3GP и 3G2, ISO base media file format и Audio Data Interchange Format (ADIF)
Стандарт(ы) ISO/IEC 13818-7,
ISO/IEC 14496-3
Логотип Викисклада Медиафайлы на Викискладе

Advanced Audio Coding (AAC, англ. Advanced Audio Coding) — собственнический (патентованный) формат сжатия аудио, который используется для хранения и передачи музыки и звука. AAC является преемником формата MP3 и предлагает более высокое качество звука при более низком битрейте. Этот формат был разработан как часть стандарта MPEG-2 и затем был улучшен в формате MPEG-4[5]. Сегодня AAC широко используется в различных приложениях, включая мобильные устройства, телевизоры, видеоигры и многие другие.

Также AAC — это многоканальный алгоритм кодирования аудио, поддерживающий потоковую передачу.

Формат AAC, официально известный как ISO/IEC 13818-7, вышел в свет в 1997 году как новая, седьмая часть семейства MPEG-2. Существует также формат AAC, известный как MPEG-4 Часть 3.

Не следует путать данный формат с аудиокодеком Apple Lossless (ALAC). Для обоих форматов используется одинаковый контейнер, но в случае Apple Lossless информация не теряется.

Как работает AAC

[править | править код]
  1. Удаляются невоспринимаемые человеком составляющие сигнала.
  2. Удаляется избыточность в кодированном аудиосигнале.
  3. Затем сигнал обрабатывается по методу МДКП согласно его сложности.
  4. Добавляются коды коррекции внутренних ошибок.
  5. Сигнал сохраняется или передаётся.

Контейнер MPEG-4 не требует единственного или малого набора высокоэффективных схем компрессии.

  • Семейство алгоритмов аудиокодирования MPEG-4 охватывает диапазон от кодирования низкокачественной речи (до 2 кбит/с) до высококачественного аудио (64 кбит/с на канал и выше).
  • AAC имеет частоту дискретизации от 8 до 96 кГц и количество каналов от 1 до 48.
  • В отличие от гибридного набора фильтров MP3, AAC использует модифицированное дискретное косинусное преобразование (MDCT) вместе с увеличенным размером окна в 2048 пунктов. AAC более подходит для кодирования аудио с потоком сложных импульсов и прямоугольных сигналов, чем MP3.

AAC может динамически переключаться между длинами блоков МДКП от 2048 пунктов до 256.

  • Если происходит единственная или кратковременная смена, используется малое окно в 256 пунктов для лучшего разрешения.
  • По умолчанию используется большое 2048-пунктовое окно для улучшения эффективности кодирования.

Преимущества AAC перед MP3

[править | править код]
  • Больше частот дискретизации (от 8 до 96 кГц) по сравнению с MP3 (от 16 до 48 кГц);
  • До 48 каналов (MP3 поддерживает до двух каналов в режиме MPEG-1 и до 5.1 каналов в режиме MPEG-2);
  • Произвольные битрейты и переменная длина кадра (англ. frame length). Стандартизированный постоянный битрейт с битовым резервуаром;
  • Большая эффективность и более простой банк фильтров. AAC использует чистое МДКП (модифицированное дискретное косинусное преобразование), в отличие от гибридного кодирования MP3 (которое было частично на основе МДКП и частично на основе FFT);
  • Большая эффективность кодирования для стационарных сигналов (AAC использует блочный размер 1024 или 960 выборок, что позволяет более эффективное кодирование, чем блоки из 576 выборок в MP3);
  • Более высокая точность кодирования для переходных сигналов (AAC использует блочный размер 128 или 120 выборок, что позволяет более точное кодирование, чем блоки из 192 выборок в MP3);
  • Возможность использования оконной функции, производной от окна Кайзера-Бесселя, для устранения утечки спектра за счет расширения главного лепестка;
  • Намного лучшая обработка звуковых частот выше 16 кГц;
  • Более гибкий совместный стереозвук (англ. joint stereo). Разные методы могут использоваться в разных диапазонах частот;
  • Дополнительные модули (инструменты) добавлены для увеличения эффективности сжатия: шумоформирование (TNS), обратное предсказание, замена воспринимаемого шума (PNS) и т. д. Эти модули могут быть объединены для создания различных профилей кодирования.

Подразделяется на профили

[править | править код]
  • Main Profile — «основной профиль»;
  • Low Complexity (LC-AAC) — «низкая сложность»;
  • High-Efficiency Advanced Audio Coding (HE-AAC) — «высокая эффективность»;
  • Extended High Efficiency Advanced Audio Coding (xHE-AAC) — «расширенная высокая эффективность»[6];
  • Scalable Sample Rate (SSR) — «масштабируемая частота дискретизации»;
  • Long Term Prediction (LTP) — «долгосрочное предсказание». Более сложный и ресурсоёмкий (но и более качественный), чем все остальные.

High Efficiency Advanced Audio Coding (ААС+)

[править | править код]

ААС+ — профиль, ориентированный на низкий битрейт. Представляет собой комбинацию AAC LC, но с частотой дискретизации вдвое меньшей, чем у оригинала, что существенно уменьшает накладные расходы на битрейт, затем используется технология восстановления спектра (англ. Spectral Band Replication) путём его предсказания и использования некоторой дополнительной информации для восстановления. Естественно, такой подход не обладает большой точностью и пригоден только в случаях, когда очень необходимо уменьшить битрейт.

  • .aac — AAC-MPEG2;
  • .mp4 — один из профилей в контейнере MP4 (спецификация MPEG-4 часть 14 предусматривает упаковку в контейнер не только нескольких аудиопотоков, но и нескольких видеопотоков, а также нескольких потоков субтитров).

Несмотря на то, что в спецификации MPEG-4 Part 14 (формат файла MP4) определено только одно расширение для контейнера — .mp4, компания Apple применяет контейнер для упаковки AAC-потоков, но использует расширения, не предусмотренные стандартом MPEG-4 Part 14:

  • .m4a — стандартное расширение;
  • .m4b — файл AAC, поддерживающий закладки; используется для аудиокниг и подкастов;
  • .m4p — защищённый файл AAC; используется для защиты файла от копирования при легальной загрузке защищённой авторскими правами музыки в онлайн-магазинах, например в iTunes Store;
  • .m4r — файл рингтона, используемый в Apple iPhone и Windows 10 Mobile

ГОСТ Р 54713-2011

[править | править код]

С 01.12.2012 AAC введён в качестве государственного стандарта кодирования сигналов звукового вещания с сокращением избыточности для передачи по цифровым каналам связи в Российской Федерации.[7]

Примечания

[править | править код]
  1. ISO. ISO/IEC 13818-7:1997, Information technology -- Generic coding of moving pictures and associated audio information -- Part 7: Advanced Audio Coding (AAC) (1997). Дата обращения: 18 июля 2010. Архивировано из оригинала 21 марта 2013 года.
  2. https://www.iana.org/assignments/media-types/media-types.xhtml#ISO-IEC_JTC_1
  3. https://github.com/file/file/blob/master/magic/Magdir/animation
  4. http://www.iis.fraunhofer.de/en/ff/amm/prod/audiocodec/audiocodecs/heaac.html#tabpanel-5
  5. Brandenburg, Karlheinz MP3 and AAC Explained (1999). Архивировано из оригинала 13 февраля 2017 года.
  6. xHE-AAC (англ.). Fraunhofer Institute for Integrated Circuits IIS. Дата обращения: 6 сентября 2020. Архивировано 10 сентября 2020 года.
  7. ГОСТ Р 54713-2011 | НАЦИОНАЛЬНЫЕ СТАНДАРТЫ. protect.gost.ru. Дата обращения: 9 марта 2017. Архивировано 12 марта 2017 года.