AC3Filter ver $ver |
English | Russian | Italian |
Donate! | Download | Forum | Source forge project |
AC3Filter - это высококачественный бесплатный DirectShow фильтр, предназначенный для декодирования и обработки звука в реальном времени. Приоритет на широкую функциональность и удобство настройки. Декодирование форматов AC3/DTS/MPEG Audio. Поддержка многоканального и цифрового (SPDIF) выхода.
Запустить программу установки и следовать инструкциям. Для использования многоканальных режимов и режима цифрового выхода после установки могут потребоваться дополнительные настройки системы (см. 4. Настройки системы).
Запустить программу удаления из меню Пуск или из Панели Управления.
Все записанные настройки матриц, эквалайзеров и т.д. будут удалены!
Фильтр может быть установлен вместе с другими программами (кодек-паки, плееры...). В таком случае фильтр может быть удален только вместе с этой программой. Если Вы не знаете, вместе с какой программой был установлен фильтр, или хотите удалить фильтр без деинсталляции программы то удалить фильтр самостоятельно можно следующим способом:
В этом разделе будут описаны одноразовые настройки, которые необходимо выполнить после установки фильтра. Наиболее совместимым режимом работы является режим стерео 16 бит (не многоканальный) в котором фильтр работает по умолчанию. Этот режим совместим со всеми версиями Windows и любыми звуковыми картами. Для работы в этом режиме в дополнительных настройках нет необходимости. Для работы в многоканальных режимах или в режиме цифровой передачи могут потребоваться некоторые настройки системы.
Win95, Win98 | Win98SE | WinNT (3) | Win2000 | WinXP | |
---|---|---|---|---|---|
моно/стерео 16 бит | + | + | + | + | + |
многоканальный режим | - (?) | WaveOut (1) | SP6 | + | + |
SPDIF | - (?) | WaveOut (1) + патч (2) | - (?) | SP2 | + |
Установить конфигурацию колонок в настройках фильтра (см. 6.2. Основные настройки). Некоторые звуковые карты работают некорректно с нечетным количеством колонок (например, 2/2+SW 4.1 quadro или 3/0 3 front). Поэтому таких режимов следует по возможности избегать. Режимы Dolby Surround/ProLogic и Doby ProLogic2 не являются многоканальными режимами. Не следует также использовать режимы с сабвуфером (2/0+SW 2.1 stereo, 4/0+SW 4.1 quadro) если акустика не имеет отдельного входа для сабвуфера (см. 7.2. Что такое LFE?).
Установить режим колонок в Панели Управления: Control Panel->Sounds and Multimedia->Audio->Sound Playback->Advanced. Кроме того, часто драйвера звуковой карты имеют собственные утилиты для переключения конфигурации колонок. Необходимо установить нужную конфигурацию в обоих местах - и в настройках драйверов звуковой карты и в Панели Управления.
Для звуковых карт Creative необходимо отключить все звуковые эффекты и эквалайзеры - в противном случае возможно пропадание центрального/тыловых каналов.
Звуковая карта может работать в двух режимах: DirectSound и WaveOut. В некоторых случаях многоканальный режим может работать только в одном из этих режимов и не работать в другом. В этом случае необходимо изменить устройство вывода в настройках плеера. Поддерживает ли плеер изменение устройства вывода можно узнать в таблице совместимости в разделе 5. Настройка плеера (колонка Renderer). Если плеер не имеет такой настройки, то можно изменить системное устройство вывода по умолчанию (см. 6.5. Системные настройки). Однако эта опция изменяет глобальные настройки системы, поэтому пользоваться ей рекомендуется только в случае, если плеер не поддерживает данную возможность.
Режим SPDIF необходим только при цифровом подключении и наличии внешнего декодера/ресивера. Важно предварительно убедиться в правильности подключения ресивера (см. документацию на звуковую карту и ресивер).
Чтобы включить режим SPDIF в настройках фильтра необходимо отметить флажок SPDIF (см. 6.2. Основные настройки)
Цифровое соединение поддерживает разные форматы передачи данных (PCM, AC3, DTS, MPEG Audio). В документации на ресивер необходимо узнать форматы, поддерживаемые ресивером. В большинстве случаев поддерживается только формат AC3 - в этом случае никаких дополнительных настроек не нужно (он включен по умолчанию). Если ресивер поддерживает другие форматы, то их можно указать в настройках фильтра (см. 6.5. Системные настройки).
Некоторые драйверы обладают возможностью декодирования AC3. Если такая опция присутствует, ее необходимо отключить (см. руководство по звуковой карте).
Звуковая карта может работать в двух режимах: DirectSound и WaveOut. В некоторых случаях режим SPDIF может работать только в одном из этих режимов и не работать в другом. В этом случае необходимо изменить устройство вывода в настройках плеера. Поддерживает ли плеер изменение устройства вывода можно узнать в разделе 5. Настройка плеера (колонка Renderer). Если плеер не имеет такой настройки то, можно изменить системное устройство вывода по умолчанию (см. 6.5. Системные настройки). Однако эта опция изменяет глобальные настройки системы, поэтому пользоваться ей рекомендуется только в случае, если плеер не поддерживает данную возможность.
Большинство звуковых карт могут работать в режиме цифровой передачи только с частотой дискретизации 48000 Гц. Поэтому в остальных случаях цифровая передача невозможна вообще. Текущий режим цифрового вывода во время просмотра можно посмотреть в настройках фильтра на главной странице (см. 6.2. Основные настройки)
Не следует использовать режимы с сабвуфером (2/0+SW, 4/0+SW) если акустика не имеет отдельного входа для сабвуфера (см. 7.2. Что такое LFE?).
Для режимов с сабвуфером рекомендуется включить перенаправление басов. В документации на акустику необходимо найти информацию о частоте пропускания колонок и сабвуфера; частоту среза рекомендуется установить равной нижнему пределу для основных колонок и верхнему для сабвуфера. Например, если частотный диапазон основных колонок равен 100Гц-20кГц, а сабвуфера - 30Гц-100Гц, то частоту среза необходимо установить равной 100Гц. В большинстве случаев подходит настройка установленная по умолчанию, поэтому ничего изменять не требуется.
Некоторые звуковые карты имеют собственные настройки по управлению перенаправлением басов. Нельзя включать обе опции одновременно! Это может привести к значительным искажениям. Перенаправление басов должно быть включено либо только в фильтре, либо только в настройках звуковой карты.
После установки фильтр уже настроен и, в общем случае, не требует дополнительной настройки. Поэтому если Вы не разбираетесь во всей этой ерунде, то все будет работать и без дополнительной настройки. Изменять настройки рекомендуется только в случае проблем со звуком. Однако если Вы любознательны и любите покрутить настройки, то для более полного понимания настроек настоятельно рекомендуется ознакомиться с разделом 7. Теоретические сведения.
В этом разделе будут кратко рассмотрены наиболее распространенные плееры и возможность их работы совместно с AC3Filter'ом - возможности самих плееров и необходимые настройки.
Плеер | Сокр | Сайт | Лицензия | AVI | DVD | Filters | Renderer | Decoder | Supported | Подробности |
---|---|---|---|---|---|---|---|---|---|---|
Media Player Classics | MPC | (site) | OpenSource | + | + | + | + | + | + | (details) |
Windows Media Player v6.4 | WMP64 | (site) | Freeware | + | - | + | - | - | + | (details) |
Windows Media Player 7+ | WMP7+ | (site) | Freeware | + | + | - | - | - | + | (details) |
BSPlayer | BSP | (site) | Freeware | + | - | + | + | + | + | (details) |
ZoomPlayer | ZP | (site) | Freeware | + | - | + | + | + | + | (details) |
ZoomPlayerPro | ZPP | (site) | Shareware | + | + | + | + | + | + | (details) |
LightAlloy | LA | (site) | Freeware | + | + | + | + | - | + | (details) |
PowerDVD WinDVD |
PDVD WDVD |
(site) (site) |
Shareware Shareware |
+ + |
+ + |
- - |
- - |
- - |
AVI only AVI only |
(details) |
Разумеется, таблица далеко неполна, поэтому любые поправки и дополнения всячески приветствуются.
Один из самых многофункциональных плееров. Несмотря на непритязательный внешний вид и скромный размер (~1Mb) плеер по функциональности уступает лишь ZoomPlayer'у, а кроме того, имеет огромное количество встроенных декодеров (отпадает необходимость в установке кодек-паков и других внешних декодеров). Поддерживает проигрывание DVD, Flash-анимации (причем с возможностью перемотки!), RealVideo/RealAudio, QuickTime, и многого другого. Надежный, стабильный и непритязательный к ресурсам (мой любимый плеер :-).
Во время просмотра настройки фильтра вызываются щелчком правой кнопкой мыши на кадре и далее в выпадающем меню выбрать Filters->AC3Filter:
Настройки плеера вызываются в меню View->Options. Для того, чтобы плеер использовал AC3Filter необходимо изменить настройки плеера как показано на рисунке:
Если в системе было установлено несколько декодеров, то будет использоваться декодер, имеющий наивысший приоритет. Для изменения приоритета фильтра см. 6.5. Системные настройки. Плеер можно настроить так, чтобы AC3Filter использовался всегда, независимо от текущих настроек системы. Для этого в настройках плеера в разделе Overrides нажать кнопку AddFilter и в открывшемся списке выбрать AC3Filter. Должно получиться следующее:
Простой плеер, поставляемый со всеми версиями Windows начиная в Win98 (Win98, WinME, Win2000, WinXP, ...). Плеер находится в каталоге C:\Program files\Windows Media Player\mplayer2.exe. Плеер крайне надежен, нетребователен к ресурсам и использует только стандартные методы проигрывания, поэтому незаменим для выявления разнообразных проблем. Отсутствуют многие функции, однако с главной задачей - проигрывание файлов справляется отлично. При возникновении проблем с проигрыванием файлов в других плеерах рекомендуется попробовать этот плеер.
Во время просмотра настройки фильтра вызываются в меню File->Properties->Advanced:
Плеер не имеет настроек для того, чтобы использовался именно AC3Filter, поэтому если в системе было установлено несколько декодеров, то будет использоваться декодер, имеющий наивысший приоритет. Для изменения приоритета фильтра см. 6.5. Системные настройки.
У всего семейства плееров нет возможности вызвать настройки фильтров во время просмотра. Т.о. невозможно увидеть используется ли для декодирования AC3Filter или какой-либо другой декодер, невозможно изменять настройки во время проигрывания и наблюдать текущую активность (свойства текущего аудио-потока, входные/выходные уровни, активность DRC и т.д.). Единственное исключение составляет Windows Media Player 9 и только в режиме просмотра DVD. В этом случае настройки фильтра вызываются из меню Tools->Options (при просмотре .avi файлов и файлов других форматов данная опция работать не будет):
Во всех остальных случаях конфигурирование фильтра возможно только при помощи утилиты конфигурирования до начала просмотра фильма.
Плеер не имеет настроек для того, чтобы использовался именно AC3Filter, поэтому если в системе было установлено несколько декодеров, то будет использоваться декодер, имеющий наивысший приоритет. Для изменения приоритета фильтра см. 6.5. Системные настройки.
Многофункциональный плеер с поддержкой скинов.
Настройки фильтра вызываются щелчком правой кнопкой мыши на кадре и далее в выпадающем меню выбрать Options->Filters->AC3Filter:
Настройки плеера вызываются в меню Options->Preferences. Для того, чтобы плеер использовал AC3Filter необходимо изменить настройки плеера как показано на рисунке:
Самый многофункциональный плеер. Функций настолько много что перечислять их нет смысла.
Настройки фильтра вызываются щелчком правой кнопкой мыши на кадре и далее в выпадающем меню выбрать Filter Properties->AC3Filter:
Настройки фильтра вызываются как показано на рисунке:
Плеер не имеет настроек для того, чтобы использовался именно AC3Filter, поэтому если в системе было установлено несколько декодеров, то будет использоваться декодер, имеющий наивысший приоритет. Для изменения приоритета фильтра см. 6.5. Системные настройки.
Оба плеера не могут использовать AC3Filter для проигрывания DVD. Это связано с особенностями самих плееров, поэтому нет никакой возможности заставить их использовать AC3Filter. Т.е. заставить работать эти плееры с AC3Filter'ом принципиально невозможно! Поэтому для просмотра DVD с использованием AC3Filter'а рекомендуется использовать другие плееры - Media Player Classics, LightAlloy или ZoomPlayer.
При проигрывании этими плеерами AVI-файлов AC3Filter может использоваться как для пост-обработки, так и для декодирования AC3/DTS аудиодорожки. Однако плеер не позволяет вызвать настройки фильтра и настраивать фильтр можно только до просмотра при помощи утилиты конфигурирования.
После установки фильтр уже настроен и, в общем случае, не требует дополнительной настройки. Поэтому если Вы не разбираетесь во всей этой ерунде, то все будет работать и без дополнительной настройки. Изменять настройки рекомендуется только в случае проблем со звуком. Однако если Вы любознательны и любите покрутить настройки, то для более полного понимания настроек настоятельно рекомендуется ознакомиться с разделом 7. Теоретические сведения.
Два самых главных правила настройки:
Для настройки фильтра необходимо открыть окно свойств фильтра. Это можно сделать двумя способами:
На этой странице находятся самые необходимые настройки фильтра и информация о воспроизводимом звуке. Уровни и информация показываются только при вызове настроек из плеера:
В данном разделе находятся настройки выходного формата фильтра. Фильтр будет автоматически пересчитывать любой входной формат в указанную конфигурацию. Конфигурация колонок указывается в виде фронт/тыл+сабвуфер. Для некоторых конфигураций приведены общепринятые названия. Например, запись 2/0 - stereo - означает 2 фронтальные колонки, т.е. стерео. 2/2 - quadro - 2 фронтальные и 2 тыловые колонки - т.е. квадро. 3/2+SW 5.1 channels - 3 фронтальных колонки, 2 тыловых и сабвуфер - конфигурация 5.1. Желательно, чтобы указанная конфигурация колонок совпадала с настройками системы (см. 4.2. Настройки для многоканального режима), которые, в свою очередь должны совпадать с реальным количеством колонок. Чем отличается сабвуфер и канал LFE, а также как производить настройку см. в разделе 7.2. Что такое LFE?
Режимы Dolby Surround/ProLogic и Dolby ProLogic II необходимы только если компьютер имеет только стерео выход и подключен к Dolby ProLogic декодеру. В этом случае центральный и тыловые каналы микшируются в два канала так, чтобы внешний декодер мог выделить их из двух каналов обратно. Это не многоканальный режим! Это особая разновидность стерео режима необходимая только при наличии внешнего Dolby ProLogic декодера.
Второй список выбора задает выходной формат сэмпла. Фильтр будет автоматически пересчитывать любой входной формат в указанный формат. При декодировании задает точность декодирования. На настоящее время поддерживаются форматы 16/24/32 бит и формат с плавающей точкой.
Флаг SPDIF включает режим цифрового выхода. Этот режим необходим только при цифровом (SPDIF) подключении и наличии внешнего аппаратного декодера/ресивера. В этом случае кодированный поток будет передаваться на внешний декодер без изменений (при поддержке декодером этого формата), или перекодироваться в формат, понятный декодеру (за более подробной информацией см. 7.3. SPDIF). В скобках указывается текущее состояние режима цифрового выхода:
Форматы, поддерживаемые внешним декодером, указываются на странице системных настроек в разделе SPDIF passthrough (см. 6.5. Системные настройки).
Необходимо отметить, что текущий режим может изменяться во время просмотра при изменении формата входного потока. Например, при просмотре DVD есть возможность переключать звуковые дорожки. При этом формат дорожки также может изменяться. Если ресивер поддерживает только формат AC3, то при переключении со звуковой дорожки формата AC3 на звуковую дорожку формата DTS произойдет переключение с режима passthrough в режим AC3 encode.
Все настройки фильтра можно записать как единый набор настроек (пресет) и потом быстро загружать их. Вместе с фильтром устанавливается несколько стандартных пресетов:
Пресет Default имеет особое значение - он загружается при загрузке фильтра.
Не следует использовать эту опцию вместо громкости плеера или системной громкости. При сильном усилении возможно возникновение переполнения и заметное снижение качества проигрывания. Подробнее см. 7.1. Громкость и динамический диапазон.
Уровень Master задает желаемый уровень усиления в дБ. Если имеющейся шкалы недостаточно, можно указать желаемый уровень в поле ввода в любых пределах.
Уровень Gain отображает текущий уровень усиления. В отсутствии переполнения совпадает с уровнем Master. В случае переполнения система автоматической регулировки усиления понижает этот уровень. Таким образом, изменение уровня Gain может сигнализировать о том, что установлен слишком высокий уровень Master.
См. также опции Auto gain control и One-pass norm в разделе 6.3. Настройки микшера.
Флаг DRC Enabled включает/отключает функцию сжатия динамического диапазона. Первый уровень задает уровень сжатия динамического диапазона. Второй уровень отображает текущий уровень усиления. Подробнее см. 7.1. Громкость и динамический диапазон.
Отображает тип и параметры текущего аудио-потока. Строка Input отображает тип входного потока. В текстовом окне отображается информация о формате. Декодеры для разных форматов показывают разную информацию, в том числе:
Поля Frames/errors отображают статистику декодера: количество декодированных фреймов / количество фреймов с ошибками. В нормальном режиме работы ошибок быть не должно!
Индикатор показывает загрузку процессора фильтром.
Здесь отображаются текущие входные и выходные пик-уровни сигнала. Уровни отображаются в логарифмическом формате. При возникновении переполнения индикаторы выходных уровней становятся красными. В этом случае желательно уменьшить усиление (уровень Gain) т.к. переполнение означает возникновение искажений (см. 7.1. Громкость и динамический диапазон).
На этой странице находятся настройки для управления микшированием
Основной элемент этой страницы - матрица микширования. Она представлена в форме матричного умножения:
Более приземленно это означает, что для каждой клетки действует следующее правило: мы микширует канал заданный колонкой в канал заданный строкой с усилением заданным в клетке. Так, если мы хотим направить левый канал в правый, то мы должны поставить значение 1 в клетке на пересечении колонки 'L' и строки 'R'. После этого из правого канала будет слышен и левый и правый каналы.
Необходимо четко разделять понятия входного и выходного канала. Входной канал - это то, что было закодировано в исходном потоке. Выходной канал - это то, что мы будем слышать в колонках.
Строка матрицы определяет содержание выходного канала (колонки), заданного этой строкой. Так, для вышеприведенной матрицы первая строка показывает, что будет слышно из левой колонки:
L' = 1 * L + 0.7071 * C + 1 * SL + 1 * LFE
т.е. из левой колонки будет слышен левый канал, часть центрального, левый тыл и канал низкочастотных эффектов. Таким образом осуществляется микширование из 6 оригинальных каналов в 2 канала стереосистемы (downmix).
Важное свойство матрицы состоит в том, что поменяв местами содержание двух строк матрицы мы можем 'поменять местами' соответствующие колонки. Так, поменяв местами первую и третью строку левая и правая колонки 'поменяются местами'. Это свойство можно использовать для 'перестановки' колонок без физического из переключения.
Значения в столбце матрицы показывают куда будет микшироваться входной канал. Так, центральный канал направляется одновременно и на левую и на правую колонку с множителем 0.7 (иначе центр идущий из двух колонок будет звучать громче, чем если бы у нас была настоящая третья колонка). Таким образом мы услышим центральный канал посередине между левой и правой колонками. Изменяя множитель в левом или правом выходном канале можно 'подвинуть' центр. Так, если поставить 1 в столбце 'С' строки 'L', то центр будет слышен громче из левого канала и будет казаться сдвинутым влево.
В большинстве случаев нет необходимости изменять матрицу вручную: при включенной опции AutoMatrix матрица микширования расчитывается автоматически на основе следующих параметров: режима колонок, уровней Voice, Surround, LFE, опции NormalizeMatrix, VoiceControl, ExpandStereo. Так, изменив уровень для центрального канала Voice мы также увидим изменения в коэффициентах матрицы (столбец 'C').
Master/Gain - желаемый и текущий уровень усиления (см. 6.2. Основные настройки).
Voice - уровень усиления центра. В случае, если во входном сигнале присутствует реальный центральный канал, то этот уровень влияет только на него. Если центрального канала нет но установлен флаг Voice control, то этот уровень управляет уровнем 'виртуального' центра. Этот уровень является параметром матрицы, поэтому имеет смысл только когда включена опция AutoMatrix. При изменении уровня матрица пересчитывается.
Surround - уровень усиления тыла. В случае, если во входном сигнале присутствуют тыловые каналы то этот уровень влияет только на них, как в случае с понижающим микшированием (в этом случае будет регулироваться уровень микширования тыловых каналов во фронтальные), так и без него (т.е. просто регулироваться уровень тыловых каналов относительно фронтальных). В случае, если тыловых каналов в источнике нет но установлен флаг Expand stereo, то этот уровень управляет уровнем 'виртуального' тыла. Этот уровень является параметром матрицы, поэтому имеет смысл только когда включена опция AutoMatrix. При изменении уровня матрица пересчитывается.
LFE - уровень канала LFE. Этот уровень является параметром матрицы, поэтому имеет смысл только когда включена опция Auto matrix. При изменении уровня матрица пересчитывается.
Список выбора Matrix позволяет сохранять и загружать матрицы.
На этой странице находятся настройки уровней усиления:
Master/Gain - желаемый и текущий уровень усиления (см. 6.2. Основные настройки).
Флаг DRC Enabled включает/отключает функцию сжатия динамического диапазона. Первый уровень задает уровень сжатия динамичкеского диапазона. Второй уровень отображает текущий уровень усиления. Подробнее см. 7.1. Громкость и динамический диапазон.
Задержки для каждого из выходных каналов. Величины задержек можно задавать в различных единицах (список выбора Units). Положительные величины для единиц времени означают, что будет вносится положительная задержка, т.е. звук будет задерживаться. Положительные величины для единиц расстояния наоборот, означают отрицательную задержку, т.е. что звук будет воспроизводиться 'заранее'. В обоих случаях допустимы отрицательные величины задержек. Есть два основных применения задержек:
Уровни усиления для входных каналов. В некоторых сучаях необходимо изменить уровени усиления именно входных каналов. Например, если входной сигнал имеет центральный канал, а выходной - нет (центр микшируется во фронтальные каналы), но требуется изменить именно уровень диалогов. Т.е. предназначены для компенсации дефектов записи.
Уровни усиления выходных каналов. Предназначены в первую очередь для выравнивания громкости динамиков (если они расположены несимметрично). Иными словами, для компенсации дефектов акустической системы.
На этой странице находятся системные настройки (не влияющие на звук непосредственно):
Определяет, в каких случаях будет использоваться AC3Filter.
Определяет, какие форматы поддерживаются внешним декодером и будут передаваться без изменений при использовании цифрового выхода. Имеет значение только при включенной опции SPDIF (см. 6.2. Основные настройки).
Фильтр устанавливается в систему с наивысшим приоритетом, т.е. будет использоваться вместо любых других установленных декодеров. Если по каким-то причинам необходимо использовать другие декодеры, то приоритет можно понизить до минимального при помощи опции Prefer other decoder. Фильтр останется в системе и будет использоваться только если не установлено других декодеров. Prefer AC3Filter - высокий приоритет.
Звуковая карта может работать в двух режимах: DirectSound и WaveOut. Если при использовании фильтра возникают проблемы (например не работает SPDIF), то переключение режима работы в некоторых случаях может помочь. Некоторые плееры имеют настройки для изменения устройства вывода (см. 5. Настройка плеера), прочие же используют настройки системы по умолчанию. Для переключения режима работы используются опции Use DirectSound - для использования интерфейса DirectSound и Use WaveOut для использования интерфейса WaveOut. Эта опция изменяет глобальные настройки системы! Поэтому если плеер имеет собственные настройки устройства вывода, то предпочтительнее использовать средства плеера.
Эта опция действует только если плеер использует устройство вывода по умолчанию, или это указано в его настройках.
В некоторых случаях возможно что аудио и видео рассинхронизированы. В основном это случается из-за неправильного микширования видео файла, но возможны и аппаратные причины десинхронизации. Эта опция предназначена для решения аппаратных проблем. Эта опция может быть применена для исправления дефекта конкретного файла, но необходимо не забывать изменить ее обратно! Здесь указывается сдвиг аудио относительно видео в мс. Если звук слышен до видео, то необходимо увеличить это значение. Если звук происходит после событий на экране, то необходимо уменьшить это значение. Эта опция может исправить только постоянный временной сдвиг.
Эта опция действует немедленно. При изменении значения задержки; возможно, что изображение замрет или будет двигаться скачками в течении нескольких секунд.
Качество звука - это очень сложное понятие которое зависит от огромного количества факторов и их взаимосвязи: типа акустической системы, условий прослушивания, качества исходной записи, самого слушателя и многих прочих. Невозможно дать однозначные рекомендации как добиться качества, нет единого рецепта как нет и идеального звука: запись подготовленная для одних условий прослушивания в других условиях может звучать совершенно неприемлемо. Однако можно попытаться изложить некоторые главные принципы, которые помогут понять что необходимо делать в каждом конкретном случае. Поэтому крайне рекомендуется ознакомиться с этим разделом для более полного понимания возможностей фильтра.
Этот, казалось бы, очевидный вопрос достаточно трудно формализовать, поскольку в разных случаях подразумеваются совершенно разные вещи.
Наиболее очевиден смысл громкости, когда мы говорим о звуковом давлении, поскольку это то, что непосредственно воспринимается ухом.
Звуковое давление - давление, дополнительно возникающее при прохождении звуковой волны в жидкой и газообразной среде. Распространяясь в среде, звуковая волна образует сгущения и разрежения, которые создают добавочные изменения давления по отношению к среднему значению давления в среде. Т.о., звуковое давление представляет собой переменную часть давления, т.е. колебания давления относительно среднего значения, частота которых соответствует частоте звуковой волны. (Большая Советская Энциклопедия)
Таким образом мы можем оценить любой звук - громкие звуки создают большое давление, тихие - малое. Давление измеряется в Паскалях, однако в акустике звуковое давление обычно измеряется в децибелах (дБ) относительно порога слышимости. По определению, величина порога принята равной pt = 0.00002Па = 20мкПа. Порог слышимости принимается за 0дБ, а громкость вычисляется как l = 20 * log(p / pt), где l [дБ] - громкость (в смысле звукового давления), p [Па]- звуковое давление, pt [Па]- порог слышимости. При этом: все слышимые звуки имеют положительную величину громкости; неслышимые (ниже порога громкости) - отрицательную; изменение громкости на 6дБ соответствует двукратному изменению давления; изменение на 20дБ - изменению давления в 10 раз. Громкость в смысле звукового давления далее мы будем называть абсолютной громкостью.
Несколько типичных значений громкости:
Звук | Громкость | Давление |
Порог слышимости | 0дБ | 20 мкПа |
Шелест листвы и слабого ветра Тиканье наручных часов Дыхание |
10-20дБ | 60 - 200 мкПа |
Тихий шепот Тиканье настенных часов |
20-30дБ | 200 - 600 мкПа |
Шум в помещении | 30-40дБ | 0.6 - 2 мПа |
Тихий разговор | 40-50дБ | 2 - 6 мПа |
Разговор средней громкости | 50-60дБ | 6 - 20 мПа |
Громкий разгвор | 60-70дБ | 20 - 60 мПа |
Шумная улица | 70-80дБ | 60 - 200 мПа |
Двигатель грузового автомобиля | ~80дБ | 200 мПа |
Шум в метро во время движения Отбойный молоток |
~90дБ | 600 мПа |
Громкая дискотека | 100-120дБ | 2 - 20 Па |
Самолет на взлете | 120дБ | 20 Па |
Болевой порог | 130дБ | 60 Па |
Обратите внимание на диапазон воспринимаемых давлений: давление у порога слышимости и создаваемое самолетом отличаются в миллион раз! Поэтому логарифмическая шкала гораздо лучше согласуется с физиологией слуха - линейное изменение звукового давления не соответствует ощущению линейного изменения громкости. Например, изменение звукового давления на 50мПа при разговоре будет очень заметно, однако совершенно незаметно при взлете самолета. Изменение же звукового давления на 6дБ (в два раза) будет воспринято как примерно равное изменение громкости в обоих случаях, хотя в первом случае это будет соответствовать изменению давления на 25мПа, а во втором - 10Па.
Другая громкость - это громкость записи (громкость сигнала). Эта громкость не является звуковым давлением (это может быть напряжение, намагниченность и т.д.), однако, звуковое давление создается в соответствии с громкостью сигнала записи при помощи системы воспроизведения. Каждой определенной громкости сигнала соответствует определенное звуковое давление. Громкость сигнала также может измеряться в децибелах. Однако, если звуковое давление обычно измеряется относительно порога слышимости (минимального слышимого звукового давления), то громкость цифрового сигнала обычно измеряется относительно максимального цифрового уровня, принятого за 0дБ. Таким образом громкость цифрового сигнала выражается отрицательными величинами (-3дБ, -20дБ) поскольку громкость записи всегда должна быть ниже максимальной. Чем меньше значение громкости, тем тише сигнал (-20дБ тише, чем -3дБ). Если громкость цифрового сигнала положительна, то это означает переполнение и, как следствие, возникновение цифровых искажений. (Суть этих искажений будет рассмотрена далее).
Регуляторы громкости на усилителе, в настройках системы, в плеере не создают звукового давления вообще. При отсутствии сигнала даже на при максимальных установках громкости мы не услышим ничего (при условии, что сама система воспроизведения не создает шума). Таким образом они влияют на громкость лишь косвенно и имеют смысл усиления сигнала. (усиление может означать и ослабление сигнала). В дальнейшем термин громкость не будет использоваться для обозначения уровней усиления, за исключением системной громкости, поскольку это уже устоявшийся термин. Под системной громкостью будет пониматься как уровень усиления установленный в настройках операционной системы, так и в плеере, усилителе/ресивере и т.д.
Уровень усиления также может измеряться в децибелах. Это удобно поскольку громкость сигнала и уровень усиления в таком случае просто складываются. Например, сигнал с громкостью 70дБ, усиленный на 10дБ будет звучать с громкостью 80дБ. Однако, несмотря на одинаковые единицы измерения необходимо всегда отличать громкоть от усиления.
При воспроизведении сигнал записи преобразуется в звуковое давление при помощи акустической системы. Пусть максимальное давление создаваемое акустической системой составляет 100дБ. Тогда запись громкостью 0дБ будет создавать давление 100дБ, запись громкостью -30дБ будет создавать давление 70дБ и т.д. При изменении уровня усиления абсолютная громкость тоже будет изменяться. Таким образом изменяя уровень усиления всегда возможно установить соответствие между громкостью записи и необходимой абсолютной громкостью. Например, если уровень диалогов в фильме составляет -30дБ, и мы хотим слышать их с естественной громкостью, то необходимо, чтобы громкость записи равная -30дБ соотвествовала давлению 50дБ. Т.к. при максимальном уровне усиления (0дБ) уровень записи -30дБ создает давление 70дБ (что многовато), то при уровне усиления -20дБ, та же громкость записи создаст необходимые 50дБ давления. Отрегулированная таким образом акустическая система называется калиброванной, т.е. откалиброванная акустическая система - это система, где звуки воспроизводятся с правильной абсолютной громкостью. (На самом деле процесс калибровки может быть гораздо сложнее и включать намного больше параметров, однако здесь и далее мы будем говорить только о калибровке громкости). На большинстве бытовых приборов регулятор уровня усиления никак не маркируется (или наносятся абстрактные проценты или другие ничего не обозначающие цифры), поэтому для пользователя произвести точную калибровку акустической системы достаточно сложно.
На восприятие громкости также влияет свойство адаптации слуха. Слух приспосабливается к громкости окружающего шума, и соответственно корректирует восприятие громкости. Многие наверняка замечали, что человек в наушниках, в которых играет громкая музыка начинает говорить громко (согласно восприятию окружающих), однако с его точки зрения это нормальная громкость речи (относительно громкости звука в наушниках). И наоборот - в полной тишине люди начинают говорить шепотом и при этом шепот все равно кажется громким. В условиях обычного городского шума тиканье механических часов услышать очень сложно - этот звук воспринимается как очень тихий. То же самое тикание часов в полной тишине ночью может восприниматься как четко слышимое. Таким образом возникает третья громкость - субъективная громкость. Мы не будем говорить о каком-либо измерении субьективной громкости, а только о качественном сравнении з вуков (громче-тише).
Таким образом звук одной и той же абсолютной громкости может восприниматься как громкий или тихий в зависимости от окружающих условий. Допустим, мы отрегулировали уровень усиления так, чтобы громкость диалогов в фильме приблизительно соответствовал реальности. Тогда, если в фильме есть звук тикающих в тишине часов, то при просмотре фильма в условиях городского шума мы не услышим часов вовсе, поскольку звук часов значительно тише окружающего шума, а слух адаптирован отсеивать окружающий шум. В хороших условиях прослушивания, когда окружающего шума нет, те же самые часы будут ясно слышны.
Во многих случаях громкость записи удобно измерять относительно некоторого опорного уровня. Например, если громкость записи составляет -20дБ - это громко или тихо? А если нам известно, что громкость диалогов в той же записи составляет -30дБ, то сразу можно сказать, что это достаточно громко, а если громкость диалогов равна -10дБ, то можно сказать, что это достаточно тихо. Уровень диалогов (средняя громкость разговора) - это очень удобный опорный уровень, относительно которого можно легко ориентироваться. Если громкость звука на 10дБ выше уровня диалогов, то это громко, а если на 10дБ ниже - то это тихо. При этом сам уровень диалогов может быть произвольным и зависеть от записи - в одной записи уровень диалогов может составлять -10дБ, а в другой и все -30дБ. В любом случае звуки громкостью ниже уровня диалогов будут восприниматься как тихие, а выше уровня диалогов - как громкие, даже в случае если акустическая система будет неправильно откалибрована, и диалоги будут звучать с абсолютной громкостью в 40дБ или 60дБ. Благодаря свойству адаптации слух приспосабливается к текущей средней громкости и вносит соответствующую 'поправку'. Однако правильное восприятие громкости будет нарушено когда громкость окружающего шума приближается к громкости диалогов (или даже превышает его) - в этом случае все воспроизводимые звуки будут казаться тихими.
Таким образом можно ввести еще одну шкалу громкости (в дополнение к шкале громкости цифрового сигнала и шкале абсолютной громкости) - громкость относительно уровня диалогов. При сопоставлении разных громкостей получим:
абсолютная громкость реальных звуков | громкость относительно уровня диалогов | громкость записи-1 | громкость записи-2 | абсолютная громкость при воспр. записи 1 | абсолютная громкость при воспр. записи 2 | |
Тихие звуки | ||||||
тихий шепот | 10дБ | -40дБ | -70дБ | -50дБ | 10дБ | 10дБ |
норма шума в жилых помещениях | 20..30дБ | -20..-30дБ | -50..-60дБ | -30..-40дБ | 20..30дБ | 20..30дБ |
тихий разговор | 40дБ | -10дБ | -40дБ | -20дБ | 40дБ | 40дБ |
Уровень диалогов | ||||||
разговор средней громкости | 50дБ | 0дБ | -30дБ | -10дБ | 50дБ | 50дБ |
Громкие звуки | ||||||
шум пишущей машинки | 70дБ | +20дБ | -10дБ | 0дБ (максимум) | 70дБ | 60дБ |
двигатель грузового автомобиля | 80дБ | +30дБ | 0дБ (максимум) | 0дБ | 80дБ | 60дБ |
громкий автомобильный сигнал на расстоянии 5–7м | 100дБ | +50дБ | 0дБ | 0дБ | 80дБ | 60дБ |
шум работающего трактора на расстоянии 1м | 120дБ | +70дБ | 0дБ | 0дБ | 80дБ | 60дБ |
порог болевого ощущения | 130дБ | +80дБ | 0дБ | 0дБ | 80дБ | 60дБ |
В таблице также приведены две гипотетические записи записанные в разных условиях: уровень диалогов в записи-1 составляет -30дБ, а в записи-2 -10дБ. Видно, что при воспроизведении на откалиброванной системе первая запись значительно лучше передает громкие звуки - возможно воспроизводить звуки громкостью до 80дБ, в то время как вторая запись воспроизводит звуки громкостью всего лишь до 60дБ.
Заметим также, что для двух приведенных записей требуется разная калибровка акустической системы. Так, для акустики, способной создавать давление в 100дБ уровень усиления, необходимый для первой записи составляет -20дБ, а для второй - -40дБ. Т.о. первая запись требует значительно бОльшего усиления и при воспроизведении обоих записей при одинаковых настройках уровня усиления первая запись будет звучать значительно тише. Поэтому вторая запись удобна для некалиброванных систем, поскольку допускает сильные отклонения в уровне усиления.
Таким образом запись-1 хорошо передает громкие звуки, но требует большего уровня усиления; при недостаточном усилении и наличии внешних шумов будет восприниматься как черезмерно тихая. Запись-2 не требует большого усиления, хорошо слышна даже на малых уровнях усиления и при наличии шума, но не может хорошо передавать громкие звуки.
А теперь вспомним, что звуковой сигнал - переменный:
Что брать для расчета громкости? Очевидно, что изменение давления за один период звуковой волны не имеет смысла изменения громкости звука, поскольку мы не слышим отдельные колебания. Поэтому громкость определяется не для одной точки, а на определенном промежутке времени. Еслть много разных способов для определения громкости. Простейшие - это определение максимума и вычисление энергии сигнала. Более сложные методики учитывают неравномерность слуха к звукам разной частоты и интенсивности.
При определении громкости как максимума сигнала мы просматриваем диапазон и ищем максимум сигнала:
Найденный уровень, выраженный в дБ и будет характеризовать громкость. Чтобы отличить эту громкость от полученных другим способом эта громкость также называется пик-уровнем. В дальнейшем мы будем пользоваться только таким определением громкости. В действительности это определение не очень хорошо отражает реальное восприятие громкости, однако оно удобно для последующих рассуждений и поэтому мы не будем более подробно останавливаться на других, более точных методах определения громкости.
Этот рисунок иллюстрирует распределение громкостей типичного DVD фильма (DVD FightClub, здесь и далее берутся только оригинальные аудио-треки, без перевода и без микширования, дабы не искажать звуковую картину). По оси Х откладывается громкость в децибелах, по оси Y - насколько чато звук с этой громкостью появляется. Проще говоря, на протяжении фильма постоянно контролировалсь текущяя громкость и чем чаще встречается какая-то громкость тем выше с этом месте график. Т.е. можно сказать, что громких взрывов было мало, зато очень много разных фоновых звуков. График поделен на несколько условных областей:
Границы между областями весьма условны и могут изменяться для разных записей. В данном случае известно, что уровень диалогов равен -27дБ.
Рассматривая график можно отметить несколько интересных моментов. Во-первых, чаще всего в фильме встречались звуки с громкостью -40дБ. Пока просто отметим этот факт. Во-вторых главный горб расположен от 0дБ (максимальный уровень) до -70дБ (минимальный уровень). Разумно предположить, что все важные звуки расположены внутри этого горба, а все, что тише - просто шумы. Разность максимального и минимального уровней составляет 70дБ. Эта величина называется динамическим диапазоном и будет далее иметь огромное значение.
Для фильмов на DVD привденная картина достаточно типична. Диалоги занимают значительное время, немного больше - фоновый звук и музыка, периодические всплески громкости и периодический же постепенный уход в тишину. В целом, звуковая картина этого фильма достаточно сбалансирована и использует практически весь доступный динамический диапазон.
Теперь посмотрим и на другие фильмы:
На этих примерах очень хорошо видно разделение на две большие группы. Для первой группы фильмов характерно практически полное отсутствие громких звуков (Cube, Dracula, About Schmidt, Savior). Для них диапазон громкостей от 0дБ до -15дБ (очень громкие звуки) практически не используется. Для другой группы фильмов, наоборот громкие звуки черезвычайно важны (Interstate60, Blood (Last Vampire), Pitch Black, Matrix). Казалось бы, что этих звуков относительно мало, поэтому особой роли они не играют. Однако, например, продолжительность звука выстрела (его громкой части) составляет доли секунды, но именно большая громкость выделяет этот звук. Если бы этот звук был тише, то создалось бы впечатление 'плоскости' и невыразительности звука. В фильмах первого типа ('тихие' фильмы) громкий звук даже если встретится один раз на фильм, он все равно не несет большой смысловой нагрузки, поэтому его громкость не так критична. В фильмах второго типа эти звуки (даже при относительно малой продолжительности) формируют настроение фильма.
Другая бросающаяся в глаза особенность - это высокие 'горбы' в фильмах Cube и Interstate60. В фильме Cube присутствует постоянный тихий фоновый гул и именно поэтому график имеет горб на громкости около -50дБ. То же самое касается фильма Interstate 60 - это путешествие на автомобиле, и как следствие, постоянный звук движения.Формы обоих гистограмм очень похожи, однако максимум гистограммы для фильма Cube находится на 10дБ ниже. Так как уровень голоса в обоих фильмах одинаковый, то сразу можно заключить, что фильм Cube значительно тише. Это далеко неочевидный вывод. Вспомним про свойство адаптации слуха - если сдвинуть графики так, чтобы их максимумы находились на одном и том же уровне фильм Cube все равно будет восприниматься как 'тихий'!
Для прочих фильмов нет настолько хорошо выраженных фоновых звуков поэтому графики более 'размазанны' по динамическому диапазону.
Фильм About Schmidt имеет большой горб на уровне -70дБ..-80дБ. Это шумы записи - в этом фильме они относительно громкие по сравнению с другими фильмами, однако достаточно тихие, чтобы они не мешали просмотру.
До сих пор мы рассматривали исключительно фильмы. Посмотрим теперь на музыку:
Сразу бросается в глаза совершенно другое распределение громкостей. (Здесь собраны гистограммы музыки разных направлений и разного качества для того чтобы показать разнообрразие. Они не показывают реального соотношения разных типов композиций.). Все звуки сильно сдвинуты в 'громкую' часть динамического диапазона. Разница в средней громкости фильмов и музыки достигает 40дБ. Кроме того, для фильмов характерен плавный спад гистограммы в громкой области. Для музыки же максимум гистограммы зачастую находится на максимальном уровне (0дБ). Таких графиков приведено немного, однако такая ситуация является очень распространенной.
Понятие уровня диалогов к музыке зачастую неприменимо, поэтому разделить громкие и тихие звуки очень затруднительно. Поэтому также затруднено определение субъективной громкости композиции. Так, субъективно громкая композиция может быть объективно тише субъективно громкой. Большое значение здесь имеют положительные или отрицательные перепады громкости, которые на данных гистограммах не видны.
Отсутствие единого ориентира приводит к хаосу - звук из разных источников имеет разную громкость - разница в максимумах гистограмм композиций достигает 20дБ. Да и вообще понятие 'громкости композиции' очень сложно как-то формализовать. Многим наверняка знакома ситуация, когда есть много разной музыки из разных источников и при проигрывании ее подряд (например, если записать AudioCD) громкость постоянно меняется при переходе от одной композиции к другой, что неприятно (а упомянутый эффект несоответствия реальной и субъективной громкости может еще более запутать восприятие). Приведенные графики очень хорошо иллюстрируют такую ситуацию.
Динамический диапазон музыкальных композиций (разница между самым громким и самым тихим звуком) составляет 20-40дБ, что значительно меньше динамического диапазона фильмов (70дБ).
В среднем уровень громкости на музыкальных записях (а также системные звуки Windows) оказывается значительно выше чем на DVD-фильмах. Поэтому при одинаковых настройках системной громкости абсолютная громкость фильмов будет значительно ниже и при наличии внешних шумов может оказаться недостаточной, слышно будет плохо (sic!) и будет казаться, что звук некачественный. Увеличение усиления в настройках системы и на усилителе даже до максимальной может не решить проблемы: разница в средней громкости достигает 40дБ, что очень много. Однако, даже если мощности усилителя окажется достаточно и проигрывание DVD происходит с достаточной абсолютной громкостью это не всегда удобно, поскольку звуки операционной системы, которые звучат с нормальной абсолютной громкостью при нормальных настройках усиления при большом усилении будут просто громоподобными.
Эта проблема характерна в основном для компьютерного проигрвания, поскольку в аппаратных проигрывателях управление уровнем усиления осуществляется самим декодером. Некоторые программные DVD-проигрыватели умеют управлять системной громкостью, однако это тоже не всегда удобно, поскольку изменяется громкость всех звуков системы (можно случайно оглушить соседей), да и управлять громкостью на внешнем усилителе программа все равно не может. Поэтому это только частичное решение проблемы.
Компромиссное решение состоит в обработке звука непосредственно перед проигрыванием. Подобная обработка может сильно повысить качество проигрывания конкретной записи и в конкретных условиях. Многие могут возразить, что при этом теряется 'качество', однако, как уже упоминалось - нет абсолютного качества, Мы не ставим себе целью монтировать звук, наша цель - добиться того, чтобы в наших условиях слушать его было приятно. Если акустическая система не обладает достаточной мощностью или у нас нервные соседи смотреть фильм с пониженной громкостью, когда не разобрать половины слов и не слышно половины тихих звуков будет просто неприятно. Даже самовнушение о максимально достигнутом 'качестве' не сможет сгладить этого впечатления. Еще раз повторю основную мысль: качество - это то, что мы слышим. Звук проходит много стадий обработки до того, как попасть к слушателю, а разнообразие акустики и ее свойств настолько велико, что последняя стадия обработки непосредственно перед воспроизведением является практически необходимостью.
Изменение уровня - это просто умножение амплитуды сигнала на определенное значение, в результате чего изменяется громкость всего сигнала (увеличивается или уменьшается).
В логарифмическом виде умножение на число - это просто прибавление константы. Поэтому если ко всем уровням прибавить одно и то же число, то гистограмма уровней просто сдвинется:
Если мы умножим сигнал на слишком большое число, то возможно переполнение. Если переполнение не отслеживать, то значение амплитуды принимает практически случайные значения (см. рисунок) и это приводит к очень заметным на слух частым щелчкам. Самых простой способ борьбы с этим дефектом - обрезание сигнала (клиппинг, clipping), т.е. там где амплитуда сигнала выходит за перделы мы 'обрезаем' его (см. рисунок). При небольшом переполнении клиппинг практически незаметен на слух, однако при повышении уровня он проявляется как 'песок' в звуке.
Более сложный, но и более эффективный способ - это ограничение сигнала (лимитинг, limiting). Суть его состоит в том, чтобы автоматически понижать уровень сигнала так, чтобы переполнения просто не происходило. Для этого необходима система автоматической регулировки усиления (АРУ, Automatic gain control, AGC), которая будет вносить поправку в текущий уровень сигнала. Так, пока переполнения нет АРУ не изменяет сигнал, а как только сигнал превышает максимальный уровень вносится поправка, которая изменяет сигнал так, чтобы его уровень не превышал максимальный. Как видно на рисунке, сигнал полностью сохраняет свою форму! Однако, громкость при этом остается максимальной:
Необходимо обратить внимание на то, что на предыдущем рисунке приведена амплитуда, а на этом - громкость (определенная по большой группе амплитуд). Поэтому несмотря на то, что график громкости 'обрезан' форма самого сигнала искажается минимально. Этот способ также не лишен недостатков. Изначально звук имел разную громкость, а после ограничения все звуки выходящие за пределы имеют одну и ту же громкость и звук может получиться 'плоский' и невыразительный. Посмотрим на гистограммы (Fight Club):
Здесь приведен пример неудачного усиления. При усилении +10дБ искажения еще мало заметны (мест в фильме где возникает переполнение еще относительно мало), однако с ростом усиления ограничение уровня появляется все чаще и чаще и при уровне +30дБ начинает ограничиваться голос, что крайне заметно. Особенно заметны недостатки ограничения при значительных изменениях громкости за малое время - субъективно громкость начинает прыгать вверх и вниз. Если на фоне разговора (который при усилении +30дБ уже воспроизводится с максимальной громкостью) происходит громкий звук (который громче голоса в оригинале, например, звонок телефона) то уровень усиления уменьшается так, чтобы громкий звук не искажался, но при этом громкость разговора также резко падает. Когда громкий звук заканчивается разговор так же резко возвращается к предыдущей громкости:
Т.о. относительная громкость разных звуков воспроизводимых одновременно сохраняется, однако уровень усиления постоянно изменяется, что хорошо заметно и очень неприятно. Таким образом при больших уровнях усиления (20-30дБ и больше) ограничение тоже дает плохой результат.
При малых уровнях усиления дефекты ограничения сигнала практически незаметны, тогда как обрезание сигнала хорошо слышно практически всегда. Т.е. при прочих равных условиях ограничение дает более качественный результат. Фильтр всегда производит либо ограничение (опция AGC влючена) либо обрезание (опция AGC отключена). В дальнейшем если не оговорено явно будет подразумеваться что включено ограничение. Поэтому рекомендуется всегда держать опцию AGC включенной.
Зададимся целью поднять громкость без потери качества вообще. Такое возможно? Да, если есть 'запас' динамического диапазона. Посмотрим снова на гистограммы с фильмами, фильм Cube (желтый график). На гистограмме видно, что громкость не поднимается выше -15дБ (возможно, что за весь фильм и есть один-два таких момента, однако, для целей данного рассмотрения будем считать, что громких звуков нет вообще). А так как громких звуков нет, то можно повысить громкость на 15дБ без потери качества!
Кроме увеличения громкости никаких изменений в сигнале не происходит. При этом гистограмма не изменяя формы подвинется вплотную к правому краю:
Таким образом, окажется, что в фильме теперь присутствует звук с максимальной громкостью. Но если мы будем увеличивать громкость дальше возникнут искажения (описанные выше). Такая форма сигнала, где присутствует звук максимальной громкости без внесенных при этом искажений называется нормальзованной, а процесс - нормализацией. Нормализация часто производится на стадии подготовки музыкальных записей и к нам звук попадает уже нормализованным (например, AudioCD). Однако для фильмов нормализации не производится. Почему?
Вспомним гистограммы для музыки и хаос с громкостью. Для музыки важно воспроизведение с максимальной громкостью, поскольку рассчитана на максимальную целевую аудиторию - CD-плееры, шум на улице, метро, дешевые наушники, хрипящие радиостанции, через которые тихие звуки ниже -40дБ просто не услышать. (Еще раз посмотрим на графики для музыки - минимальная громкость примерно равна -40дБ...)
Для DVD это не так. Они в первую очередь предназначены для качественных домашних кинотеатров. Воспроизводящая аппаратура должна быть откалибрована так, чтобы всегда воспроизводить диалоги с одной и той же абсолютной громкостью для любого фильма, будь то боевик с его потрясающими стену взрывами или мелодрама с тихим шуршанием травы. При этом воспроизводящая система всегда должна быть готова воспроизвести эти звуки без необходимости изменять уровень усиления вручную. Таким образом на первый план выступает не необходимость сделать запись максимально громкой, а необходимость жесткого опорного уровня, чтобы декодер имел возможность подстроить уровень усиления автоматически. Этот опорный уровень может быть любым (на самом деле это не важно, т.к. если есть опорный уровень то соответствующую коррекцию можно сделать всегда). Стандартом де-факто для DVD является уровень диалогов равный -27дБ. Поэтому даже если фильм громких звуков не содержит то на этапе создания диска проводить нормализацию не следует и динамический диапазон остается неизрасходованным.
Итак, для целей повышения громкости нормализация это хорошо. Но для того, чтобы провести нормализацию нужно знать максимальный уровень записи и чтобы его найти нужно просмотреть всю запись заранее. Однако это не всегда возможно да и просто неудобно. Есть метод нормализации, для которого не нужно предварительно просматривать всю запись - однопроходная нормализация. Суть метода состоит в том, что при просмотре фильма мы ищем максимум громкости постоянно. В начальный момент времени усиление максимально. В момент, когда возникает переполнение мы уменьшаем усиление:
Как видно на рисунке первый пик громкости срезается почти также, как и при обычном переполнении, однако продолжительность 'среза' значительно меньше (сравните с простым ограничением) и впоследствии переполнений не происходит. Таким образом усиление будет корректироваться при нахождении каждого нового максимума и в результате гистограмма автоматически сдвигается в сторону достижения максимальной громкости.
Как и все прочие, метод не лишен недостатков. Во-первых - метод не лишен искажений (хотя и малозаметных - нужно точно знать, что слушать, чтобы заметить работу однопроходной нормализации). Во-вторых громкость постоянно снижается во время просмотра фильма (хотя обычно основной процесс снижения громкости заканчивается на первых 10-15 минутах фильма, поэтому практически незаметен). И в-третьих, основная цель - повышение громкости, может быть не достигнута - все зависит от самого фильма (это касается и обычной нормализации). Вот пример гистограмм полученных в случае однопроходной нормализации для фильмов Cube (где нормализация возможна) и Fight Club (где нормализация не даст желаемого эффекта):
Как видно на этих гистограммах результат отличается разительно. Включение однопроходной нормализации дает существенный положительный эффект для фильма Cube - стало заметно громче (и подтвердилось наше предположение, что звуки громче -15дБ в фильме отсутствуют - сравните с графиком для нормализации). Но для фильма Fight Club увеличения громкости вообще не произошло - таким образом нужный эффект не был достигнут, но были внесены дополнительные искажения.
Необходимо еще раз отметить, что для работы однопроходной нормализации необходимо предварительное (начальное) усиление - без повышения уровня однопроходная нормализация просто бессмсленна. Также как и обычное усиление оно задается уровнем Master. Однако, если оно будет слишком сильным - с начала работы алгоритма падение громкости будет очень заметно.
Задумаемся над вопросом - а зачем нам поднимать громкость? Для того, чтобы слышать тихие звуки, которые не слышны в наших условиях (например, если нельзя слушать громко, если есть посторонние шумы в комнате и т.д.). А можно ли усилить тихие звуки, а громкие не трогать? Оказывается можно. Эта техника называется сжатием динамического диапазона (компрессия, Dynamic Range Compression, DRC). Для этого необходимо изменять текущую громкость постоянно - тихие звуки усиливать, громкие - нет. Самый простой закон изменения громкости - линейный, т.е. громкость изменяется по закону output_loudness = k * input_loudness, где k - коэффициент сжатия динамического диапазона:
При k = 1 никаких изменений не производится (выходная громкость равна входной). При k < 1 громкость будет увеличиваться а динамический диапазон - сужаться. Посмотрим на график (k=1/2) - тихий звук, имевший громкость -50дБ станет громче на 25дБ, что значительно громче, но при этом громкость диалогов (-27дБ) повысится всего лишь на 13.5дБ, а громкость самых громких звуков (0дБ) вообще не изменится. При k > 1 - громкость будет уменьшаться, а динамический диапазон - увеличиваться.
Посмотрим на графики громкости (k = 1/2: сжатие ДД в два раза):
Как видно в оригинале присутствовали как очень тихие звуки, на 30дБ ниже уровня диалогов, так и очень громкие - на 30дБ выше уровня диалогов. Т.о. динамический диапазон составлял 60дБ. После компрессии громкие звуки всего лишь на 15дБ выше, а тихие - на 15дБ ниже уровня диалогов (динамический диапазон теперь составляет 30дБ). Таким образом громкие звуки стали значительно тише, а тихие - значительно громче. При этом переполнения не происходит!
Теперь обратимся к гистограммам:
Как хорошо видно - при усилении до +30дБ форма гистограммы хорошо сохраняется, что означает, что громкие звуки остаются хорошо выраженными (не уходят в максимум и не обрезаются, как это происходит при простом усилении). При этом выделяются тихие звуки. Гистограмма это показывает плохо, однако разница очень заметна на слух. Недостаток метода - те же самые прыжки громкости. Однако механизм их возникновения отличается от скачков громкости возникающих при обрезании а их характер совершенно отличен - они проявляются в основном при очень сильном усилении тихих звуков (а не при обрезании громких, как при обычном усилении). Черезмерный уровень компрессии приводит к уплощению звуковой картины - все звуки стремятся к одинаковой громкости и невыразительности.
Сильное усиление тихих звуков может привести к тому, что станут слышимы шумы записи. Поэтому в фильтре применен немного модифицированный алгоритм, чтобы уровень шумов поднимался меньше:
Т.е. на уровне громкости -50дБ происходит перегиб передаточной функции и шумы будут усиливаться меньше (желтая линия). При отсутствии такого перегиба шумы будут значительно громче (серая линия). Такая простая модификация значительно снижает количество шумов даже при очень сильных уровнях сжатия (на рисунке - сжатие 1:5). Уровень DRC в фильтре задает уровень усиления для тихих звуков (на уровне -50dB), т.о. уровень компрессии 1/5, показанный на рисунке, соответствует уровню +40дБ в настройках фильтра.
Есть еще одна далеко неочевидная тонкость, которая может сильно повлиять на громкость при проигрывании многоканальных записей на стерео-системе (или в наушниках). Пусть мы имеем исходную запись в формате 5.1 а на выходе необходимо получить 2 канала. В каждый из выходных каналов микшируется один фронтальный канал, один тыловой, канал LFE, и часть центрального канала:
L' = L + 0.7*C + SL + LFEДопустим, что по всем входным каналам сразу запущен звук максимальной громкости (хотя это и не слишком вероятно). Тогда амплитуда в выходном канале будет превышать максимум в 3.7 раза (на 11дБ), т.е. произойдет сильнейшее переполнение. Чтобы переполнения не допустить формулы микширования должны быть переписаны следующим образом:
L' = (L + 0.7*C + SL + LFE) / 3.7Это нормализованное микширование (не путать с нормализацией самой записи!) - переполнения гарантировано не происходит. Однако, смикшированный таким образом звук на целых 11дБ тише! Можно ли не проводить нормализацию? Можно. Однако в таком случае возможно переполнение и соответствующие искажения. Переполнение происходит только тогда, когда по всем входным каналам одновременно воспроизводится громкий звук. Это не характерно для фильмов (обычно тыловые каналы заметно тише фронтальных, да и канал LFE далеко не всегда задействован), но характерно для многоканальных музыкальных записей. Поэтому для фильмов можно оставить микширование ненормализованным, а для музыки нормализацию лучше включать. (В фильтре за нормализацию микширования отвечает опция Normalize matrix).
Рекомендации по настройке сильно зависят от конкретных условий прослушивания и поставленной цели. Условно можно разделить все условия на следующие категории:
Наилучших результатов можно добиться только при комбинировании всех методик. В данном разделе будет рассматриваться только случай просмотра DVD-фильмов. Для других случаев (музыка, MPEG4-фильмы и пр.) характеристики звука слишком отличаются. Однако, освоив настройку фильтра для DVD-фильмов уже несложно будет разобраться и с другими случаями.
Усиление (уровень Master). Скачки громкости возникающие при переполнении незаметны только в случае, когда обрезаемый звук намного громче основного: в примере с телефоном звук телефона сравним по громкости со звуком голоса, однако если вместо телефона будет оглушительный взрыв звук голоса в любом случае будет неразличим. Поэтому ограничение самых громких звуков допустимо и практически незаметно. Очень громкими можно считать звуки от +15..+20дБ относительно уровня диалогов. Таким образом, при уровне диалогов равном -27дБ (де-факто для DVD) допустимый уровень усиления равен +7..+12дБ. В качестве еще одного ориентира можно обратиться к гистограммам усиления: усиление до +10дБ не сильно сказывается на форме гистограммы, в то время как при усиленни +20дБ ограниченным оказывается очень большое количество звуков. Т.о. можно считать допустимым усиление до +10дБ. Его можно держать в этом положении практически всегда - на тихих фильмах это заметно поднимет громкость, а на громких - не будет сильно мешать. (Еще раз отметим, что рассуждения приведены только для случая просмотра DVD-фильмов - для музыки и большинства mpeg4-фильмов они неприменимы, т.к. характеристики гистограмм сильно отличаются).
Усиление также может применяться для ограничения громкости сигнала (например, для прослушивания ночью). При уровне диалогов равном -27дБ и усилении +17дБ уровень диалогов после усиления будет составлять -10дБ, а самого громкого звука, как всегда, 0дБ, что всего лишь на +10дБ выше уровня диалогов. Т.о. установив в фильтре усиление +17dB, и отрегулировав системную громкость так, чтобы диалоги воспроизводились с приемлемой абсолютной громкостью мы получим гарантию, что самые громкие звуки не будут превышать уровень диалогов больше, чем на 10дБ (хотя, конечно, в этом случае для громких звуков будет применено ограничение сигнала).
Компрессия (DRC). Границы применения компрессии определить намного сложнее, поскольку слышимость дефектов компресси сильно зависит от акустической системы, условий прослушивания и самого слушателя. Если подойти к вопросу с точки зрения гистограмм то верхний предел применимости компресси можно оценить как +20..+30дБ (см. гистограммы). В этом случае громкие звуки еще остаются выделенными по громкости от слабых. Таким образом уровень компрессии подбирается только на слух - до тех пор пока не будет достигнута необходимая громкость и дефекты будут оставаться незаметными.
Необходимо учитывать, что компрессия и усиление действуют одновременно, поэтому при уровне усиления +20дБ и компресии в два раза (+25дБ) реальный уровень усиления будет составлять +10дБ. Это нормально, посколюку потребность в усилении также уменьшается с увеличением компрессии.
Однопроходная нормализация (One-pass normalize). Применима также практически всегда. Для высококачественных систем с небольшим уровнем усиления позволит уменьшить количество переполнений, а в остальных случаях в комбинации с компрессией позволит добиться максимальной громкости опять же с минимумом искажений по переполнению. Начальный уровень усиления (уровень Master) для нормализации выбирается исходя из целей - если большого усиления не нужно - устанавливается желательное, а для достижения максимальной громкости можно установить +20дБ.
Первое, что необходимо отметить - LFE это не то же самое, что сабвуфер! И то, что обозначение '5.1' в случае с AC3 это совсем не те же самые '5.1' акустической системы. Поэтому начнем с рассмотрения этой разницы.
Формат AC3 создавался для кинотеатров, а совсем не для компьютера. В кинотеатрах качественная акустика может вполне адекватно воспроизвадить низкие частоты. LFE же был задуман как канал для мощных низкочастотных эффектов, то есть эффектов, с которыми обычная акустика уже не может справиться. Чтобы стены тряслись, народ вопил от ужаса, а слабонервные барышни падали в обморок. Таким образом все каналы ac3-потока содержат низкие частоты, и только иногда (в особо взрывоопасные моменты) в работу вступает канал LFE и только для того, чтобы помочь основной акустике потрясать стены. Вполне может случиться так, что канал LFE вообще не включится ни разу за весь фильм. И это также будет нормальным.
У компьютерной же акустики совсем другая специфика. Большинство современной 5.1 акустики просто не в состоянии воспроизвести НЧ через основные колонки (сателлиты) и сабвуфер должен полностью отвечать за их воспроизведение. Поэтому для таких систем необходимо перенаправления басов со всех каналов на сабвуфер. Таким образом если мы подключим 5.1 акустику, и станем смотреть фильм со звуковой дорожкой формата 5.1, назначив канал LFE на сабвуфер (без перенаправления низких частот из основных каналов), то мы рискуем не услышать низких частот вообще!
Акустические системы с сабвуфером можно разделить на несколько категорий. Во-первых, акустика может иметь сабвуфер, однако не иметь отдельного входа для сабвуфера. В этом случае акустическая система самостоятельно разделяет входной сигнал на НЧ-сигнал для сабвуфера и сигнал для основных колонок. Для таких систем необходимо, чтобы вся НЧ-информация уже содержалась в сигнале для основных колонок, т.е. необходимо микшировать LFE канал во все основные каналы. Поэтому выходной режим необходимо указывать без сабвуфера. (С точки зрения операционной системы и звуковой карты сабвуфера у акустической системы нет, т.к. акустика не имеет отдельного для него входа).
Системы, где сабвуфер управляется отдельно можно разделить на две категории:
За более подробной информацией о роли канала LFE, сабвуфера и управлением басами можно обратиться на сайт Dolby: http://www.dolby.com/tech/c.in.0011.LFE.pdf (англ).
SPDIF (S/P DIF, Sony/Philips Digital Interface, стандарт IEC958 "Digital audio interface") - это цифровой интерфейс для передачи звука.
При аналоговом подключении акустическая система подключается следующим образом:
Цифро-аналоговый преобразователь (ЦАП, DAC) находится на звуковой карте и вне компьютера звук передается в аналоговой форме. Подключение требует три стерео-провода (для шестиканальной системы) от звуковой карты до усилителя и шесть проводов от усилителя до каждой из колонок.
При цифровом используется следующая схема подключения:
Здесь подключение ресивера требует всего лишь одного провода и звук до передается в цифровом виде. ЦАП и усилитель находятся в ресивере. Так как вне компьютера на ЦАП действует меньше электронных шумов, да и усилитель находится рядом, то ресивер в режиме цифровой передачи может обеспечивать лучше качество звука.
Изначально стандарт SPDIF предусматривал передачу только неупакованного звука (PCM) в стерео-режиме. Однако, так как передача осуществляется в цифровом виде, то возможна передача данных любого формата, лишь бы скорость передачи устраивала. Так появился стандарт на передачу упакованного многоканального звука - режим сквозной передачи (режим SPDIF-passthrough). (В неупакованном виде передавать многоканальный звук нельзя, поскольку скорость передачи ограничена.)
Режим сквозной передачи можно проиллюстрировать так:
Таким образом, звук передается без изменений насквозь через всю систему от DVD-диска (или другого источника звука) до ресивера, откуда и название режима. Так как данные передаются без изменений, то никакие опции по обработке звука на компьютере, включая изменение громкости, недоступны. Все настройки могут производится только на ресивере. Кроме того, одновременно может воспроизводиться только один источник звука, поскольку микширование упакованного звука невозможно.
Так как звук передается упакованным, то ресивер должен уметь его декодировать. Существует очень много форматов сжатия звука, и, очевидно, поддерживать все существующие форматы ресивер не может. Поэтому поддерживаются следующие форматы: AC3 (DolbyDigital), DTS, MPEG Audio (велючая MP3). Но не все ресиверы поддерживают даже этот набор форматов, обычно поддерживается формат AC3, реже - DTS, еще реже - MPEG Audio. Формат DTS имеет более качественное звучание, но формат AC3 боле распространен, поскольку является стандартом для DVD.
Так как декодер, ЦАП и усилитель находятся в одном устройстве, то также становится возможной автоматическая регулировка уровня усиления, что снимает проблему громкости
Для того, чтобы режим сквозной передачи работал необходимы:
Однако, даже при выполнении всех этих требований режим сквозной передачи может работать далеко не всегда. Так, стандартом SPDIF предусматривается всего лишь три частоты дискретизации: 48кГц (DVD), 44.1кГц (AudioCD) и 32кГц. Если источник имеет другую частоту дискретизации, то сквозная передача невозможна. Кроме того, некоторые звуковые карты (например Creative) поддерживают только частоту 48кГц, т.е.режим будет работать только с DVD, и не будет работать со многими другими источниками.
Некоторые звуковые дорожки формата DTS также не могут передаваться в режиме сквозной передачи. Дело в том, что этот формат обеспечивает очень высокое качество звучания, однако степень сжатия у этого формата меньше. Некоторые DTS-записи имеют слишком низкую степень сжатия и пропускной способности SPDIF уже не хватает.
Небольшая сравнительная таблица для аналогового и цифрового соединения:
Аналоговое соединение | Цифровое соединение |
---|---|
(-) Усилитель подключается тремя проводами | (+) Усилитель подключается одним проводом |
(-) ЦАП находится на звуковой карте, и подвержен электронным шумам внутри компьютера | (+) ЦАП находится на внешнем устройстве и может обеспечить лучшее качество звучания |
(+) Формат фактически не ограничен | (-) Много ограничений на формат передаваемых данных |
(+) Можно воспроизводить несколько звуков одновременно | (-) Допускается только один источник звука |
(+) Настройка проще | (-) Настройка сложнее |
(+) Возможность обработки звука на компьютере | (-) Обработка звука на компьютере невозможна |
(+) Цена меньше | (-) Цена больше |
В некоторых случаях есть возможность передавать многоканальный звук даже если режим сквозной передачи недоступен (формат не поддерживается ресивером). Для этого необходимо преобразовать формат в форму, понятную ресиверу:
Такая модель работы позволяет обойти многие ограничения сквозной передачи. Однако необходимо помнить, что кодирование в AC3 - это всегда потеря качества (формат AC3 - это формат кодирования с потерями, также как, например, формат MP3), т.е. главное достоинство цифрового подключения оказывается под вопросом. В таких случаях рекомендуется использовать аналоговое соединение, поскольку оно может обеспечить лучшее качество.
Даный программный продукт распространяется под лицензией GNU General Public License v2, текст прилагается в файле GNU_eng.txt - на английском языке и GNU_rus.txt - на русском языке. Вариант на русском языке прилагается исключительно в справочных целях, при всех возможных разночтениях приоритет имеет версия на английском языке.
Данный программный продукт может быть использован только в демонстрационных целях и в целях обучения. Любое использование помимо этих целей может быть запрещено в некоторых странах. Этот программный продукт может распространяться свободно, за исключением случаев, запрещенных законом.
Даный программный продукт распространяется исключительно в надежде, что он будет полезен, однако безо всяких гарантий работы на конкретном оборудовании, соответствия каким-либо условиям, стандартам или нуждам. Я не обязуюсь обеспечивать круглосуточную (и вообще, какую либо) поддержку, исправление ошибок, восстановление потерянных из-за работы программы данных, отвечать за испорченное железо, а также за потерянное рабочее вермя. Я не несу ответственности за легальность воспроизводимой при помощи данной программы мультимедиа-продукции.
Даный программный продукт может распространяться в виде инсталляционного пакета ($download_bin) на CD-сборниках или вместе с другими программами. Разрешение автора на это не требуется. Для кодек-паков допустимо распространение фильтра в виде отдельного модуля.
Проекту нужна ваша помощь! Если вам нравится программа, она позволяет решить ваши проблемы, вы используете ее дома или в своей профессиональной деятельности, у вас есть идеи, как сделать ее лучше, то вы можете поддержать дальнейшее развитие проекта.
Финансовая поддержка принимается по этому адресу:
Любая сумма важна - это не только деньги, но и моральная поддержка!
Поддержать проект можно не только финансами, я принимаю любую помощь. В первую очередь для тестирования требуется оборудование. Например, множество проблем с режимом SPDIF вызвано полным отсутстием у меня SPDIF-техники.
Также проекту требуется сайт и его поддержка. И в первую очередь - поддержка форума, где многим новичкам требуется терпеливая помощь, а также для выявления действительно серьезных проблем.
Требуется перевод документации. Для огромного количества пользователей ни русский ни английский языки не являются родными. К сожалению, перевод интерфейса пока не планируется, но перевод документации необходим.
Copyright (c) 2002-2004 by | Last updated $date |