Новый сервис, где искусственный интеллект отвечает на вопросы

AnyQuestion

5. Особенности цифровых технологий звукозаписи

"ПТЭ-2001. Правила эксплуатации технических средств телевидения и радиовещания" (приняты и введены в действие Приказом МПТР России от 12.07.2002 N 134)

Документ утратил силу или отменен

5. Особенности цифровых технологий звукозаписи

5.1. Существует множество цифровых систем звукозаписи, ориентированных на конкретную задачу. Наиболее универсальными являются системы на базе персонального компьютера. Обычно такая система состоит из интерфейса ввода-вывода и программного обеспечения. Дополнительно конструкция может позволять устанавливать спецпроцессоры для разгрузки центрального процессора от операций со звуком. При наличии мощного компьютера и небольших требований к системе записи (до 24 дорожек) достаточно одного центрального процессора. Расширение возможностей такой станции обычно сводится к установке нового программного обеспечения с новыми алгоритмами.

Также имеются автономные системы записи, выполненные в виде небольшого пульта с накопителем. Носителями записи в таких системах являются жесткий диск (компьютерного типа) или мини-диск. В основном это полупрофессиональные любительские системы. Профессиональные автономные системы записи на жесткий диск, как правило, имеют минимальный набор монтажных функций и скорее относятся к цифровым многоканальным магнитофонам с диском вместо кассеты.

5.2. Входные цепи цифровой студии, с одной стороны, должны отвечать требованиям, предъявляемым к студийной аппаратуре, таким, как согласование входных/выходных уровней и импедансов (сопротивлений), а с другой - к ним предъявляются более жесткие требования, так как отношение сигнал/шум в современных цифровых системах составляет более 100 дБ. Ранее под входными цепями подразумевались усилительные линейки микшерного пульта. Теперь принято использовать технологию непосредственной записи на жесткий диск. Единственным прибором, включенным между источником звука и аналого-цифровым конвертором, чаще всего является предусилитель/компрессор, который дает необходимое усиление при работе с микрофонными уровнями сигнала и обеспечивает мягкую компрессию или жесткое ограничение сигнала. Все большее распространение получают так называемые "голосовые процессоры", которые сочетают в себе предусилитель, компрессор, эквалайзер, деэссер и другие дополнительные эффекты. Такие приборы лучше всего применят там, где надо оперативно получить качественный звук и нет возможности для сведения и редакции фонограмм. Это прямые эфиры, репортажи и т.д. Полученная таким способом запись уже может являться конечным продуктом. В студийной практике не рекомендуется вносить частотные изменения в исходный сигнал, чтобы иметь возможность маневра при сведении.

5.3. Качество оцифрованного материала зависит от уровня сигнала, подвергаемого оцифровке. Чем выше уровень сигнала, чем ближе он к максимальному, тем выше уровень воспроизводимого сигнала по динамике и лучше соотношение сигнал/шум. С другой стороны, малейшая перегрузка аналого-цифрового конвертора приводит к очень серьезным искажениям, практически не поддающимся дальнейшему исправлению. Получение максимально энергетически насыщенной фонограммы, лишенной непредсказуемых "всплесков", - задача динамических приборов во входных цепях. Правильный контроль уровня цифруемого сигнала - одна из главных задач оцифровки. Большинство измерителей уровня в микшерных пультах зарубежного производства, со временем интеграции порядка 300 мс, для этой задачи не подходит. К сожалению, 0 дБ на таком измерителе может означать +14 дБ по пикам, что неприемлемо для цифровой аппаратуры. Считается, что человеческое ухо не в состоянии оценить "всплеск" по амплитуде длительностью менее 5 мс и соответственно заметить перегрузку такой длительности. Однако даже такие "незначительные" перегрузки часто недопустимы, поэтому для измерения уровня записи лучше всего подходит цифровой индикатор DBFS (дБ полной шкалы), он же Peak Meter (PPM). Ноль этого измерителя точно соответствует максимальному уровню, распознаваемому аналого-цифровым конвертором, малейшее превышение нуля означает перегрузку. Как правило, это измерители на цифровых интерфейсах компьютерных станций, цифровых пультах, в компьютерных программах редакции звука. Единственной особенностью является то, что на одних системах последнее, "красное", деление измерителя означает перегрузку, на других - максимальный уровень.

5.4. При цифровой форме записи сигнала с уровнем больше "0" дБ не может быть. Однако производители аппаратуры закладывают в конструкцию систем так называемый резервный динамический диапазон (headroom), когда ноль на квазипиковом индикаторе может оказаться "-5 дБ" или "-10 дБ" на аналого-цифровом конверторе. Классическим примером могут служить магнитофоны ADAT. На современных системах записи резервный динамический диапазон может составлять до "-18 дБ". Если не насыщать входной сигнал и писать с "запасом" по уровню, то, учитывая резервный динамический диапазон, можно потерять в динамическом диапазоне 25 - 30 дБ. То есть эффективными остаются, например, 10 бит из 16. Такую фонограмму можно смело называть 10-битной, независимо от качества аппаратуры, на которой она была получена.

5.5. Основными параметрами, определяющими качество цифровой записи, являются частота дискретизации (sample rate) и битность (bit dept), с которыми записывается сигнал. Частота дискретизации определяет верхний порог частотного диапазона. Верхняя граничная частота теоретически составляет 1/2 от частоты дискретизации. Стандартные частоты дискретизации: 44100 Гц для компакт-диска; 48000 Гц для DAT, ADAT; 32000 Гц для цифрового спутникового телевидения первого поколения. Практически, учитывая потери в цифровых фильтрах, верхний предел для частоты дискретизации 44100 Гц составляет 20 - 21 кГц, нижний предел ограничен 2 - 3 Гц для того, чтобы исключить постоянную составляющую. "Битность" в цифровом формате обеспечивает соотношение сигнал/шум, динамический диапазон и коэффициент нелинейных искажений. Стандартными разрешениями являются: 8 бит для мультимедиа, 16 бит для компакт-диска, 24 бита для студийной работы и дисков DVD. Теоретически 16 битами можно закодировать 96 дБ динамического диапазона, 24 битами - 144 дБ. Практически не существует аналого-цифровых конверторов, обеспечивающих диапазон более 110 дБ. Не надо путать с внутренним разрешением алгоритмов, используемых для обработки звука в компьютерах и цифровых пультах, которые могут хранить промежуточные данные своих вычислений с разрешением до 96 бит (576 дБ), что используется для снижения нелинейных искажений, вносимых при обработке, общее разрешение системы от этого не меняется.

5.6. Оцифрованный звук образует цифровой поток, зависящий от частоты дискретизации, битности и количества каналов. Например, компакт-диск дает 44100 Гц x 16 бит x 2 ~= 1411,2 кбит/сек. (176 кбайт/сек.). Таким образом, минута записанной информации займет более 10 Мбайт. Зачастую это неприемлемо (для передачи по линиям связи, например), а снижать частоту дискретизации или битность нельзя. Поэтому были разработаны алгоритмы сжатия (компрессии), основанные на том факте, что звуки маскируются друг другом и часть записанной информации для уха избыточна, при этом можно получить гораздо меньший цифровой поток с качеством почти как у оригинала. В основном такие системы применяются для передачи информации через линии связи и для воспроизведения в эфире, где потери самого эфира выше, чем потери качества, вызванные компрессией. Наиболее распространенными являются алгоритмы MPEG (MPEG-1 Layer 3, он же МР3 для мультимедиа и бытового использования и MPEG-2 для спутникового вещания). Типичный цифровой поток, дающий качество, близкое к фонограмме на компакт-диске, для МР3 составляет 128 кбит/сек. или 16 кбайт/сек., что в 10 раз меньше подсчитанного выше, т.е. степень сжатия 1:10. Очень распространенным является алгоритм ATRAC, используемый в мини-дисках, степень сжатия которого 1:5, а качество кодирования у новых версий практически не отличается от оригинала.

5.7. При соединении нескольких цифровых приборов необходимо обеспечить синхронное тактирование всех цифровых устройств, иначе при прохождении аудиосигнала через несинхронизированный прибор будут прослушиваться щелчки. Например, в магнитофонах DAT синхронизация наступает при подключении источника цифрового сигнала через интерфейс S/PDF или AES/EBU. Это весьма нестабильный источник синхронизации с большим дрожанием по фазе (jitter), но достаточный, чтобы корректно произвести запись. Для синхронизации студийных компонентов принято использовать прямую синхронизацию через Master Clock, который бывает двух основных видов: Word Clock - 64 Fs и Super Clock - 128 Fs или 256 Fs, где Fs - частота дискретизации. Если АЦП/ЦАП имеет линейную систему, то ему достаточно Word Clock, но большинство современных АЦП/ЦАП выполнено по Дельта-сигма технологии и требуют Super Clock. Важно соблюдать следующее правило: ведущим (master) может быть только один прибор, все остальные должны быть ведомыми (slave). В больших студиях в качестве ведущего используют специализированные тактовые генераторы. При коммутации надо учитывать, что не все приборы могут быть ведомыми в силу своей конструкции.

5.8. Как было сказано выше, подключение цифровым способом не всегда возможно, например, когда прибор чисто аналоговый или не имеет платы цифровых интерфейсов. Тогда очень важно иметь качественные АЦП/ЦАП, потому что при неоднократной переоцифровке звука происходит эффект его "замазывания". Аналогичный эффект получается при неоднократном пересчете частоты дискретизации в цифровом виде. Очень много приборов работает на фиксированной частоте (например, 48 кГц) и имеет преобразователи частоты дискретизации (Sample Rate Converters). Такая "универсальность" весьма сомнительна. Также необходимо обращать внимание на битность: при переходе от большего разрешения к меньшему без дополнительных мер значительно увеличивается коэффициент гармоник в результате отброса младшей части семпла (Truncate). Заметным это становится обычно при малых уровнях сигнала.

5.9. На сегодняшний день почти все операции по обработке звука можно выполнить непосредственно в персональном компьютере без использования внешних модулей. Разработкой таких программ занимаются различные сторонние фирмы, а не производитель самой системы записи, поэтому такие модули подключаются в виде дополнения (Plud-Ins) к основной системе. Практически все современные "плагины" имеют возможность работать в реальном масштабе времени, т.е. работа с ними не отличается от работы с внешними модулями, однако существует ряд алгоритмов, требующих значительное время для обработки, которое может превышать реальное в несколько раз. Как правило, эти алгоритмы качественного преобразования частоты дискретизации, сжатия/растяжения времени без изменения высоты тона, с изменением высоты тона и т.д.

5.10. Измерители уровня с большим временем интеграции (VU), дающие возможность оценить среднюю громкость фонограммы, непригодны для оценки цифровых пиковых уровней, а РРМ-индикатор для контроля уровня цифровой записи ничего не говорит об уровне громкости. Для правильного контроля уровня записи фонограммы необходимо применение комбинированного измерителя, содержащего в себе пиковый индикатор и RMS-индикатор с временем интеграции порядка 300 мс. При правильно компрессированной фонограмме разница в показаниях должна составлять примерно 12 дБ.

5.11. Некомпрессированные аудиоданные занимают достаточно много места, поэтому для радиовещания все больше применяют компрессию в МР3. Так, на один компакт-диск помещается почти 800 минут стереоданных с качеством фонограммы не хуже, чем на мини-диске. Очень часто сжатые данные хранят на жестком диске компьютера, и так как один современный жесткий диск позволяет разместить до 2000 часов звучания, то это фонотека хорошей радиостанции. Для студийной работы в 24-битном разрешении архивы в основном хранят в виде компьютерных файлов на компакт-дисках. Одна из причин - отсутствие накопителей с разрешением в 24 бита. Преимущество - можно хранить не только файлы со звуком, но и весь проект с плей-листом, настройками модулей обработки и т.д. Ниже в таблице приведены основные форматы записи на внешние устройства.

Таблица Б.1

ПАРАМЕТРЫ ОСНОВНЫХ ФОРМАТОВ ЗАПИСИ

НА ВНЕШНИЕ УСТРОЙСТВА

Формат записи

Объем цифрового потока

Количество каналов

Вид компрессии

DAT

16 бит / 44/48/32 кГц

2 канала

Нет

CD

16 бит / 44 кГц

2 канала

Нет

MD

16 бит / 44 кГц

2 канала

Компрессия 1:5

MD-Data

16 бит / 44 кГц

4 канала

Компрессия 1:5

MP3-CD

16 бит / 44 кГц (любой)

2 канала

Компрессия 1:1 - 1:20

DVD-audio

24 бит / 96 кГц

2 - 6 каналов

Компрессия MPEG-2

ADAT

16 бит / 44/48 кГц

8 каналов

Нет

ADAT-XT

16/20 бит / 44/48 кГц

8 каналов

Нет

DA - 88/98

16 бит / 44/48 кГц

8 каналов

Нет