Основы цифрового звука













Tweet

what is sound, что такое звук

В основе цифрового аудио лежит математическое представление звуковой волны. Цифровой мир развивается очень быстро, и нет ничего удивительного в том, что многим цифровые технологии кажутся сложными. Цель этой статьи – объяснить, что такое цифровой звук, не вдаваясь в сложные математические подробности. Чтобы разобраться, что такое цифровой звук, нужно в первую очередь понять, что внутри компьютера нет никаких звуков, а есть только одна математика. Эта статья подготовлена для сайта Sound Talks.


Что такое звук?

Звук – это вибрация молекул. Математически звук может быть точно описан как «волна». У него есть максимальное пиковое значение (горб волны) и минимальное значение (прогиб). Если вы когда-нибудь видели графическое изображение звуковой волны, то заметили, что звук всегда изображается кривой, постоянно пересекающей ось X. Это означает, что природа звука «периодична». Любой звук имеет гребень волны и прогиб, положительный период и отрицательный. Это называется циклом. Так вот, основное понятие – все звуки имеют хотя бы один цикл.

Следующая важная идея заключается в том, что любая периодическая функция может быть математически представлена серией синусоид. Другими словами, даже самый сложный звук – это всего лишь набор синусоидальных волн. Голос может постоянно изменять свою громкость и высоту тона, но в любом момент звучания голос является только набором синусоидальных волн.

И, наконец, третье: люди не слышат звуки частотой выше 22 кГц. Так что все, что выше 22 кГц, записывать не обязательно.

Итак, еще раз, основы звука заключаются в том, что:

  1. Звуковые волны периодические и поэтому могут быть описаны как набор синусоидальных волн.
  2. Любые волны частотой выше 22 кГц нас не интересуют, потому что физически мы не можем их услышать.

Переход от аналогового звука к цифровому

Предположим, я говорю в микрофон. Микрофон преобразует мой голос в непрерывный электрический ток. Этот электрический ток бежит по проводу через какой-нибудь усилитель и, в конце концов, попадает в аналогово-цифровой преобразователь (АЦП). Помните, что компьютер не хранит звуки, а хранит математические значения, так что нам нужно что-то, что преобразует аналоговый ток в последовательность единиц и нулей. Вот этим АЦП и занимается. Говоря простым языком, конвертер делает быстрые снимки звуковой волны, называемые семплами, и каждому семплу присваивает значение амплитуды. И здесь мы подходим к двум основным понятиям, которые помогут объяснить природу цифрового звука. Эти понятия – время и амплитуда.


Битность звука

audio bit depth, битность звука

В цифровом мире нет ничего непрерывного – все имеет определенное математическое значение. В аналоговом мире звуковая волна достигнет своего пикового значения, и все значения от 0 дБ до пика будут существовать. А в цифровом сигнале существует ограниченное число возможных значений амплитуды. Представьте аналоговый звук как кого-то, плавно поднимающегося на эскалаторе, в то время как цифровой звук – кто-то, кто поднимается по лестнице, и в течение времени он находится либо на одной ступеньке, либо на другой. Или, скажем, есть значения 50 и 51. Так вот, в аналоговом звуке может быть какое-нибудь промежуточное значение 50,46, а в цифровом звуке это значение будет округлено до 50. Это означает, что фактически звуковая волна при прохождении через АЦП искажается. А так как аналоговый сигнал непрерывен, то это округление значений происходит постоянно в процессе конвертации. Это называется ошибкой квантования, и звучит это как странный шум. Но давайте представим лестницу с большим количеством ступенек, высота которых меньше. Теперь у нас есть значения 50, а за ним 50,2, а за ним 50,4, а за ним 50,6 и т.д. Аналоговый сигнал со значением амплитуды 50,46 теперь округлится не до 50, а до 50,4. Это важное усовершенствование, которое не избавляет полностью от ошибок квантования, но в значительной степени снижает их влияние. Увеличение битности по своей сути является увеличением числа ступенек на лестнице с уменьшением их высоты. При уменьшении ошибки квантования снижается уровень шумов.

Вы спросите, а зачем мне нужно это знать? Дело в том, что в современной музыке используется очень много компрессии. Стало вполне обычным достигать максимальной плотности звука, сжимая и зачастую пережимая записанный инструмент или голос, а потом еще снова обрабатывать компрессором уже весь микс. Помните, что одним из главных недостатков компрессии является повышение уровня шумов! После компрессии совершенно незаметные погрешности квантования внезапно становятся слышимыми. Особенно заметным это становится в наиболее тихих частях песен, например, где остается звучать только один инструмент, или когда в конце песни все инструменты начинают плавно затухать. Более высокая битность при записи позволит вам добиться значительно меньшего уровня шума.


Ширина диапазона частот и частота дискретизации

Частота дискретизации, возможно, наиболее спорный вопрос в мире цифровой аудиозаписи. Частота дискретизации определяет, как быстро компьютер делает те самые снимки звука, о которых мы говорили в начале. Большинство людей полагает, что чем чаще делать эти снимки (вообще этот процесс больше похож на пульсацию, чем на фотосъемку, но неважно), тем полученные результаты больше будут похожи на непрерывный звук. А значит на аналоговый звук. Но это не совсем так. Помните, цифровой мир состоит из математики, а не из звуков. Понимаю, со стороны чересчур хитро все обстоит, но потерпите меня еще немного, я все объясню.

audio sample, дискретизация звука

Звук в своей основе – набор синусоидальных составляющих. И для определения синусоиды необходимо всего три контрольных значения. Так вот, для того, чтобы правильно описать синусоидальные составляющие, частота дискретизации (семплирования) должна быть хотя бы в 2 раза выше частоты звука. И если мы не слышим звуки выше 22 кГц, или синусоидальные волны, чей цикл повторяется более 22 000 раз в секунду, то все что нам нужно – это делать 44 000 снимков в секунду. Вот откуда появилась всем известная частота дискретизации: 44,1 кГц.

Но постойте! Что, если функция между этими тремя контрольными точками – не синусоида? Что, если ее график какой-нибудь причудливой формы и получается так, что АЦП, основываясь только на трех контрольных точках, превращает этот график в синусоиду? Дело в том, что даже самая сумасшедшая функция раскладывается на синусоидальные составляющие. И если эти синусоидальные составляющие находятся в слышимом диапазоне частот, то АЦП их правильно захватывает. А если же эти синусоиды слишком быстры для нашей частоты дискретизации – то ничего страшного, мы все равно их не услышим.

Помните, цифровой звук – это не столько звук, сколько математика. Как только поступают данные с АЦП, компьютер преобразует биты в гладкую непрерывную кривую звуковой волны. И не важно, сколько у вас контрольных точек, 3 или 300, построенный по ним компьютером звук будет звучать одинаково.

А что же на счет частот дискретизации 88,2, 96 и 192 кГц? Во-первых, еще не на 100% доказано, что человек слышит звуки только до 22 кГц. Во-вторых, в АЦП используется ограничение по частоте на уровне ½ частоты семплирования. При частоте семплирования 44,1 кГц АЦП обрезает частоты выше 22 кГц. И если он не настроен должным образом, это может вызывать искажения на частотах ниже 22 кГц, называемые «алиасингом» (наложение частот). Кроме того, определенные программные плагины, в частности эквалайзеры, страдают искажением фазы на высоких частотах. Искажение происходят на границе диапазона частот, который подвергается эквализации. Если ваш диапазон частот ограничен 22 кГц и вы хотите поднять уровень ВЧ с помощью эквалайзера, то поднятые высокие частоты оборвутся на 22 кГц резко, а не плавно. Правда, это уже тема для другой статьи, но так или иначе подобные эффекты искажают звук.

Теоретически запись при 16 битном кодировании на частоте дискретизации 44,1 кГц будет звучать так же, как и при 24 битном кодировании на 192 кГц. Но на практике во втором случае хвосты записи будут чище, более прозрачно будет звучать реверберация, верхний диапазон частот будет более гладким, и значительно меньше будет проявляться эффект алиасинга.

Возможно Вас также заинтересует:

  • Статьи о понятии звука: «Основные понятия звука»

Вернуться на главную

 

forum logo

join group 3

register


  • Автор: alhemist
  • Оригинал статьи
.