Основа этой статья – не мои собственные “измышления” , а скорее суммa позаимствованных из интернета фрагметов, суть которых однако мне близка. И хочу поделиться с вами.
Главная особенность магнитофонной записи, так же как и виниловой пластинки как носителей информации состоит в их аналоговой природе. Что это означает? Слово «аналог» нужно понимать буквально: звук, записанный на ленте или пластинке, аналогичен тому, который извлекали музыканты из своих инструментов. Если упростить процесс максимально, то звуковая волна преобразуется в электрический импульс, а этот импульс рисует волну-дорожку на пластинке ( или ленте ), которая, в свою очередь, позволяет извлечь аналогичный электроимпульс с помощью головки звукоснимателя и преобразовать его обратно в звуковую волну. В ходе всех этих изменений ничего не происходит с природой самого сигнала как непрерывной волны. Меняется лишь её физическое отображение. Это и есть краеугольный камень аналоговой звукозаписи.
В чём принципиальное отличие цифрового сигнала от аналогового?
В дискретности его природы. Проводя пусть и не совсем верную, но наглядную аналогию, можно сравнить его с киноизображением. Секунда киноленты состоит из 24 кадров (дискретных статичных изображений), но наш глаз воспринимает движение на экране как непрерывное. Точно так же устроен и цифровой сигнал — непрерывный музыкальный поток разбит на дискретные точки во времени, информация о которых записывается в файле, а воспроизводящее устройство, считывая эту информацию о ключевых точках, достраивает звуковую волну так, чтобы мы воспринимали её как непрерывный поток звука. Частота дискретизации большинства аудиофайлов, которые сейчас у нас в ходу, — 44,1 кГц, то есть «ключевых точек» с информацией о звуке в одной секунде записи 44 100 штук. По идее, никаких проблем с восприятием столь мелко нарубленного сигнала быть не должно, однако большинство специалистов сходится во мнении, что именно в дискретности цифрового сигнала состоит главная проблема его восприятия. Человеческий слух обмануть оказывается несколько сложнее, чем глаз. Подсознательно мы каким-то образом улавливаем «неестественность» этого звука, хотя сознательно не можем воспринять никаких проблем. Никого на самом деле не раздражает звук MP3-файлов. Всё с ними нормально, кроме того, что сама природа этого сигнала иная, извините за выражение, «нечеловеческая». В природе и нашем организме нет механизмов, способных работать с такой информацией. И это, как ни удивительно, слышно.
Приведу еще две цитаты очень известных и уважаемых в аудио кругах авторов:
” …. Еще одно распространившее «аудиозаблуждение» – в том, что CD якобы обеспечивают больший динамический диапазон, чем аналоговая компакт кассета (КК). При этом в качестве основного аргумента приводится формула шумов квантования NKB:
NKB = 6N + 1,8 [дБ],
где N – разрядность квантования по уровню. Для CD применено N = 16, следовательно теоретический уровень шумов квантования NKB.cd = 6×16 + 1,8 = 97,8 дБ. С чьей-то легкой руки это значение и принимают за динамический диапазон CD. Учитывая, что у лучших КК отношение сигнал/шум составляет (без систем шумопонижения) порядка 55 дБ, то и делается вывод о более чем 40 дБ выигрыше CD. Но нельзя забывать, что принципы аналоговой КК и цифрового CD в корне отличаются, поэтому применять для оценки динамического диапазона CD методы измерения КК некорректно. В КК динамический диапазон снизу действительно определяется уровнем шумов, но это не значит, что так же обстоит дело и у CD!
Взглянув на рис.4, на котором изображены типовые зависимости коэффициента Кни нелинейных искажений КК и CD в функции уровня сигнала, можно легко заметить, что в аналоговой записи Кни с уменьшением уровня монотонно убывает, в то время как у цифровой записи возрастает, стремясь к 40% (поскольку увеличивается относительный размер «ступеньки» квантования). Причем если у аналоговой записи в спектре искажений преобладают не очень режущие слух 2…5 гармоники, то у цифровой дело обстоит гораздо хуже – множество комбинационных составляющих не образуют привычного для слуха гармонического ряда и их действие становится явно заметно уже при уровнях около 1 %. Легко убедиться, что при уровнях сигнала порядка -50 дБ и ниже искажения CD переходят порог допустимых 1 %. То есть снизу динамический диапазон CD оказывается ограничен не шумами квантования, а нелинейными искажениями. И из 97,8 теоретических дБ остается только 50 дБ. Но это еще не все! При перегрузке КК нелинейные искажения пропорциональны квадрату уровня записи (при увеличении уровня в 2 раза коэффициент гармоник возрастает всего в 4 раза) и поэтому их кратковременное возрастание на пиках сигнала незаметно на слух. У CD при превышении номинального входного уровня аналого-цифрового преобразователя (АЦП) всего на 2…3 дБ нелинейные искажения возрастают в десятки тысяч раз, поэтому в реальной аппаратуре цифровой записи за номинальный принимают уровень на 12…15 дБ (т.е. на пикфактор реального музыкального сигнала) меньше предельного входного для АЦП. В результате из исходных 97,8 дБ остается всего 35…37 дБ реальных, что на 20 дБ МЕНЬШЕ, чем у КК. Вот почему, несмотря на субъективное отсутствие «шипа», многие фонограммы, воспроизводимые с CD, приводят к быстрой утомляемости и имеют заметно худшую «глубину стереопанорамы», чем та же фонограмма, воспроизводимая с аналоговой виниловой грампластинки (современные грампластинки, выполненные по технологии Direct Metal Mastering высоко ценятся аудиофилами и обеспечивают динамический диапазон 60…65 дБ) или качественной КК.
(Н. Сухов, Hi-Fi ПРАВДА и High-End СКАЗКИ) ……………… “
Другой интересный фрагмент
“…… С высокими частотами у цифрового формата все немного хуже, по крайней мере точно сложнее. Почти вся суть усовершенствований и усложнений ЦАП и АЦП направлена как раз на более достоверную передачу высоких частот. Под “высокими” подразумеваются частоты сравнимые с частотой дискретизации – то есть в случае 44.1 кГц это 7-10 кГц и выше.
Представим синусоидальный сигнал с частотой 14 кГц, оцифрованный с частотой дискретизации 44.1 кГц. На один период входной синусоиды приходится около трех точек (отсчетов), и чтобы восстановить исходную частоту в виде синусоиды, надо проявить некоторую фантазию. Процесс восстановления формы сигнала по отсчетам происходит и в ЦАП, этим занимается восстанавливающий фильтр. И если сравнительно низкие частоты представляют собой почти готовые синусоиды, то форма и, соответственно, качество восстановления высоких частот лежит целиком на совести восстанавливающей системы ЦАП.Таким образом, чем ближе частота сигнала к одной второй частоты дискретизации, тем сложнее восстановить форму сигнала.
Это и составляет основную проблему при воспроизведении высоких частот. Проблема, однако, не так страшна, как может показаться. Во всех современных ЦАП используется технология пересэмплирования (multirate), которая заключается в цифровом восстановлении до в несколько раз более высокой частоты дискретизации, и в последующем переводе в аналоговый сигнал на повышенной частоте. Таким образом проблема восстановления высоких частот перекладывается на плечи цифровых фильтров, которые могут быть очень качественными. Настолько качественными, что в случае дорогих устройств проблема снимается – обеспечивается неискаженное воспроизведение частот до 19-20 кГц. Пересэмплирование применяется и в не очень дорогих устройствах, так что в принципе и эту проблему можно считать решенной. Устройства в районе $30 – $60 (звуковые карты) или музыкальные центры до $600, обычно аналогичные по ЦАПу этим звуковым картам, отлично воспроизводят частоты до 10 кГц, сносно – до 14 – 15, и кое-как остальные…. “
Ну и что тут можно добавить… все уже сказано. В комментах к такого рода статьям часто приходится читать, что с тех пор уже изобретен дизеринг и оверсемплирование и тому подобные методы сглаживание и восстановления высокочатстоной синусоиды. Вы меня извините, но за наукообразным звучанием этих терминов абсолютно ничего не стоит. Это вовсе не решение проблемы, а только красивое шпаклевание кривого фасада. Я понимаю, что можно путем диззеринга надежно восстановить синусоиду по трем точкам на весь период – но это возможно только для чистой моно-синусоиды, скажем 15 КГц, которая в чистом виде в фонограммах никогда не встречается. То есть – а как быть с реальным звуковым сигналом ? Как можно извлечь из цифрового потока информацию которой там попросту говоря нет ? Без ущерба для качества исходного сигнала – никак. Поэтому я и называю все эти методики шпаклеванием фасада – фасад конечно на месте, но следы шпаклевания и шлифовки все равно остаются – хотим мы этого или нет.
Смутные подозрения о множественных недостатках цифрового формата у меня появились уже давно из-за постоянной неудовлетворенности качеством даже самых лучших СД-дисков, однако я очень долго не мог их четко сформулировать и все время списывал это на недобросовестных издателей, которые из экономии времени ( или из-за криворукости ) записали фонограмму ” как всегда”. Теперь, когда мне удалось собрать достаточно хорошего качества систему с двухдорожечным катушечным магнитофоном ( все записи слушаю на на 38-й скорости ) и сравнить – я могу сказать точно, что описанные выше недостатки цифрового формата слышны явно и это и есть практическое подтверждение приведенных выше теоретических формулировок ( я имею ввиду две цитаты), раскрывающих очень существенные проблемы цифры как звукового формата.
Моей последней попыткой как-то цифру оправдать в своих глазах была покупка цифрового стримера. Современного, со множеством фукций, и по цене почти равной цене всей моей аудиосистемы – то есть лучшее что сейчас предлагают. И что оказалось ? Во-первых, без наружного ЦАПа это вообще невозможно слушать – ни хваленый Tidal, ни тем более Spotify. Только когда поставил свой ЦАП с ламповым выходом, более-менее сносно зазвучали потоки 96 КГц и выше ( и то только тогда когда интернет тянет не менее 30 Мбит/с – иначе все всю эту радость портят регулярные 1-2 секундные провалы – “фризы” ). Все остальное – кукольный, игрушечный как-бы, я бы сказал пустой звучек с жиденьким басом. Конечно при этом чистенький, стерильненький, без фона, шипения и шума, но это – очень слабое утешение для тех, кто хочет иметь настоящий, насыщенный и богатый звук приближенный к реальности.
Все мы быстро привыкаем к тому, что у нас есть. Это и хорошо и плохо. Хорошо в том смысле, что отсутствие альтернативы делает наше существование проще – не надо париться и чего-то там сравнивать и потом опять что-то менять. А плохо тем, что чтобы поддержать это наше упрощенное видение этого мира мы к цифре пододвигаем “умные” теории и процессорные приемы типа дизеринга и оверсемплирования, чтобы находиться в мире с самим собой – вместо того, чтобы открыть свои уши и сердце для восприятия реалий.