понедельник, 23 сентября 2013 г.

Домашний кинотеатр : в окружении виртуального звука (часть 2.)

Домашний кинотеатр : в окружении виртуального звука (часть 2.)
МЕТОДЫ ПОСТРОЕНИЯ СИСТЕМ ВИРТУАЛЬНОГО ЗВУКОВОГО ОКРУЖЕНИЯ
Текст: Ярослав ВОРОБЬЕВ
МНОГОКАНАЛЬНЫЕ СИСТЕМЫ ДОМАШНИХ РАЗВЛЕЧЕНИЙ
Домашний кинотеатр : в окружении виртуального звука (часть 2.)
МЕТОДЫ ПОСТРОЕНИЯ СИСТЕМ ВИРТУАЛЬНОГО ЗВУКОВОГО ОКРУЖЕНИЯ
Бинауральное воспроизведение звука
Схема бинауральной записи и воспроизведения
Одним из методов построения 3-мерного звукового пространства с помощью 2 громкоговорителей являются так называемые бинауральные звуковые системы. Идея бинауральной записи и воспроизведения появилась достаточно давно, что, однако, не мешает нам рассмотреть ее более подробно.
Давайте предположим, что у нас есть возможность расположить два микрофона с абсолютно линейной амплитудно-частотной характеристикой непосредственно в слуховых каналах головы человека. В этом случае звуковые сигналы, воспринимаемые этими микрофонами будут содержать в себе всю информацию, необходимую для определения месторасположения звукового источника головным мозгом (об этом мы писали выше). Предположим, что нам удалось без изменений записать эти сигналы. Если затем подать их на головные телефоны (наушники) которые мы смогли бы поместить на место микрофонов, т.е. опять непосредственно в слуховые каналы, то воспринимаемый нами звук соответствовал бы первичному звуковому полю источника и также содержал бы всю необходимую информацию для локализации его источника в 3-мерном пространстве.
Эксперименты по созданию бинауральных звуковых систем проводились с помощью специального манекена, имитирующего человеческую голову, и продолжаются по сей день. Нужно отметить, что в этом направлении были достигнуты значительные успехи. Например, отмечено, что при бинауральной схеме звуковоспроизведения значительно повышается способность слушателя к локализации звуковых источников в 3-мерном пространстве, усиливается так называемый "эффект присутствия", который и является нашей целью в домашних развлекательных системах.
Однако, как легко догадаться, не все так гладко, иначе про обычную стереофонию и многоканальные системы домашнего кинотеатра мы бы уже давно забыли.
Во-первых, все люди разные и все они отличаются формой головы, тела, ушной раковины и т.д., поэтому записи, сделанные с использованием "искусственной головы" носят более чем усредненный характер, а этого порой бывает недостаточно для того, чтобы ввести в заблуждение наш мозг и создать иллюзию трехмерности.
Во-вторых, даже произведя идеальную запись сигнала непосредственно в ушных каналах "искусственной головы", мы не можем воспроизвести записанные сигналы непосредстевенно в слуховых каналах реального слушателя.
В третьих, не существует аппаратуры, которая могла бы абсолютно точно записывать и воспроизводить звук (любая аппаратура вносит свои изменения, а в данном случае важны мельчайшие нюансы).
Наконец, многие просто не любят прослушивать музыку в наушниках, испытывая при этом значительный дискомфорт. Этот дискомфорт в частности связан еще и с тем, что при использовании качественных студийных или Hi-Fi наушников закрытого типа наши ушные раковины оказываются прижатыми к голове, а такое положение является для них неестественным, что приводит к снижению точности пространственного восприятия и быстрой утомляемости.
Широкому распространению бинауральных звуковых систем мешает также и то, что записи для них, очевидно, должны быть сделаны специальным образом (обычные стерео записи не подойдут, поскольку они не несут всей необходимой для пространственной локализации информации). Такие записи в принципе есть, но их крайне немного, да и стоят они достаточно дорого, поэтому их следует рассматривать скорее как демонстрационный материал, нежели реальную возможность для использования в системах домашнего развлечения.
Функции HRTF
Идея записи и воспроизведения 3-мерного звука с помощью бинауральных систем получила свое развитие с появлением и совершенствованием процессоров звуковой обработки. Действительно звуковой сигнал, поступающий в слуховые каналы человека, получается за счет определенной трансформации (по частоте, фазе и уровню) сигнала излучаемого источником звука. Функции, по которым производится данная трансформация, получили название HRTF (Head Related Transfer Function или Передаточная Функция Головы). Стоит ли говорить, что эти функции слишком сложны для того, чтобы их можно было получить обычными вычислительными методами. Как правило, эти функции получают экспериментальным путем, измеряя параметры звукового сигнала с использованием описанных выше манекенов.
Проведение многочисленных экспериментов позволило разработчикам пространственных звуковых систем создать обширные базы данных, использование которых в современных звуковых процессорах позволяет добиться впечатляющих результатов. Действительно, если звуковой процессор, занимающийся обработкой сигнала, обладает достаточным быстродействием для расчета звуковых характеристик с использованием HRTF в реальном времени, то система, в которой он работает, сможет создавать 3-мерное звучание без использования специальных бинауральных записей и головных телефонов в слуховых каналах. Кстати, библиотека HRTF фильтров создается в результате лабораторных измерений, производимых с использованием манекена, носящего гордое название KEMAR (Knowles Electronics Manikin for Auditory Research) или с помощью специального "цифрового уха".
Алгоритм Crosstalk Cancelation
Алгоритм Crosstalk Cancellation
Современные процессоры позволяют обходиться вообще без наушников, а использовать обычные акустические системы, используя так называемый алгоритм Crosstalk Cancellation. Суть этого алгоритма в следующем. Предположим, что мы используем сигнал, обработанный звуковым процессором с использованием функций HRTF на обычные акустические системы. Предположим также, что используемые в процессоре функции позволяют учесть тот факт, что звуковые сигналы излучаются не наушниками, а удаленными от слушателя громкоговорителями. Однако даже при этом мы не сможем просто так получить желаемый результат. Дело в том, что наушники без проблем позволяют подвести сигнал, предназначенный для правого уха именно к этому уху и только к нему, левое ухо его слышать не будет. То же самое можно проделать с сигналом, предназначенным для левого уха. В случае использования обычных громкоговорителей это, к сожалению, невозможно. Сигнал, излучаемый левым громкоговорителем, будет восприниматься обоими ушами - и левым и правым, и наоборот.
Предположим, что при помощи 2 акустических систем необходимо спозиционировать виртуальный звуковой источник, находящийся в определенной точке слева от слушателя. Если запись звука этого источника производилась двумя микрофонами, разнесенными на расстояние эквивалентное расстоянию между ушами, то вполне вероятна ситуация, когда правое ухо вначале услышит кросстолк-сигнал с левого громкоговорителя и лишь затем полезный сигнал с правого. В силу эффекта Хааса (или иначе эффекта предшествования) полезный сигнал правой колонки в этом случае будет полностью проигнорирован. Эффект Хааса, кстати, заключается в том, что при обработке пакета аудио информации, состоящего из отдельных звуковых импульсов, слегка разделенных во времени, наш мозг использует только первый импульс для вычисления направления на источник, приписывая всем последующим те же самые пространственные координаты.
В рассмотренной выше ситуации слушателю будет казаться, что звучит только левая (т.е. ближайшая к записанному виртуальному источнику) колонка. Пространственной звуковой панорамы в этом случае получить не удастся.Для того чтобы устранить негативное влияние кросстолк сигнала в том или ином канале на восприятие аудио информации был разработан алгоритм Crosstalk Cancellation, который подразумевает "подмешивание" в левый громкоговоритель сигнала, предназначенного для правого громкоговорителя, но с определенной задержкой во времени. Эта задержка подбирается таким образом, чтобы звук, пришедший к правому уху от левого громкоговорителя, оказался в противофазе с "подмешанным" сигналом от правого громкоговорителя. При этом они нейтрализуют друг друга, и левое ухо будет воспринимать только сигнал с левой колонки, а правое - только с правой.
Зона комфортного прослушивания или Sweet spot
Комфортное прослушивание возможно только в узкой зоне, называемой Sweet Spot
Даже в теории, как видите, все получается достаточно непросто, на практике же построение 3-D звука с помощью двух акустических систем является архисложной задачей. В частности, все расчеты, о которых мы написали выше, можно произвести только для конкретной области прослушивания, которая называется Sweet Spot (дословно - "сладкое пятно"). Как только слушатель покинет пределы этой области, алгоритм Crosstalk Cancellation естественно перестанет работать, поскольку требуемые сигналы перестанут приходить в противофазе. Естественно, очень многое зависит и от характеристик самого звуковоспроизводящего тракта и в первую очередь от акустических систем.
Впрочем, на практике ситуация не такая уж безнадежная. Чрезмерная чувствительность алгоритма Crosstalk Cancellation проявляется только на высоких частотах (более 1 кГц), где содержится не так уж много звуковой информации, а голова начинает служить хорошим экраном от проникновения паразитного кросстолк-сигнала и, следовательно, необходимость в его применении становится меньше.
Большинство производителей все же пока ограничивается использованием упрощенных алгоритмов построения 3-D звука с применением усредненных (подходящих для большинства людей) функций HRTF. К сожалению, в результате, создаваемая звуковая картина также получается весьма усредненной либо же не получается вовсе.
Системы, работающие по принципу отражения от стен
Аудиосистемы, работающие по принципу отражения от стен
Для того, чтобы создать эффект виртуального звукового окружения вовсе не обязательно производить сложную процессорную обработку аудиосигнала. Можно воспользоваться тем обстоятельством, что аудиосистемы в большинстве своем работают в закрытых комнатах, в которых есть отражающие звук поверхности - стены, пол и потолок. Именно этот принцип использует, к примеру, английская компания KEF, выпустившая систему громкоговорителей, состоящих из традиционного для этой компании модуля UniQ, обеспечивающего звучание фронтальных и центрального каналов, а также плоских звуковых панелей NXT, расположенных по бокам акустических систем и излучающих звук тыловых каналов. При корректном расположении акустических систем относительно места прослушивания и стен помещения звук тыловых каналов, отраженный от стен помещения придет к слушателю не спереди, а сбоку, обеспечив таким образом правдоподобное окружение.
Системы использующие только процессорную обработку
В принципе, к системам, использующим процессорную обработку для создания эффекта виртуального окружения, можно отнести практически любой современный AV-ресивер. Почти все эти аппараты имеют тот или иной алгоритм для имитации тыловых эффектов при помощи только двух громкоговорителей. Интересное решение предложила немецкая компания Audica, производящая стильные дизайнерские акустические системы. К примеру, в одном из наших тестов приняла участие 2-канальная система виртуального окружения, однако в ней были использованы не 2 фронтальных громкоговорителя, а фронтальный и тыловой. Эти акустические системы располагаются горизонтально (наподобие АС центрального канала в обычных 5-канальных театральных системах) и имеют возможность подключения сразу нескольких каналов (правого, левого и центрального для фронтальной АС и левого и правого тыла для задней колонки). При этом каждый канал звуковоспроизведения использует свой собственный набор динамических головок, заключенных в едином корпусе. Данные АС требуют подключения к обычному AV-ресиверу, и как показал дальнейший тест их желательно использовать с теми или иными алгоритмами расширения звукового пространства.
Системы с особой конфигурацией динамиков и процессорной обработкой
Как мы уже упоминали разработка и применение комплекса функций HRTF для системы, воспроизводящей звук через обычные громкоговорители, является очень сложной задачей. В связи с этим многие производители идут на определенный компромисс, проводя обработку звука по упрощенному алгоритму, но зато используя специальную конфигурацию установки динамиков в громкоговоритель.
Например, компания Polk Audio предложила горизонтальный громкоговоритель Surround Bar, в котором основной сигнал виртуального тыла подается на один комплект динамиков, а корректирующий сигнал для устранения кросстолк-эффекта - на другой комплект динамиков, отстоящих от основных на расстояние, примерно равное расстоянию между человеческими ушами.
Компания Aleks Digital Technology предложила использовать комплект, состоящий из горизонтальной АС с тремя комплектами фронтальных динамиков и двумя боковыми, расположенными на торцах колонки. Эффект виртуального окружения достигается за счет аналоговой обработки аудиосигнала, которая манипулируя фазовыми сдвигами позволяет подать необходимый сигнал на тот или иной комплект динамических головок.
Очень интересное решение предложила датская компания Final Sound, известная производством электростатических громкоговорителей самого высокого уровня. В системе Final звук, подвергаясь процессорной обработке, подается на 2 фронтальные электростатические системы. Как известно, электростаты имеют биполярную характеристику направленности. Подавая на них дополнительный сигнал с фазовой задержкой, можно получить практически однородное звуковое пространство, окружающее слушателя в любой точке комнаты прослушивания.
Звуковые проекторы
Распространение "лучей" звукового проектора в помещении
Схема работы звукового проектора
Японская компания Yamaha, известная своими многочисленными достижениями в области цифровой обработки звука, продолжает развивать направление звуковых проекторов, которые стали весьма успешным коммерческим продуктом в ряде стран мира. Идея звукового проектора заключается в размещении большого количества динамических головок в одной плоскости громкоговорителя. Каждый из динамиков имеет собственный усилитель и управляется цифровым процессором, который может производить фазовые манипуляции. Таким образом, звуковой проектор Yamaha представляет собой фазированную антенную решетку. Варьируя фазы звуковых сигналов, поступающих на те или иные динамики, можно управлять направленностью звука всего проектора. При необходимости получить эффект звучания тыловых громкоговорителей можно направить звуковые лучи таким образом, чтобы они, отразившись от стен комнаты прослушивания, достигли зрительского места сбоку или сзади.
Надеемся, что после прочтения данной статьи у вас возник вопрос, как же теория, изложенная в ней, согласуется с реальностью. Постараемся ответить на этот вопрос в самое ближайшее время, опубликовав на нашем сайте тест систем виртуального звукового окружения. Если честно, то данного теста мы и сами ждем с нетерпением.

Комментариев нет: