Основы психоакустики


Часть 14. Тембр, Часть 3 [6]



жүктеу 0.85 Mb.
бет3/6
Дата09.05.2019
өлшемі0.85 Mb.
1   2   3   4   5   6

Часть 14. Тембр, Часть 3 [6]


Тембр и фазовый спектр

Все изложенные в предыдущих двух статьях результаты по установлению связи воспринимаемого тембра с акустическими характеристиками сигнала относились к амплитудному спектру, точнее, к временному изменению спектральной огибающей (в первую очередь смещению энергетического центра амплитудного спектра-центроида) и развертыванию во времени отдельных обертонов.

В этом направлении было проделано наибольшее количество работ и получено много интересных результатов. Как уже было отмечено, на протяжении почти ста лет в психоакустике превалировало мнение Гельмгольца о том, что наша слуховая система не чувствительна к изменениям фазовых соотношений между отдельными обертонами. Однако постепенно были накоплены экспериментальные данные о том, что слуховой аппарат чувствителен к изменениям фаз между различными компонентами сигнала (работы Шредера, Хартмана и др.). В частности, было установлено, что слуховой порог к фазовому сдвигу в двух- и трехкомпонентных сигналах в области низких и средних частот составляет 10…15 градусов.

В 80-х годах это привело к созданию ряда акустических систем с линейно-фазовой характеристикой. Как известно из общей теории систем, для неискаженной передачи сигнала необходимо, чтобы соблюдались постоянство модуля передаточной функции, т.е. амплитудно-частотной характеристики (огибающей амплитудного спектра), и линейная зависимость фазового спектра от частоты, т.е. φ(ω) = - ωТ.

Действительно, если амплитудная огибающая спектра сохраняется постоянной, то, как было сказано выше, искажений звукового сигнала при этом не должно происходить. Требования же к сохранению линейности фазы во всем диапазоне частот, как показали исследования Блауерта, оказались избыточными. Было установлено, что слух реагирует в первую очередь на скорость изменения фазы (т.е. ее производную по частоте), которая называется "групповое время задерживания ГВЗ": τ = – dφ(ω)/dω.

В результате многочисленных субъективных экспертиз были построены пороги слышимости искажений ГВЗ (т.е. величины отклонения Δτ от ее постоянного значения) для различных речевых, музыкальных и шумовых сигналов. Эти слуховые пороги зависят от частоты, и в области максимальной чувствительности слуха составляют 1…1,5 мс (рис. 1). Поэтому последние годы при создании акустической аппаратуры Hi-Fi ориентируются, в основном, на приведенные выше слуховые пороги по искажению ГВЗ.





Рис. 1. Зависимость порогов слышимости искажений ГВЗ

от частоты

Что касается влияния фазовых искажений на оценку тембра различных музыкальных инструментов, то были выполнены исследования на синтезированных звуках различных музыкальных инструментов по субъективным оценкам изменения тембра при введении различных фазовых искажений. В реальных музыкальных инструментах генерируются достаточно сложные сигналы с большим количеством обертонов, определенной негармоничностью между ними, сложным динамичным развитием во времени спектральной и временной огибающих, а следовательно определенной динамикой развития во времени фазовых соотношений.

В одной из последних фундаментальных работ, посвященных этому вопросу (Галембо, Аскенфельд, Кадди – 2001 г.), были выполнены исследования на синтезированных звуках фортепиано. Для анализа был выбран низкочастотный диапазон (основные тона ниже 100 Гц), поскольку, как известно (см. "Звукорежиссер", 6/1999), при анализе сигнала в слуховой системе в области низких частот превалируют временные процессы.

Как уже было отмечено в той же статье, посвященной определению высоты тона, если какой-то из обертонов необычно ведет себя по амплитуде, то слуховая система выделяет его из общего ряда, и назначает ему отдельную высоту тона. Оказалось, что подобное поведение в фазовых спектрах также приводит к аналогичным результатам.

Кроме того, при оценке высоты тона "неразвернутых" гармоник, определение высоты происходит по их огибающей, частота которой равна фундаментальной частоте. Если все обертоны музыкального тона находятся в фазе, то периодичность огибающей становится четко выраженной, и возрастает точность определения высоты тона ("сила высоты тона"). Если фазовые соотношения между гармониками становятся различными, то волновая структура суммарного звука претерпевает существенные изменения (пример показан на рис. 2), и высота тона становится менее определенной (уменьшается сила высоты звука).



Рис. 2. Вид волновой формы при разных соотношениях фаз

обертонов; красная – все обертоны имеют одинаковые

начальные фазы, синяя – фазы распределены случайно

Таким образом, если фазовые соотношения оказывают слышимое влияние на определение высоты тона, то можно ожидать, что они окажут существенное влияние и на распознавание тембра.

Для экспериментов были выбраны звуки с основным тоном 27,5 и 55 Гц и со ста обертонами, с равномерным соотношением амплитуд, характерным для звуков фортепиано. При этом исследовались и тоны со строго гармоничными обертонами, и с определенной характерной для звуков фортепиано негармоничностью, которая возникает из-за конечной жесткости струн, их неоднородности, наличия продольных и крутильных колебаний и др.

Исследуемый звук синтезировался как сумма его обертонов:



X(t) = ∑A(n) sin[2πƒ(nt + φ(n, 0)] .

Для слуховых экспериментов было выбраны следующие соотношения начальных фаз для всех обертонов:

- А – синусоидальная фаза, начальная фаза была принята равной нулю для всех обертонов φ(n, 0) = 0;

- Б – альтернативная фаза (синусоидальная для четных и косинусоидальная для нечетных), начальная фаза φ(n, 0)=π/4 [(-1)n+1];

- С – случайное распределение фаз; начальные фазы при этом изменялись случайным образом в интервале от 0 до 2π.

В первой серии экспериментов все сто обертонов имели одинаковые амплитуды, различались только их фазы (основной тон 55 Гц). При этом прослушиваемые тембры получились различными:

- в первом случае (А), прослушивалась отчетливая периодичность;

- во- втором (Б), тембр был ярче и прослушивалась еще одна высота тона на октаву выше первой (правда высота не была четкой);

- в третьем (С) – тембр получился более равномерный.

Необходимо заметить – вторая высота прослушивалась только в наушниках, при прослушивании через громкоговорители все три сигнала отличались только тембром (сказывалась реверберация).

Это явление – изменение высоты тона при изменении фазы некоторых составляющих спектра – можно объяснить тем, что при аналитическом представлении преобразования Фурье сигнала типа Б, его можно представить как сумму двух комбинаций обертонов: сто обертонов с фазой типа А, и пятьдесят обертонов с фазой, отличающейся на 3π/4, и амплитудой больше в √2. Этой группе обертонов слух назначает отдельную высоту тона. Кроме того, при переходе от соотношения фаз А к фазам типа В смещается центроид спектра (максимум энергии) в сторону высоких частот, поэтому тембр кажется ярче.

Аналогичные эксперименты со сдвигом фаз отдельных групп обертонов также приводят к появлению дополнительной (менее ясной) виртуальной высоты тона. Это свойство слуха связано с тем, что слух сравнивает звук с определенным имеющимся у него образцом музыкального тона, и если какие-то гармоники выпадают из типичного для данного образца ряда, то слух выделяет их отдельно, и назначает им отдельную высоту.

Таким образом, результаты исследований Галембо, Аскенфельда и др. показали, что фазовые изменения в соотношениях отдельных обертонов достаточно отчетливо слышны как изменения тембра, и в некоторых случаях – высоты тона.

Особенно это проявляется при прослушивании реальных музыкальных тонов фортепиано, в которых амплитуды обертонов убывают с увеличением их номера, имеют место особая форма огибающей спектра (формантной структуры), и отчетливо выраженная негармоничность спектра (т.е. сдвиг частот отдельных обертонов по отношению к гармоническому ряду).

Во временной области наличие негармоничности приводит к дисперсии, то есть высокочастотные компоненты распространяются по струне с большей скоростью, чем низкочастотные, и волновая форма сигнала изменяется. Наличие небольшой негармоничности в звуке (0,35%) добавляет некоторую теплоту, жизненность звучания, однако, если эта негармоничность становиться большой, в звучании становятся слышны биения и другие искажения.

Негармоничность приводит также к тому, что если в начальный момент фазы обертонов находились в детерминированных соотношениях, то при ее наличии соотношения фаз со временем становятся случайными, пиковая структура волновой формы сглаживается, и тембр становится более равномерным – это зависит от степени негармоничности. Поэтому мгновенное измерение регулярности соотношения фаз между соседними обертонами может служить индикатором тембра.

Таким образом, эффект фазового перемешивания за счет негармоничности проявляется в некотором изменении восприятия высоты тона и тембра. Необходимо заметить, что эти эффекты слышны при прослушивании на близком расстоянии от деки (в позиции пианиста) и при близком расположении микрофона, причем слуховые эффекты различаются при прослушивании в наушниках и через громкоговорители. В реверберационном окружении сложный звук с высоким пик-фактором (что соответствует высокой степени регуляризации фазовых соотношений) говорит о близости источника звука, поскольку по мере удаления от него фазовые отношения приобретают все более случайный характер за счет отражений в помещении. Этот эффект может служит причиной разных оценок звучания пианистом и слушателем, а также разного тембра звука, записанного микрофоном у деки и у слушателя. Чем ближе, тем выше регуляризация фаз между обертонами и более определенная высота тона, чем дальше, тем более равномерный тембр и менее четкая высота.

Работы по оценке влияния фазовых соотношений на восприятие тембра музыкального звука сейчас активно изучаются в различных центрах (например, в ИРКАМе), и можно ожидать в ближайшее время новых результатов.



Тембр и общие принципы распознавания слуховых образов

Тембр является идентификатором физического механизма образования звука по ряду признаков, он позволяет выделить источник звука (инструмент или группу инструментов), и определить его физическую природу.

Это отражает общие принципы распознавания слуховых образов, в основе которых, как считает современная психоакустика, лежат принципы гештальт-психологии (geschtalt, нем. – "образ"), которая утверждает, что для разделения и распознавания различной звуковой информации, приходящей к слуховой системе от разных источников в одно и то же время (игра оркестра, разговор многих собеседников и др.) слуховая система (как и зрительная) использует некоторые общие принципы:

- сегрегация – разделение на звуковые потоки, т.е. субъективное выделение определенной группы звуковых источников, например, при музыкальной полифонии слух может отслеживать развитие мелодии у отдельных инструментов;

- подобие – звуки, похожие по тембру, группируются вместе и приписываются одному источнику, например, звуки речи с близкой высотой основного тона и похожим тембром определяются, как принадлежащие одному собеседнику;

- непрерывность – слуховая система может интерполировать звук из единого потока через маскер, например, если в речевой или музыкальный поток вставить короткий отрезок шума, слуховая система может не заметить его, звуковой поток будет продолжать восприниматься как непрерывный;

- "общая судьба" – звуки, которые стартуют и останавливаются, а также изменяются по амплитуде или частоте в определенных пределах синхронно, приписываются одному источнику.

Таким образом, мозг производит группировку поступившей звуковой информации как последовательную, определяя распределение по времени звуковых компонент в рамках одного звукового потока, так и параллельную, выделяя частотные компоненты присутствующие и изменяющиеся одновременно. Кроме того, мозг все время проводит сравнение поступившей звуковой информации с "записанными" в процессе обучения в памяти звуковыми образами. Сравнивая поступившие сочетания звуковых потоков с имеющимися образами, он или легко их идентифицирует, если они совпадают с этими образами, или, в случае неполного совпадения, приписывает им какие-то особые свойства (например, назначает виртуальную высоту тона, как в звучании колоколов).

Тембр является механизмом, с помощью которого экстрактируются из физических свойств признаки, определяющие качество звука: они записываются в памяти, сравниваются с уже записанными, и затем идентифицируются в определенных зонах коры головного мозга (рис. 3).

Тембр – ощущение многомерное, зависящее от многих физических характеристик сигнала и окружающего пространства. Были проведены работы по шкалированию тембра в метрическом пространстве (шкалы – это различные спектрально-временные характеристики сигнала, см. вторую часть статьи в предыдущем номере). В последние годы, однако, появилось понимание, что классификация звуков в субъективно воспринимаемом пространстве не соответствует обычному ортогональному метрическому пространству, там происходит классификация по "субпространствам", связанным с вышеуказанными принципами, которые и не метрические, и не ортогональные.




Рис. 3. Слуховые зоны мозга

Разделяя звуки по этим субпространствам, слуховая система определяет "качество звука", то есть тембр, и решает, к какой категории отнести эти звуки. Однако следует отметить, что все множество субпространств в субъективно воспринимаемом звуковом мире строится на основе информации о двух параметрах звука из внешнего мира – интенсивности и времени, а частота определяется временем прихода одинаковых значений интенсивности. Тот факт, что слух разделяет поступившую звуковую информацию сразу по нескольким субъективным субпространствам, повышает вероятность того, что в каком-то из них она может быть распознана. Именно на выделение этих субъективных субпространств, в которых происходит распознавание тембров и других признаков сигналов, и направлены усилия ученых в настоящее время.





Достарыңызбен бөлісу:
1   2   3   4   5   6


©kzref.org 2019
әкімшілігінің қараңыз

    Басты бет