Добавил:

Sekretar kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Ростовский Государственный Медицинский Университет

Предмет:

Медицина общая

Файл:

4 курс / Оториноларингология / Руководство_по_физиологии_Физиология_сенсорных_систем_Часть_2_Общая-1.docx

Скачиваний:

Добавлен:

24.03.2024

Размер:

2.62 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 1314 / 2314 15 16 17 18 19 20 21 22 23 > Следующая >>>

туров от номеров контуров (амплитудно-координатная характеристика анализатора) будет иметь форму амплитудночастотной характеристики отдельного контура, но повернутую на 180 град, относительно резонансной частоты. Таким образом, если теперь каким-то способом измерить амплитуды сигналов на выходах всех фильтровых каналов, можно получить амплитудночастотную характеристику одного избирательного элемента, настроенного

/ш111ш1Тгь,.

13 15 1719 2123 25 27 Номер фильтра

0.1 0.2 0.3 0.9 0.6 081,0 2.0 3.0 9.06.0 8.0100 Частота

Рис. 115. Схематическое изображение определения формы ча- стотной характеристики избирательного элемента параллельного анализатора с помощью эффекта маскировки.

а — входной сигнал; б — частотные^характеристики фильтров анализатора; в — амплитуды сигналов (вертикальные линии) на выходах фильтров (пунктирная линия — огибающая); г — «кривая маскировки» (сплошная линия), ДА — ошибка в определении амплитуды сигналов за счет ограниченной чувствительности измерителя амплитуд; д — частотная характеристика одного фильтра анализатора.

на воздействующую частоту (рис. 115). В качестве «зонда» можно использовать другой тон, частота которого будет изменяться от измерения к измерению. Действительно, если подать на вход анализатора два тона с различной частотой, каждый из них возбудит определенное количество резонаторов ш суммарная огибающая амплитуд на выходах анализатора будет иметь два максимума. При значительном уменьшении амплитуды одного из тонов может наступить момент, когда суммарная кривая распределения амплитуд будет мало отличаться от кривой распределения амплитуд при действии одного тона. Если теперь на выходе каждого канала

331

анализатора включить измерители, начинающие реагировать всякий раз, когда абсолютная величина приращения амплитуды, появившегося за счет включения дополнительного слабого сигнала

Рис. 116. Кривые маскировки тона тоном и тона шумом.

А — маскировка тона тоном 1200 гц (Wegel, Lane, 1924). Сплошная линия — «кривая маскировки»; штриховыми линиями показаны об- ласти различного восприятия суммы маскирующего (1-го) и маскируе- мого (2-го) тонов. Области биений заштрихованы. Б — маскировка тона тоном 400 гц (пунктирная линия) и тона шумом, имеющим полосу частот 90 гц и среднюю частоту 410 гц (сплошная линия) (Egan, Hake, 1950).

в момент звучания сильного, превысит некоторую величину, выбранную одинаковой для всех измерителей, распределение пороговых значений амплитуды измерительного сигнала по частоте и будет описывать распределение амплитуд на выходах анализатора и

332

после изменения Направления частотной оси — амплитудночастотную характеристику его избирательных элементов.

Поскольку второй сигнал (зонд) ниже некоторого порогового значения вообще не будет измеряться (будет замаскирован), получаемые кривые характеризуют маскирующие свойства анализатора и в психоакустике называются кривыми маскировки.

Явление маскировки было известно еще в прошлом веке. Экспериментируя с камертонами и органными трубами, Мейер (Meyer, 1876) пришел к выводу, что даже слабый низкочастотный органный звук подавляет восприятие — маскирует звук одновременно звучащего камертона. В то же время обратное явление никогда не наблюдается.

Количественное исследование явления подавления восприятия одного тона, маскируемого, в присутствии другого, маскирующего или маскера, было предпринято Вегелем и Лейном (Wegel, Lane, 1924). Ими измерялись на различных частотах пороговые величины амплитуды маскируемого тона, при которых он начинает восприниматься на фоне маскера, имеющего постоянную частоту и интенсивность. В качестве меры маскировки брался логарифм отношения получаемых пороговых значений амплитуды, измеренной в присутствии маскера, к абсолютным пороговым значениям амплитуды на тех же частотах, измеренных в тишине. Таким образом были получены кривые (рис. 116), говорящие о том, на сколько децибел надо увеличить интенсивность маскируемого тона над абсолютным порогом, чтобы он мог восприниматься в присутствии одновременно звучащего маскирующего тона данной частоты и интенсивности. Полученные кривые оказались несимметричными, с максимумами на частотах, близких к частотам маскера и его гармоник. На этих частотах воспринимались биения, и наличие маскируемого тона определялось только по моменту возникновения восприятия биений. Авторы аппроксимировали полученные кривые маскировки резонансными кривыми, тем самым допуская, что избирательные элементы имеют резонансную форму амплитудно-частотных характеристик. Качество аппроксимации получилось плохим вследствие сильной несимметрии кривых маскировки, однако это не привело к изменению представлений о форме амплитудно-частотных характеристик избирательных элементов, поскольку факт нелинейного увеличения несимметрии кривых с увеличением интенсивности сигналов мог свидетельствовать о наличии нелинейных искажений в органе слуха, возникающих до анализа. В этом случае хотя на вход слухового прибора подается чистый тональный сигнал, на вход анализатора поступает искаженный сигнал, который может быть представлен в виде суммы основного тона и его гармоник, названных «субъективными топами».

333

Величины добротности избирательных элементов анализатора органа слуха на различных частотах, определенные из кривых Вегеля и Лейна по формуле: Таблица 9 Частота (/о)	Добротность (Q)
400	19.4
800	42.6
1200	22.9
2400	14.4
3500	43.0

ве маскера оказались.

так же

где /₀ — частота маскера, Д/ — полоса частот, измеренная на на уровне -—3 дб от максимального значения, приведены в табл. 9 (Makita, Miyatani, 1950).

Видно, что значения добротности избирательных элементов сильно варьируют (в 2—3 раза) от точки к точке и по существу невозможно выявить какую-то закономерную зависимость доброт- ности от частоты. Опыты с маскировкой многократно повторялись различными исследователями, причем в качестве маскеров в опы-

тах использовались не только тональ- ные сигналы, но и узкополосные шумы, шумы со срезами в сторону высоких и низких частот, а также сигналы слож- ной формы спектра.

В этих работах были получены допол- нительные сведения об эффекте одно- временной маскировки и о форме ампли- тудночастотных характеристик избира- тельных элементов органа слуха. Так, кривые маскировки, полученные в экспериментах, в которых в качест- я узкополосный шум (Ehmer, 1959), и кривые маскировки тона тоном,

сильно несимметричными, в то же время никаких максимумов на других частотах, кроме частот занимаемых полосой шума, не наблюдается (рис. 116, Б). Аналогичные результаты были получены в экспериментах, в которых в качестве маскеров были использованы широкополосные шумы с резким спадом спектральной плотности энергии в сторону низких или в сторону высоких частот (Шупляков, 1967). Эти данные говорят о том, что несимметричная форма кривых маскировки вызвана не появлением субъективных тонов вследствие нелинейности слуха, а скорее всего является отражением несимметричной формы амплитудночастотных характеристик самих избирательных элементов слухового анализатора. Несимметричная форма кривых наблюдается и в экспериментах по непосредственному измерению частотных характеристик эффекта маскировки (Чистович, 1957; Small, 1959). В этих экспериментах частота и интенсивность маскируемого тона сохранялась неизменной, а интенсивность маскирующего тона на различных частотах увеличивалась до тех пор, пока маскируемый тон не переставал восприниматься (рис. 117).

334

В экспериментах по маскировке было, кроме того, показано, что наклон кривых маскировки в сторону низких частот увеличивается с увеличением интенсивности маскера и может достигать весьма значительных величин, в то время как наклон кривых маскировки в сторону высоких частот уменьшается.

100 1000 ги,

Рис. 117. Частотные характеристики эффекта маски- ровки (Small, 1959).

По оси абсцисс — частоты маскирующих тонов; по оси ординат — уровни их интенсивности, а — частота маскирующего сигнала 400 гц, б — 800, в — 1600, г — 3200 и д — 6400 гц; интенсивность — 15 дб над порогом (2) и 30 дб (2). Величина вертикальной линии у точек характеризует разброс данных измерений. Стрелкой показана кривая абсолютного порога слуха.

В табл. 10 приведены значения максимальной крутизны кривых в сторону низких частот, полученные в экспериментах по маскировке различными авторами.

Измерение крутизны кривых маскировки в сторону высоких частот значительно сложнее, поскольку кривые имеют переменную крутизну от точки к точке и плохо аппроксимируются прямыми и, кроме того, их крутизна зависит от уровней сигналов.

335

Таблица 10 Автор	Крутизна кривой в дб/октаву
Маскировка тона тоном
Wegel, Lane, 1924	185
Fletcher, Munson, 1937	90
Egan, Hake, 1950	80
Deatherage, Bilger, Eldredge, 1957	105
Small, 1959	280
Шупляков, 1967	150
Маскировка тона
узкополосным шумом
Wegel, Lane, 1924	55
Fletcher, Munson, 1937	108
Egan, Hake, 1950	80
Deatherage, Bilger, 1957	85
Spicth, 1957	100
Z wicker, 1958	160
Маскировка тона
синтетическим шумом
Spicth, 1957	\| 190
Чистович, 1957 I	1 160
	Таблица И
	Крутизна кривой
Автор	в дб/октаву
Wegel, Lane, 1924	10-15
Zwicker, 1958	20—60
Чистович, 1957	10—40
Ehmer, 1959 . . .	10—20
Small, 1959	30—50
Шупляков, 1967	15—35

В табл. 11 приведены значения крутизны кривых маскировки в сторону высоких частот, которые могут служить лишь для приближенной оценки порядка величин.

Поскольку крутизна кривых маскировки зависит от интенсивности сигналов, разброс данных различных экспериментов может быть объяснен тем, что авторы использовали в своих экспериментах сигналы различной интенсивности. Кроме того, в случае использования в качестве маскеров узкополосных шумов кривая маскировки естественно не может быть круче крутизны амплитудно-частотной характеристики фильтра, формирующего спектр шума, и в сторону низких частот ею в основном ц определяется,

336

Если принять в качестве средней крутизны кривых маскировки в сторону низких частот величину, равную 150 дб на октаву, становится совершенно ясно, что амплитудночастотные характеристики избирательных элементов органа слуха имеют нерезонансную форму. Действительно, как показывают расчеты, для получения крутизны характеристики, равной 150 дб на октаву в самой оптимальной точке, резонансный контур должен иметь добротность порядка нескольких тысяч, т. е. соизмеримую с добротностью кварцевых резонаторов и превышающую измеренные с помощью других методик значения добротности амплитудно-частотных характеристик слуха на несколько порядков.

Допущение несимметричной формы самих амплитудночастотных характеристик избирательных элементов слуха объясняет несимметричную форму кривых маскировки; в то же время остается неясной причина возникновения столь высокой крутизны склонов, с большим трудом достигаемой в лучших технических устройствах.

Определение эффективной полосы пропускания избирательных элементов. Критические полосы. Измерение параметров избирательных элементов слуха производится в психоакустике не только с помощью кривых маскировки, но и другими способами. В частности, большая группа экспериментов основана на вышеупомянутом свойстве контура отвечать на целый комплекс составляющих, попадающих в полосу его пропускания.

Если на вход избирательного контура подать широкополосный шум, на выходе контура появится сигнал, огибающая распределения амплитуд по частотной оси (или огибающая энергий) которого будет повторять форму частотной характеристики, и, следовательно, суммарная энергия такого сигнала невыходе контура будет пропорциональна площади, занимаемой амплитудно-частотной характеристикой. Если же на вход контура подавать полосовой шум, зависимость энергии на выходе контура от ширины полосы входного шума будет иметь вид, как показано на рис. 118, А. Видно, что основная энергия выходного сигнала сосредоточена в некоторой полосе частот, характерной для данного фильтра. В случае многоканального анализатора эффективную полосу пропускания одного из фильтров, а из нее и добротность, можно определить, измеряя каким-либо способом энергию сигнала на выходе данного канала анализатора и строя зависимость величины энергии от полосы частот шума. Полоса пропускания фильтра названа эффективной потому, что с помощью данного способа можно определить истинную полосу пропускания только таких фильтров, частотная характеристика которых симметрична относительно средней частоты. Во всех остальных случаях речь может идти только о некоторой усредненной полосе частот, в которой содержится основная часть энергии фильтра.

22 Сенсорные системы

337

Так как непосредственное измерение энергии на выходах кана-

лов анализатора слуха не представляется возможным, при измере- нии добротности избирательных элементов слуха этим способом

в психоакустике пользу- ются допущением, что то- нальный сигнал воспри- нимается на фоне шумово- го в том случае, если его энергия на выходе данного фильтрового канала пре- вышает энергию шумового сигнала на некоторую по- стоянную величину.

Рис. 118. Зависимость энергии сигнала на выходе фильтра от ширины по- лосы шума на входе фильтра (4) и зависимость отношения интенсивности тона 1_т к спектральной плотности мощности шума /у от ширины полосы маскирующего шума Д/ (Б) (Fletcher, 1940).

На А — кривые при разных формах частотных характеристик фильтров (1 — прямоугольной, 2 — резонансных). На Б — кривые для разных частот маскируемых тонов (обозначены слева вверху и справа у прямых). Сплошные линии — аппроксимирующие Прямые, нижняя прямая объединяет 125, 250 и 500 гц.

Измеряя маскировку тонального сигнала шумовыми сигналами, можно построить зависимость пороговой амплитуды тонального сигнала от ширины полосы шума. Она будет повторять с каким-то неизвестным постоянным сдвигом зависимость энергии шума на выходе фильтра от полосы шума и, следовательно, на основании этой кривой может быть определена величина эффективной полосы пропускания фильтра. По существу этот способ является упрощен

338

ным вариантом способа измерения добротности по кривым маскировки; главным недостатком этого способа является то, что он не дает возможности получить сведения о форме амплитудно- частотных характеристик избирательных элементов, в особенности если они имеют асимметричную форму.

Вышеописанный способ определения величины эффективной полосы частот избирательных элементов органа слуха впервые был использован в экспериментах Флетчера (Fletcher, 1940), в которых было получено, что с увеличением ширины полосы маскирующего шума пороговая амплитуда маскируемого тона вначале

возрастает, а затем остается почти постоянной и не зави- сит от ширины полосы шума (рис. 118, Б). Флетчер аппро- ксимировал полученные за- висимости прямыми, тем са- мым допуская, что избира- тельные элементы слуха име- ют прямоугольную форму

Рис. 119. Зависимости величины критических полос от частоты (2 — по: Fletcher, 1940; 2 — по: Zwicker et al., 1957), а также за- висимость пороговой расстройки между тонами при восприятии биений (3) — по: Meyer, 1876).

Масштаб осей логарифмический.

Частота

амплитудно-частотных характеристик, т. е. являются полосовыми фильтрами.

Пороговые значения ширины полосы маскирующего шума, при которых амплитуда маскируемого тона перестает зависеть от ширины полосы шума, были названы «критическими». Зависимость ширины критических полос от частоты, полученная в экспериментах Флетчера, приведена на рис. 119 (кривая 7).

Несмотря на произвольность исходного допущения, представление о слуховом анализаторе как состоящем из набора избирательных элементов типа критических полос хорошо согласуется с большим числом явлений, наблюдаемых в психоакустических экспериментах (см. обзор: Фрейдин, 1968).

Эксперименты по методу измерения суммарной энергии на выходах фильтровых каналов анализатора производились затем различными исследователями. Имеется большое количество вариантов этого метода, отличающихся друг от друга не только видом маскеров, но и способами измерения энергии сигналов

22*

339

на выходах фильтровых каналов. Например, в экспериментах Цвиккера (Zwicker, 1954) в качестве маскеров использовались наборы из двух симметрично расположенных тонов, расстояние между которыми менялось, а в качестве маскируемого сигнала (измерительного) использовался узкополосный шум. Критические полосы, полученные в экспериментах Цвиккера, оказались примерно в 2—2.5 раза больше критических полос Флетчера (рис. 119). Ход зависимости величины критических полос от частоты примерно совпал.

Предполагая, что для восприятия сигналов на выходе фильтрового канала необходима некоторая пороговая энергия сигнала, Гесслер (Gassier, 1954) произвел измерения порога восприятия сложного сигнала в зависимости от ширины его полосы. В качестве такого сигнала использовались наборы из различного числа тональных сигналов. Если все тоны в комплексе имеют одинаковую амплитуду и одинаковое расстояние по частоте, а измерение производится на частотах в области горизонтального хода абсолютного порога, энергия комплекса будет пропорциональна числу составляющих. Если теперь измерять пороги восприятия комплекса при различном числе составляющих, пороговый уровень звукового давления каждого тона в комплексе будет вначале быстро уменьшаться с увеличением числа тонов, а затем скорость изменения уменьшится и добавление тонов к комплексу уже не скажется на величине порогового уровня звукового давления, поскольку эти тоны попадут в другой фильтровой канал. Гесслер также аппроксимировал полученные кривые с помощью двух прямых и по точке их пересечения определил критическое число тонов, а из него и критическую полосу избирательного фильтра органа слуха. Зависимость величины критической полосы от частоты примерно совпала с зависимостью Цвиккера.

Определение временных параметров избирательных элементов. Другой класс экспериментов связан с измерением временных параметров избирательных элементов органа слуха.

В начале настоящего раздела уже говорилось о том, что постоянная времени фильтра и его добротность взаимосвязаны. Измеряя каким-либо образом постоянную времени, можно вычислить эффективную полосу пропускания фильтра. Однако и методы измерения временных параметров, так же как и предыдущие, не позволяют определить форму амплитудно-частотных характеристик избирательных элементов; обычно предполагаются симметричные характеристики типа резонансных или идеальных прямоугольных.

В качестве сигналов, подаваемых на вход анализатора в этом случае, обычно используются сигналы, параметры которых (амплитуда или частота) изменяются во времени по определенному закону и спектры которых имеют по возможности простую форму, с тем чтобы можно было затем анализировать результаты экспериментов.

340

Такими сигналами являются сигналы, состоящие из двух или трех тонов, сдвинутых по частоте относительно друг друга.

Если сигнал состоит из суммы двух тональных сигналов вида:

Л (*) = А sin 4-ft) и

/₂ (t) = А₂ sin (wj + Q) t,

то результирующее колебание

/ (0 = Л W + /₂ (t) = A (г) sin ? (t)]

в общем случае представляет сигнал, амплитуда A (t) и частота которого изменяются во времени по закону:

A (t) = \Ja* Al 4- 2Л₁Л₂ cos (Qt — и

Л, sin Vi 4- А₉ sin Qt

~ A_± cos ft 4- A₂ cos Qt ’

Особенно наглядно это видно, если каждое колебание изобразить с помощью вектора, длина которого равна амплитуде сигнала и который вращается вокруг точки, соответствующей началу вектора с данной круговой частотой. Суммарное колебание в этом случае будет изображаться вектором, представляющим сумму исходных векторов, а проекция суммарного вектора на некоторую ось амплитуд будет давать зависимость амплитуды суммарного колебания во времени.

Если подать такое сложное колебание на параллельный анализатор, состоящий из большого количества избирательных элементов, то в случае, если тоны незначительно различаются по частоте, оба они попадут в один и тот же фильтровой канал и энергия на выходе канала будет изменяться в такт с изменением низкочастотной огибающей амплитуд. С увеличением расстояния между тонами данный фильтровой канал, настроенный на частоту одного из тонов, будет все слабее реагировать на другой тон и на выход будет попадать все меньше энергии от другого тона. Это выразится в том, что величина модуляции амплитуды и частоты сигнала на выходе будет уменьшаться, частота модуляции будет возрастать.

Если задаться некоторой определенной, пороговой величиной амплитуды модуляции на выходе данного фильтрового канала, пороговая величина будет достигнута при определенном расстоянии между тонами по частоте, при котором можно считать, что они Ьопадают в разные каналы. Таким образом можно измерить разрешающую способность анализатора по частоте, характеризующую способность анализатора выделять из сложного сигнала две рядом находящиеся спектральные составляющие. Аналогичные эксперименты могут быть проведены и с сигналами, состоящими из трех компонент. Из большого разнообразия различных

341

вариантов сложных сигналов, состоящих из трех компонент, наибольшее применение в психоакустических экспериментах нашли два: сигналы с модуляцией амплитуды и сигналы с модуляцией частоты.

В векторном изображении первые сигналы могут быть представлены в виде суммы из трех векторов, один из которых вращается с угловой частотой, равной несущей частоте 2, а для других — с одинаковыми угловыми скоростями о), равными частоте модуляции, но взаимно противоположно направленными. Проекция суммарного вектора на ось амплитуд даст зависимость суммарной амплитуды во времени.

Другое колебание (частотномодулированное) получается, если вектор, изображающий несущее колебание в AM сигнале повернуть на 90°. В этом случае частота суммарного сигнала будет колебаться вокруг несущей частоты 2 на некоторую величину, определяемую амплитудами составляющих.

Нетрудно видеть, что спектры и тех и других колебаний при малых величинах составляющих состоят из трех компонент, две из которых расположены симметрично относительно несущей

I ^wи находятся от нее по частоте на + •

Если подать такое колебание на анализатор, состоящий из набора параллельных резонаторов, при малых частотах модуляции все три компоненты попадут в один резонатор и на выходе его могут быть зарегистрированы колебания частоты или амплитуды с периодом модуляции. Увеличивая частоту модуляции, можно достигнуть момента, когда боковые составляющие выйдут из эффективной полосы пропускания фильтра и модуляция сигнала на его выходе значительно уменьшится. Задаваясь некоторым пороговым значением величины модуляции на выходе фильтра, можно определить его полосу пропускания.

Психоакустические эксперименты по измерению порога восприятия биений в случае прослушивания двух равногромких тонов впервые были проведены еще Мейером (Meyer, 1876). Кривая, полученная им, приведена на рис. 119. Видно, что величина порога восприятия биений имеет такую же зависимость от частоты, что и ширина критических полос. С учетом предыдущих наших рассуждений это и понятно, поскольку вышеназванные кривые отражают по сути одно и то же явление. Различия в абсолютных величинах могут быть объяснены различными критериями оценки.

Эксперименты с измерением пороговых частот модуляции при восприятии AM и ЧМ-сигналов проводились различными авторами (Mathes, Miller, 1947; Zwicker, 1952; Чистович, 1956).

В экспериментах Цвиккера измерялись пороговые значения

А коэффициента модуляции, равного т = -■^мод , при различных ча- ^нес

стотах модуляции в случае AM-колебаний и пороговые значения

342

индекса модуляции, равного v — , в случае ЧМ-колебаний, также

при различных частотах модуляции. Энергетические спектры этих двух колебаний при пороговых уровнях модуляции практически совпадают.

В экспериментах определялись пороговые значения частоты модуляции на различных несущих часотах, при которых слушатели уже не в состоянии отличить AM-колебания от ЧМ. Поскольку частота модуляции характеризует расстояние по частоте между компонентами в спектрах колебаний, пороговая частота модуляции каким-то образом характеризует эффективную полосу частот избирательных элементов анализатора. Ширина полосы избирательных элементов, определенная из пороговых величин модуляции, оказалась совпадающей со значениями критических полос, измеренных в других экспериментах (Gassier, 1954; Zwicker, 1954; Feldtkeller, 1955; Zwicker et al., 1957).

Сравнение с данными исследований улитки и слухового нерва. Естественно возникает вопрос, в какой степени психоакустические данные о частотно избирательных свойствах слуха согласуются с данными, полученными при исследовании улитки и слухового нерва.

Отметим, что первые представления о маскировке, так же как и о других свойствах слуха, строились исходя из предположения о периферической природе анализа сигналов органом слуха. Однако с развитием исследований и в связи с расширением знаний о слуховой системе такое представление перестало быть очевидным. Особенно это относится к объяснению высокой крутизны кривых маскировки в сторону низких частот (или соответственно крутизны амплитудно-частотных характеристик эффекта маскировки в сторону высоких частот).

Наибольшая крутизна кривых, характеризующих амплитудно- частотные свойства маскировки, была получена в экспериментах Смолла (Small, 1959), где она достигает 280 дб на октаву. Частотнопороговые кривые отдельных нейронов, полученные в электрофизиологических исследованиях при измерениях на уровне первого слухового нейрона (Tasaki, 1954; Sumi et al., 1956; Kiang et al., 1962), практически совпадают с кривыми маскировки (рис. 120),

Также при исследовании частотных свойств суммарных ответов большого числа нейронов (Lowy, 1945; Finck, 1966) оказывается, что они близки к частотным свойствам эффекта маскировки. Например, в экспериментах Финка (Finck, 1966), построенных по той Я<е методике, что и эксперименты, выполненные Смоллом, но в которых измерялись медленные потенциалы при отведении от слухового нерва, оказалось, что зависимость этих потенциалов от частоты также практически совпадает с частотными характеристиками эффекта маскировки, полученными в психоакустических экспериментах, как по форме характеристики, так и по крутизне

343

склонов, достигающей в сторону высоких частот 200 дб на октаву. Кривая Финка также изображена на рис. 120.

Если эффект маскировки является периферическим процессом, то тогда необходимо сравнить частотные характеристики эффекта маскировки с амплитудно-частотными характеристиками базилярной мембраны — периферического образования, безусловно ответственного за первичный анализ сигналов органом слуха.

К настоящему времени имеется всего две работы, посвященные непосредственному измерению амплитудно-координатных и амплитудно-частотных характеристик базилярной мембраны. Прежде

1000 10000 га

Частота

Рис. 120. Нормированные частотные характеристики различных эффектов в слуховой системе.

Сплошные линии — частотные характеристики точек базилярной мембраны (1 — по: Bekesy, 1960; 2 — по: Johnstone, Boyle, 1967), штриховые — частотные характеристики первого слухового нейрона (3 — по: Sumi et al., 1956; 4 — по: Tasaki, 1954), пунктирные — частотные характеристики эффекта маскировки (5 — по: Чистович, 1957; 6 — по: Small, 1959), штрих-пунктирная — частотная характеристика медленных потенциалов при регистрации суммарного ответа слухового нерва (7 — по: Finck, 1966). Остальные объяснения в тексте.

всего это работа Бекеши (Bekesy, 1960) по непосредственному измерению амплитуды колебаний различных точек базилярной мембраны в ответ на воздействующие синусоидальные сигналы. С тем чтобы можно было удобно сравнивать эти кривые с кривыми маскировки и с другими частотно-зависимыми эффектами слуха, на рис. 120 кривые Бекеши представлены в логарифмическом масштабе.

Из кривых видно, что они имеют много общего с кривыми маскировки. Во-первых, эти кривые, так же как и кривые маскировки, являются резко несимметричными, с крутым спадом в сторону высоких частот и значительно менее крутые в сторону низких частот. По этой причине становится ясным, что величины добротности избирательных элементов, вычисленной формально как отношение резонансной частоты фильтра к полосе его пропускания на уровне —3 дб от максимального значения, оказывается недостаточно для описания характеристик базилярной мембрана, 344

Йе менее Ьажнымй для описания кривых являются значения крутизны склонов характеристик в сторону высоких и в сторону низких частот.

К сожалению, как видно из рисунка, амплитудно-частотные характеристики оказалось возможным измерить в очень небольшом диапазоне амплитуд и поэтому трудно оценить значения величины крутизны этих характеристик. В измеренном диапазоне амплитуд крутизна кривых в сторону высоких частот составляет всего примерно 45 дб на октаву и около 3—10 дб на октаву в сторону низких частот.

Несколько более близкие к кривым маскировки амплитудно- частотные характеристики базилярной мембраны были получены в недавнем исследовании Джонстона и Бойля (Johnstone, Boyle, 1967), в котором колебания базилярной мембраны измерялись с помощью эффекта Мессбауэра. Крутизна полученной в этом эксперименте амплитудно-частотной характеристики в сторону низких частот, измеренной на улитке морской свинки в точке на расстоянии 1.5 мм от стремечка, оказалась равной 10—13 дб на октаву, а в сторону высоких частот — 60—75 дб на октаву (рис. 120).

Таким образом, результаты сравнения показывают, что психоакустические и электрофизиологические данные о частотной избирательности слуха оказываются достаточно близкими. В то же время наблюдается весьма сильное несоответствие этих данных с характеристиками базилярной мембраны.

Попыткам объяснить это несоответствие посвящено значительное количество работ по рассмотрению и моделированию возможных механизмов «обострения» частотной избирательности слуха (Licklider, 1950, 1951; Ranke, 1950; Huggins, Licklider, 1951; Молчанов, Лабутин, 1966, и др.). Окончательное решение вопроса пока еще не найдено.

ГРОМКОСТЬ

Громкость является наиболее универсальным из признаков, используемых слухом для описания звукового сигнала. Человек способен оценивать и сравнивать по громкости любые звуковые сигналы: тоны, акустические импульсы, шумы, периодические сигналы со сложным спектром.

Исследования громкости составляют один из ведущих разделов психоакустики. Основной целью экспериментальных работ является разработка теории громкости, т. е. создание методов, позволяющих вычислить (объективно измерить) громкость любого произвольного сигнала.

Хотя исследования громкости являются психоакустическими, в основе теории лежат физиологические представления. Практически все исследователи принимают, что громкость является мерой количества импульсов, вызванных сигналом в слуховом нерве.

345

Предполагается, что звуку соответствует некоторый рельеф плотности импульсации. Одной осью является проекция улитки, второй — время. Принимается, что громкость образуется путем интегрирования плотности импульсации по оси проекции улитки и по времени.

В соответствии с этими общими представлениями разработка модели громкости должна включать решение таких крупных проблем, как проблема перехода от сигнала к соответствующему ему

Рис. 121. Упрощенная блок-схема слухового измере- ния громкости.

Ус — усилитель, Ф_п — фильтры, Пр_и Пр_п — преобразователи, Сум — сумматор. Остальные объяснения в тексте.

рельефу плотности импульсации и проблема интегрирования импульсации.

К настоящему времени в первом приближении разработана (Zwicker, 1958; Zwicker, Scharf, 1965) процедура перехода от спектра сигнала к кривой распределения средних по времени значений плотности импульсации (плотности громкости) вдоль проекции оси частот. Площадь под кривой дает общую громкость звука. Основная часть экспериментальных работ была направлена на решение именно этой задачи. Поэтому исследователи использовали только спектральные представления как при описании сигнала, так и при описании реакции на сигнал слуховой системы. Разработка моделей, описывающих временную картину плотности импульсации и процесс интегрирования импульсации по времени, находится пока в самом начале (Zwislocki, 1960, 1969; Zwicker, 1968).

На рис. 121 изображен несколько упрощенный вариант схемы слухового измерения громкости, предполагаемой большинством исследователей. Схема включает: предварительный усилитель (среднее ухо), набор фильтров, центральные частоты которых пе

346

рекрывают весь частотный диапазон слуха (механические системы улитки), связанные с каждым фильтром преобразователи энергии колебаний в количество нервных импульсов, общий сумматор.

Эта блок-схема удобна тем, что позволяет определить, какая информация необходима для того, чтобы можно было перейти от спектра сигнала к общей громкости — сигналу на выходе сумматора.

Для описания усилителя необходимо указать его частотную и амплитудную характеристики.

Относительно набора фильтров нужно установить, каковы частотные характеристики фильтров и каково относительное число фильтров в различных частотных диапазонах. Для описания преобразователя необходимо указать зависимость между энергией сигнала на его входе и величиной громкости на выходе. Относительно сумматора следует выяснить применяемое в нем правило суммирования.

Экспериментальные исследования, позволившие получить нужную информацию, группируются вокруг трех основных вопросов: а) зависимость громкости тона от его частоты, б) зависимость громкости сложного сигнала от ширины полосы его спектра, в) вид зависимости между энергией сигнала и его громкостью.

Основной экспериментальный метод исследования базируется на способности человека оценивать равенство (различие) громкостей двух последовательно предъявляемых звуков. Это дает возможность избрать некоторый звук (чаще тон с частотой 1 кгц) в качестве стандарта и выражать громкость любого исследуемого звука в значениях уровня интенсивности или уровня звукового давления (УЗД) стандарта, равногромкого с исследуемым звуком.

Зависимость громкости тона от его частоты. Для характеристики интенсивности чистого тона достаточно указать уровень звукового давления (УЗД). Звуковое давление измеряется или непосредственно у барабанной перепонки, или в точке звукового поля, куда помещается голова испытуемого. Так как зависимость между давлением в поле и давлением у барабанной перепонки известна (Beranek, 1949), мы ограничимся рассмотрением зависимости громкости тона от его частоты и УЗД, измеренного у барабанной перепонки.

На рис. 122 приведены данные дл^ одного из испытуемых, исследованных Россом (Ross, 1967). По оси ординат показаны величины УЗД тона 800 гц у барабанной перепонки этого испытуемого, по оси абсцисс — величины УЗД тонов 3200 гц и 32 гц. Точки указывают условия равенства громкости тонов 800 и 3200 гц. Уравнение кривой, аппроксимирующей экспериментально полученную зависимость, известно как уравнение (функция) равной громкости.

Установлено, что для любых пар тонов, частоты которых лежат

347

выше 500 гц, условие равенства громкости приближенно описывается линейной зависимостью с коэффициентом наклона, равным 1 (Stevens, 1966; Ross, 1967). Иначе говоря УЗД₁—УЗД₂+А (дб).

Как можно видеть из рис. 122 (крестики), громкость тона с частотой 32 гц растет значительно быстрее, чем громкость тона с частотой 800 гц. Скорость роста громкости для тонов с частотами ниже 500 гц является тем большей, чем ниже частота тона.

На рис. 123 приведены частотные контуры равной громкости, полученные Флетчером и Мансоном (Fletcher, Munson, 1933); они достаточно хорошо совпадают с контурами равной громкости, полученными в более поздних работах (Zwicker, Feldkeller, 1955;

Рис. 122. Результаты экспери- мента по уравниванию двух тонов по громкости (по: Ross, 1967).

По оси абсцисс — уровень звуко- вого давления тонов 3200 гц и 32 гц; по оси ординат — уровень звукового давления тона 800 гц.

Рис. 123. Частотные контуры равной громкости (по: Fletcher, Munson, 1933).

По оси абсцисс — частота тона; по оси ординат — уровень звукового давления у барабанной перепонки. Кривые — кон- туры равной громкости, цифры у кривых — значения уровня громкости (L).

Ross, 1967). По оси ординат указан УЗД у барабанной перепонки (реально в эксперименте измерялись значения электрического напряжения на клеммах телефона, значения давления вычислялись на основании калибровки телефона на группе естественных ушей). Контур равной громкости показывает, какие УЗД должны быть на разных частотах для того, чтобы громкость тонов была одинаковой. На рис. 123 около каждого контура указано значение L — уровня громкости. В данном случае за уровень громкости принят уровень интенсивности над средним слуховым порогом тона 1000 гц (при определении давления в поле за уровень громкости принимается просто УЗД тона 1000 гц). За единицу уровня громкости был принят фон (1 фон равен 1 дб на частоте 1000 гц), однако этот термин не получил повсеместного распространения — часто говорят об уровне громкости в децибелах. Пользуясь рис. 123, легко определить для любого тона его уровень громкости. 348

Например, тон 100 гц с УЗД, равным 80 дб имеет уровень громкости, равный 60 дб (фонам).

Факторы, ответственные за наблюдаемую форму контуров равной громкости, частично проанализированы. Подъем кривых (падение громкости) на частотах выше 2 кгц связывают с понижением коэффициента передачи среднего уха на высоких частотах. Подъем кривых на частотах ниже 500 гц связывают с характеристиками внутреннего уха.

Зависимость громкости от ширины спектра сигнала. Обратившись к рис. 121, легко заметить, что громкость сигнала, образованного из двух тонов, всегда должна быть больше громкости каждого из тонов в отдельности. Однако механизмы, за счет которых произойдет это увеличение громкости, будут разными в зависимости от того, близки или далеки друг от друга частоты тонов. Если тоны далеки по частоте, они будут попадать в разные фильтры и ответ фильтра, настроенного на один из тонов, не будет зависеть от того, есть или нет в сигнале второй тон. Увеличение громкости будет при этом происходить за счет увеличения числа работающих каналов. В простейшем случае (каждый тон действует только на один фильтр) суммарная громкость должна быть просто равна сумме громкостей тонов.

Если два тона очень близки по частоте (разность их частот меньше ширины полосы фильтра), можно считать, что при действии каждого из них работает тот же самый канал; этот же канал работает и тогда, когда оба тона действуют вместе. Так как фильтр пропускает оба тона, энергия колебаний на его выходе будет равна сумме энергий колебаний, вызываемых каждым из тонов в отдельности. Отсюда следует, что, если именно энергия колебаний в фильтре определяет количество импульсации (плотность громкости) в данном канале, громкость двух близких по частоте тонов будет равна громкости одного тона, имеющего ту же самую энергию. Это значит, что громкость двух близких тонов с одинаковым УЗД должна быть равна громкости одного тона с УЗД, увеличенным на 3 дб.

Рассмотрим, что должно произойти, если энергию сигнала сохранять постоянной, но полосу частот, в которой находятся его составляющие, существенно расширить. В этом случае энергия колебаний на выходе фильтра уменьшится (ча^ть составляющих сигнала уже будет находиться вне полосы пропускания фильтра), однако количество работающих каналов увеличится. Громкость сигнала может остаться неизменной только при том условии, что увеличение громкости, связанное с возрастанием числа каналов, будет точно компенсировать уменьшение громкости, обусловленное уменьшением энергии в основном канале. Таким образом, естественно ожидать, что при расширении полосы сигнала за пределы некоторой критической полосы громкость звука с постоянной энергией начнет изменяться. Будет она возрастать или па-

349

дать, должно зависеть от конкретного вида функции громкости, описывающей связь между энергией и громкостью в отдельном канале.

На рис. 124 приведена зависимость уровня громкости четырехкомпонентного комплекса от ширины полосы частот, в которой расположен этот комплекс (Zwicker, Flottorp, Stevens, 1957). За ширину полосы (А/⁷) принята разность частот между самым высоким и самым низким тоном в комплексе. Все тоны в комплексе

10 20 50 100200 50010002000гц.

ДЕ

Рис. 124. Зависимость уровня громкости четырехкомпонентного комплекса (по оси ординат) от частотного расстояния (AF, по оси абсцисс) между самым высоким и самым низким тонами в комплексе (Zwicker et al., 1957).

Буквы Т и С соответствуют двум вариантам эксперимента: испытуемый управляет или интенсивностью тона сравнения (Г и j;) или интенсивностью комплекса (С и о) УЗД.

ные были получены при

имели одинаковую интенсивность и были расположены вокруг цент- ральной частоты, указанной циф- рами над кривыми рис. 124. Мерой уровня громкости служил УЗД тона центральной частоты. Ширина горизонтального участка кривых, приведенных на рисунке, соответ- ствует ширине критической поло- сы, определенной на основании группы разного рода эксперимен- тов (Gassier, 1954; Zwicker, 1954; Feldkeller, Zwicker, 1956), опи- санных в разделе «Частотно из- бирательные свойства слуха». Мож- но видеть, что экспериментальные данные соответствуют предполо- жению авторов, что громкость комплекса с постоянной энергией сохраняется постоянной, пока все составляющие комплекса находят- ся в пределах критической поло- сы; при расширении полосы сиг- нала за пределы критической полосы громкость комплекса на- чинает расти. Аналогичные дан- использовании в качестве сти-

мула полосового шума с постоянной энергией и переменной шириной полосы (Zwicker, Flottorp, Stevens, 1957). Измерения,

проведенные с сигналами различного уровня интенсивности, показали, что нарастание громкости с расширением полосы наиболее

выражено при средних уровнях интенсивности, при малых уровнях может наблюдаться обратный эффект — расширение полосы сигнала за пределы критической полосы приводит к падению громкости.

Функция громкости. Во всех описанных выше экспериментах мерой громкости сигнала служил уровень громкости (Л). Естественно считать, что между громкостью (g) и уровнем громкости (L) существует непрерывная и монотонная зависимость. Это позволяет

350

утверждать, что если двум звукам соответствует одно и то же зна- чение уровня громкости, то эти звуки равны по громкости. Можно также утверждать, что звук с большим уровнем громкости является более громким. Однако не зная вида зависимости между L и g, ничего нельзя сказать о том, па сколько или во сколько раз гром- кость топа с уровнем громкости L_r больше громкости тона с уров- нем громкости Л₂.

Один из подходов к определению функции громкости, получив-

кости тона в зависимости от исходного уровня громкости (по: Zwicker, 1958).

По оси абсцисс — уровень громкости в дб тона 1000 гц; по оси ординат — увеличе- ние уровня громкости, необходимое для того, чтобы звук воспринимался как в два раза более громкий. Сплошная кривая — данные Цвикера (Zwicker, 1958), пунктир- ная — Робинсона (Robinson, 1957).

ровании громкости сигнала. В одном из вариантов методики испытуемому предъявляется эталон (звук с определенным УЗД), которому присваивается число (чаще 10 или 100). Затем испытуемый слушает набор сигналов, оценивая отношение громкости каждого из этих сигналов к эталону. Полученная таким образом зависимость между звуковым давлением сигнала и оценкой его громкости довольно хорошо аппроксимируется выражением g= ^kp^. Это выражение, предложенное Стивенсом (Stevens, 1955, 1957), получило название степенного закона Стивенса.

При использовании логарифмического масштаба по обеим осям график зависимости приобретает вид прямой, наклон которой указывает значение 9 —- показателя степени.

К сожалению, значения 0, определенные на основании данных экспериментов по прямому численному шкалированию, очень сильно варьируют (см.: Пьерон, 1966).

Более устойчивые результаты дает метод, при котором испытуемому предлагают подобрать сигнал, который вдвое тише или вдвое

351

громче эталона. На рис. 125 приведены данные Цвиккера (Zwicker, 1958) и данные Робинсона (Robinson, 1957), полученные этим методом для тона 1000 гц.

Если бы громкость была степенной функцией интенсивности звука, причем показатель степени сохранялся бы постоянным на всем диапазоне уровней интенсивности, для удвоения громкости сигнала всегда нужно было бы увеличивать его уровень интенсивности на одно и то же число децибел. Рис. 125 показывает, что при малых уровнях для удвоения громкости достаточно увеличить уровень на 6 дб, при уровнях порядка 50—70 дб для удвоения громкости требуется увеличение уровня на 12 дб или больше.

Из данных рис. 125 следует, что на интервале уровней от 10 дб до 50'дб значения показателя степени должны изменяться от 0.5 до 0.25.

Еще один метод определения функции громкости основан на сравнении уровней громкости двух звуков, один из которых из теоретических соображений должен казалось бы быть вдвое громче другого. Сюда относится сравнение громкости одного тона с громкостью комплекса из двух равногромких тонов, далеко разнесенных по частоте, а также сравнение громкости тона, предъявленного монаурально, с громкостью того же тона при бинауральном предъявлении. Результаты этих двух типов эксперимента дают сильно различающиеся между собой результаты.

Прирост уровня громкости двух равногромких разнесенных по частоте тонов, действующих на одно ухо, составляет в среднем диапазоне уровней 10—12 дб (Fletcher, 1953), что хорошо согласуется с данными рис. 125.

Прирост уровня громкости тона при бинауральном предъявлении составляет в среднем диапазоне уровней примерно 6 дб, при близких к порогу уровнях он уменьшается, приближаясь к 3 дб (Reynolds, Stevens, 1960; Treisman, Irwin, 1967). Это соответствует тому, что значения показателя степени, вычисленные на основании этих данных, должны изменяться с увеличением уровня от 1.0 до примерно 0.5.

Существенно, что такой малый прирост уровня громкости при бинауральном предъявлении сигнала наблюдается в том случае, если на оба уха действует тон одной и той же частоты. Если одновременно на разные уши подаются два равногромких сигнала, далеко разнесенных по спектру, прирост суммарной громкости этого сложного сигнала составляет 8—13 дб (Клаас и Чистович, 1959). Этот факт заставляет предполагать, что при бинауральном предъявлении тона одной и той же частоты не происходит полного суммирования громкости (импульсации), поступающей из двух ушей, т. е. что общая громкость оказывается меньшей суммы громкостей, связанных с каждым из ушей.

Таким образом, результаты различного рода экспериментов позволяют считать, что при средних и высоких уровнях сигнала 352

его громкость пропорциональна степенной функции от интенсив- ности звука g~k_r (I/Iof—kz (P/P_Q)^2B с показателем степени 9, близким к 0.25.

Отклонение от этой зависимости при малых уровнях интенсив- ности сигнала окончательно не объяснено; его часто связывают с действием собственных шумов, которыми при малых уровнях сигнала уже нельзя пренебрегать. Модельные представления,

объясняющие влияние шума на

вид экспериментально опреде- ляемой функции громкости, бу- дут изложены ниже после опи- сания данных о громкости сиг- нала, действующего на фоне внешнего шума.

В качестве единицы гром- кости используется сон. Один сон соответствует громкости тона 1000 гц с уровнем интен- сивности, равным 40 дб над нормальным слуховым порогом.

Влияние шума на громкость сигнала, действующего на его фоне. Громкость тона или слож- ного звука, действующего на фоне шума, всегда оказывается меньшей громкости этого же звука в тишине. Однако чем больше уровень сигнала, тем меньше вызванное шумом по- нижение его громкости.

На рис. 126 приведены резуль

Рис. 126. Зависимость между уров- нем интенсивности тона (по оси абсцисс) и его уровнем громкости (по оси ординат) в условиях, когда тон предъявляется на фоне шума (Stevens, 1966).

Пунктирная линия — тон действует в ти- шине; кружки, квадраты и треугольники соответствуют трем разным уровням ин- тенсивности маскирующего шума.

таты эксперимента по уравнива

нию громкости тона 1000 гц, действующего в тишине, с громкостью того жетона, действующего на фоне октавного шума (700—1400 гц) с тремя разными уровнями интенсивности. График построен Стивенсом (Stevens, 1966) по данным Лохнера и Бургера (Lochner, Burger, 1961). Из графика следует, что чем выше уровень маскирующего шума, тем быстрее растет громкость маскируемого тона с увеличением его интенсивности. При больших уровнях маскируемого

тона его громкость уже не отличается от громкости того же тона, действующего в тишине. Это явление быстрого роста громкости сигнала в условиях маскировки получило название эффекта выравнивания громкости.

Было предложено несколько различных моделей эффекта. Наиболее привлекательной из них представляется модель, предложенная Цвиккером (Zwicker, 1958). Ее проще всего пояснить, обратившись к схеме рис. 121. Примем для простоты, что сигнал яв-

23 Сенсорные системы

353

ляется чистым тоном и что его действие ограничено тем фильтром, центральная частота которого равна частоте тона. При действии одного шума на выходе этого фильтра будут наблюдаться колебания с интенсивностью Р%. Допуская, что между интенсивностью колебаний и величиной импульсации (громкости) на выходе преобразователя существует степенная зависимость, получим, что громкость, обусловленная шумом, будет равна СР^. При добавлении тона к шуму интенсивность колебаний возрастет до (Р^ + Р|), а величина импульсации (громкости) станет равной С (P# + Psf-

Для того чтобы слуховая система могла разделить сигнал от шума, она должна располагать какими-то механизмами измерения прироста импульсации, т. е. вычисления разности С(Р^-\-Рв)^В — СР%.

Эта разность и является, по Цвиккеру, значением громкости тона в канале, настроенном на частоту данного тона. Общая громкость тона на фоне шума получается путем суммирования таких разностей по всему множеству каналов.

Приняв, что показатель степени 6 равен 0.25, Цвиккер вычислил теоретическую зависимость громкости тона от его интенсивности при различных значениях интенсивности маскера. Теоретические кривые достаточно близки с экспериментально полученными зависимостями.

Такое же рассмотрение применимо и для случая действия тона в тишине, с той разницей, что теперь роль внешнего шума выполняют собственные шумы. Оно позволяет объяснить более быстрый рост громкости тона при малых уровнях интенсивности.

Дальнейшее развитие подхода, предложенного Цвиккером, требует изучения и моделирования механизма, обеспечивающего вычисление прироста импульсации (громкости). Пока можно только предполагать, что этот механизм тесно связан с явлениями адаптации, обнаруживаемыми при физиологических исследованиях слуховой системы.

Дифференциальные пороги по интенсивности. Дифференциальный порог (ДП) по интенсивности обычно рассматривается как мера точности измерения громкости.

Первое методически совершенное исследование ДП было выполнено в 1928 г. (Riesz, 1928). Было обнаружено, что значения ДП мало зависят от частоты, но существенно зависят от УЗД — порог резко возрастает при уменьшении уровня интенсивности тона. В области средних уровней и частот дифференциальный порог ^ЦП == 10 lg составляет 0.3—0.7 дб.

На рис. 127 приведена зависимость ДП от уровня ощущения тона (Chocholle, 1955). Дифференциальный порог может быть прёдставлен как 101g^. По данным рис. 127 легко вычислить,

4TolO]g~- изменяется в пределах от 0 дб (на пороге ощущения) 354

до —12 дб при больших уровнях. Дифференциальные пороги для белого шума оказываются довольно близкими к дифференциальным порогам для тонов (Miller, 1947).

Процедура вычисления громкости. Предложена процедура, позволяющая вычислять громкость звука по его спектру (Zwi- cker, 1958; Zwicker, Scharf, 1965). Она основывается на представлении, что каждому звуку соответствует определенная кривая распределения плотности громкости по проекции оси частот; общая громкость звука определяется путем интегрирования — вычисления площади под кривой.

Рис. 127. Дифференциальный порог (ДП) по интенсивности ^ДП = 10lg —jв зависимости от исходной интенсивности (уровня ошущения) тона (по: Chocholle,

По оси абсцисс — уровень ощущения тона; по оси ординат — ДП; а — частота тона равна 200 гц, б — 1000 гц, в — 10 000 гц.

Рис. 128. Зависимость между частотой (по оси ординат) и субъективной высотой (Z, по оси абсцисс), принятая в модели Цвиккера (Zwicker, 1958).

В качестве шкалы, соответствующей слуховой проекции оси частот, принимается шкала Z. Единицей шкалы является барк; один барк соответствует частотному интервалу, равному одной критической полосе. На рис. 128 приведена зависимость между шкалой частот и шкалой Z. Шкалу Z можно интерпретировать как пронумерованный ряд фильтров (см. рис. 121) с возрастающими центральными частотами. Рис. 128 можно тогда рассматривать как указание связи между номером фильтра (канала) и центральной частотой фильтра. Если число каналов конечно, определение общей громкости соответствует суммированию громкостей по всем каналам. Плотность громкости в таком случае интерпретируется как значение громкости в одном канале. Единицей плотности громкости является сон/барк.

Первый этап построения кривой плотности громкости состоит в конструировании рисунка маскировки, соответствующего за

23*

355

данному спектру. Это осуществляется с помощью набора стандартных контуров маскировки, экспериментально определенных для ряда узкополосных шумов с различными центральными частотами.

Как обычно, принимается, что величина маскировки на частоте f. отражает энергию колебаний, вызываемых маскером, на выходе фильтра с центральной частотой Д.. Считается, что обнаружение маскируемого тона происходит при том условии, что энергия тона превысит в К раз энергию маскера на выходе фильтра, настроенного на частоту тона; К принимается постоянным во всем диапазоне интенсивностей. Это дает возможность легко вычислить по величине маскировки тона на частоте Д, какова должна быть интенсивность маскера на выходе фильтра с центральной частотой Д. Вычисленная величина принимается в качестве меры интенсивности данного сигнала в точке шкалы Z, соответствующей частоте Д.

Для перехода от интенсивности сигнала в точке Z. к значению плотности громкости в этой точке (ZV') используется отношение N¹ = С [(P²n + — Pn], где P²_S — вычисленная интенсивность

сигнала, 9, С и P²_N — константы, принятые в модели.

Хотя отдельные детали предложенной процедуры, которых мы здесь не касались, вызывают возражения, применение ее позволяет качественно воспроизвести основные эффекты, наблюдавшиеся при экспериментальном исследовании громкости. Во многих случаях удается получить также вполне удовлетворительное количественное соответствие расчетных и экспериментально полученных величин.

Это дает возможность считать данную процедуру сжатым и формализованным представлением существующей психоакустической теории громкости.

Ограниченность теории состоит в том, что она пока не рассматривает нестационарных сигналов и игнорирует тот.факт, что само слуховое измерение громкости является процессом, происходящим во времени.

ВЫСОТА

Относительное различение высоты тонов. Считается, что высота тонального звука есть результат измерения слуховой системой его частоты (Licklider, 1951b). Точность измерения частоты в слуховой системе человека характеризуется величиной дифференциального порога (ДП).

Как следует из модели процесса различения (см. раздел «Модели и методы психоакустического эксперимента»), величина дифференциального порога определяется не только ограничением чувствительности слухового анализатора, но также ошибками звена принятия решений. Дифференциальные пороги, определенные с помощью различных экспериментальных процедур, таких, где ис

356

пользуются разные ответные реакции и возможны различные критерии оценок, могут существенно отличаться друг от друга (Harris, 1952а). Кроме того, на величину порогов влияют свойства испытуемых — возраст, степень тренированности и т. д.

Приступая к определению дифференциальных порогов, исследователи, как правило, стремятся так организовать процедуру опытов, чтобы ответы испытуемых в большей степени отражали свойства слуховой системы, а ошибки реакций сводились бы к минимуму. Обычно наиболее подходящим считается такой способ, при котором удается получить минимальные значения порогов.

Основные методы, которые используются при определении дифференциальных порогов по частоте, описаны в разделе «Модели и методы психоакустического эксперимента».

Одним из наиболее существенных требований при измерении дифференциальной чувствительности по частоте является тщательный выбор и контроль параметров стимулов. Длительность стимулов устанавливается достаточно большой, чтобы относительное время переходных процессов, возникающих в слуховом анализаторе в начале и конце звуковых посылок, было мало по сравнению с длительностью стационарного процесса. С целью уменьшить спектральные искажения, возникающие при переходных процессах, применяют стимулы с плавным нарастанием и спадом амплитуды.

Существенное значение имеет также установление оптимальной паузы между стандартным и тестирующим сигналами. С одной стороны, пауза не должна быть слишком короткой, чтобы избежать взаимной маскировки стимулов, с другой — она не должна быть и очень большой, так как при значительном разнесении стимулов во времени на точности их различения начинает сказываться забывание. Увеличение ошибки (повышение дифференциального порога) наблюдается при разнесении стимулов на 1 сек. и больше (библиографию и модель явления см.: Wickelgren, 1969).

Некоторые исследователи предпочитают применять стимулы с непрерывно изменяющейся частотой (Schower, Biddulph, 1931; Zwicker, 1952; Feth et al., 1969). Такое изменение достигается при частотной модуляции тона, осуществляемой по синусоидальному закону с низкой частотой модулирующего сигнала (порядка 2— 4 гц). За дифференциальный порог принимается значение отклонения центральной частоты (девиация частоты), при котором становятся ощутимыми медленные периодические колебания высоты звука.

На рис. 129 приведены данные двух работ (Schower, Biddulph, 1931; Harris, 1952b), которые в настоящее время считаются наиболее обстоятельными и обычно используются при попытках составить теоретическое объяснение механизма слухового восприятия частоты (другие литературные данные можно найти в указанных статьях, содержащих обзоры более ранних исследований). В работе Шауэра и Бидальфа с помощью метода едва заметных

357

различий измерялись пороги восприятия периодического изменения высоты тонов, частота которых модулировалась по синусоидальному закону с частотой в 2 гц. Исследования Харриса были выполнены с помощью метода постоянных стимулов (АХ-метод) с использованием 2 отдельных стационарных тонов. В обеих работах дифференциальные пороги были измерены в широком диапазоне частот и для нескольких уровней ощущения стимулов (от 5

Рис. 129. Дифференциальные пороги по частоте.

Крестики — по данным Schower, Biddulph, 1931; точки — по данным Harris, 1952Ь. А — зависимость абсолютного значения порогов (осъ ординат, в дб) от частоты стимулов (осъ абсцисс, в гц); Б — зависимость относительной величины порогов (осъ ординат, в дб) от частоты стимулов (осъ абсцисс, в гц). Уровень интенсивности стимулов 30 дб над порогом ощущения.

до 90 дб у Шауэра и Бидальфа и от 5 до 30 дб у Харриса). Приведенные данные характеризуют чувствительность достаточно тренированных людей (усредненные ответы 5 и3 человек). Помимо этого, Харрисом были определены пороги у больших групп испытуемых (от 30 до 90 человек), не имеющих тренировки, в условиях одноразовых испытаний и получены распределения величин дифференциальных порогов у людей с нормальным слухом.

Обе работы дают весьма близкие результаты относительно величин и характера зависимости дифференциальных порогов в области средних и высоких частот. Наблюдаемое в этой области постоянство относительных порогов отмечалось также и в более ранних исследованиях.

Значения дифференциальных порогов свидетельствуют об очень высокой точности слухового измерения частоты тонов: например,

358

звуки с частотой в области 2000 гц воспринимаются как различные, если они отличаются по частоте всего лишь на 0.1—0.4%.

Однако рассматриваемые зависимости дифференциальных порогов от частоты в целом несколько отличаются друг от друга. В области низких частот (до 1000 гц) абсолютные значения порогов, измеренные Шауэром и Бидальфом, остаются примерно постоянными (А/=const), а в высокочастотной области быстро возрастают по такому закону, что постоянными сохраняются относительные значения (A///=const). Аналогичный характер зависимости наблюдался в более поздних исследованиях (Zwi- cker, 1952), в которых также использовались частотномодулиро- ванные тоны. В то же время пороги, измеренные Харрисом для отдельных тонов, по своему абсолютному значению монотонно возрастают, а по относительному остаются примерно постоянными почти во всей области частот, за исключением самых низких (62.5— 125 гц).

Существуют некоторые сомнения относительно постоянства относительной величины дифференциальных порогов для сигналов самых высоких частот (Henning, 1966а). Для звуков этой области абсолютные значения порогов не так уж малы, а при большем различии тонов по частоте возрастает возможность большего различия их по громкости за счет неравномерности частотной характеристики как самого уха, так и электроакустического преобразователя. В этих случаях человек может основываться при различении тонов не только на разнице их высот, но и на разнице громкостей.

Хеннинг измерял дифференциальные пороги по частоте (методом АХ) для стимулов, амплитуды которых варьировали в случайном отношении друг к другу. При этих условиях, исключающих возможность для испытуемых руководствоваться различием громкостей, чувствительность к различению высоты на высоких частотах оказалась значительно хуже по сравнению с тем, что наблюдалось при постоянной интенсивности. По результатам Хеннинга относительная величина дифференциального порога регулярно возрастает при увеличении частоты стимулов начиная от 5000 гц и выше и на частоте 10 000 гц оказывается на порядок больше, чем, например, у Шауэра и Бидальфа.

Приводимые данные о значениях дифференциальных порогов по частоте относятся к звукам, характеризующимся некоторым средним уровнем громкости (30 дб над абс. порогом) и достаточной длительностью (порядка 1 сек.). Однако известно, что при небольших уровнях стимулов и при малых длительностях точность различения высоты понижается. По данным указанных выше работ Шауэра, Бидальфа и Харриса, зависимость дифференциального порога по частоте от интенсивности наблюдается только для уровней интенсивности стимулов до 30 дб над порогом, а на более высоких уровнях она практически отсутствует

359

(рис. 130). Данные о зависимости дифференциальных порогов от длительности см. в разделе «Накопление информации во времени».

Абсолютные оценки высоты. Проблема абсолютной оценки

высоты с давних пор интересовала психологов в основном в связи с изучением музыкальной одаренности: способность человека

точно узнавать высоту отдельных звуков характеризует наличие

Рис. 130. Зависимость дифференциальных

у человека особого свой- ства — абсолютного слу- ха, интересного феномена, природа и механизм кото- рого является предметом ряда исследований (Теп- лов, 1947; Гарбузов, 1948).

В последнее время за- дача изучения поведения человека при абсолютном узнавании стала вызывать более широкий интерес в связи с общей пробле- мой распознавания внеш- них сигналов. В этом ас- пекте интерес представля- ют как раз сведения, касающиеся поведения на- иболее представительной части людей — людей с обычным слухом. Абсолют-

порогов по частоте от уровня интенсивности стимулов (Harris, 1952b).

По оси абсцисс — уровень интенсивности в дб по отношению к порогу слышимости; по оси ординат — абсолютное значение дифференциального порога в гц; параметр кривых (цифры слева от кривых) — частота стандартного стимула в гц.

ное узнавание высоты ис- следуется с помощью экс- периментов, в процессе ко- торых испытуемые иден- тифицируют последова-

тельно предъявляемые оди- ночные стимулы разной частоты, обозначая их одним из заранее принятых симво- лов — нотным знаком или числом. Этот метод предусматривает необходимость предварительного обучения, во время которого испытуемых знакомят с тестовым множеством сигналов (ограни- ченным набором значений частоты) и их обозначениями. Пред- метом анализа служат ошибки ответов.

Существует несколько способов количественного представле- ния данных по абсолютному узнаванию. Наиболее простым яв- ляется определение процента правильных оценок. Более подроб- ный анализ осуществляется при составлении матрицы ответов —

распределения вероятности присвоения каждому стимулу каждого из возможных обозначений.

360

Один из вариантов анализа предусматривает определение по матрице ответов количества принятой информации, выражаемой либо в дв. ед., либо числом безошибочно различаемых категорий (изложение методов расчета см.: Attneave, 1959). Использование указанных характеристик для описания свойств слухового восприятия основано на применении в психофизике некоторых положений теории информации. Человек в условиях опытов рассматривается как канал связи, а сами эксперименты ставятся с целью определить его способность передавать информацию, т. е. пропускную способность или емкость сенсорной системы. Предполагается, что основной причиной разрушения информации является наличие внутренних помех случайной природы, ограничивающих емкость канала.

Исследования пропускной способности слуховой системы в условиях абсолютного различения частоты тональных стимулов, проведенные Поллаком (Pollack, 1952, 1953), показали, что человек может правильно различать не более чем б звуков.

Подробный обзор психофизических данных, характеризующих способность человека передавать информацию при восприятии сигналов различной природы, можно найти в работе Миллера (Miller, 1956).

Более удобное представление данных об абсолютном суждении дает способ определения среднего квадратичного значения флюктуаций исходных стимулов вдоль субъективной шкалы измерения частоты (вариация высоты — о, разработанный Чистович и Войтинским (1957)). Он дает возможность непосредственно сравнивать между собой точность абсолютного и относительного различения.

Характеризуя точность абсолютных суждений, довольно трудно указать какую-либо одну определенную величину, как бы она ни была выражена. Оказывается, что ошибки, с которыми оценивается высота, могут очень широко варьировать в зависимости от многих факторов, таких как степень обученности, размер тестового множества стимулов, частотный диапазон, природа источника сигналов, состав и количество испытуемых и т. д. Единственное общее утверждение, которое можно сделать на основании всех исследований по данному вопросу, заключается в том, что точность абсолютных оценок высоты значительно уступает точности относительного различения (Войтинский, 1959; Теплов и Борисова, 1957).

По результатам указанной работы Войтинского, подробно измерявшего точность абсолютных оценок тональных сигналов, оказалось, что ошибки абсолютных суждений (а) превышают дифференциальные пороги по частоте (использованы данные Харриса, 1952) не менее чем в 20 раз.

Пределы флюктуаций высоты существенно меняются в зависимости от числа используемых категорий и от диапазона варьиро

361

вания частот стимулов. Так, если оцениваются звуки из 2 тестовых наборов, таких что частотный диапазон варьирования у обоих одинаков, но в одном из них используется большее число градаций, чем в другом, то флюктуация высоты (значение о) будет больше в первом случае. В то же время при одном и том же числе градаций, но при разном частотном диапазоне флюктуации будут тем больше, чем больше частотный диапазон (Войтинский, 1959; Клаас, 1959). По данным Войтинского, ошибки абсолютных суждений для стимулов из диапазона 500—-2000 гц примерно в 10 раз больше, чем для стимулов из диапазона 980—1020 гц (исходный набор стимулов один и тот же и равен 5).

Точность абсолютных оценок высоты повышается по мере увеличения тренированности испытуемых (Hartman, 1954). Однако уменьшение ошибок за счет обучения происходит не беспредельно: начиная с некоторого момента (в опытах Хартмана после 4 недель тренировки) процесс улучшения затухает и ошибки достигают стабильной величины.

Процедурой, при которой также осуществляется абсолютная оценка высоты звука, можно считать голосовое воспроизведение высоты в условиях, когда человек создает ответный сигнал после предварительного прослушивания стимулов с заданной частотой (голосовая имитация высоты). Параметрами ответов в этом случае служат значения частоты основного тона голоса, которые связаны монотонной зависимостью с частотой исходных звуков (Чистович и др., 1968) для области примерно от 100 до 500 гц.

Результаты исследования особенностей голосовой имитации высоты тонов у людей без специальной вокальной тренировки и без музыкального образования показали, что большая часть из этих людей воспроизводит высоту тонов таким образом, что частота основного тона голоса в среднем довольно близко совпадает с частотой исходных звуков, а случайные ошибки (стандартное отклонение от среднего) составляет 9—30 гц у разных испытуемых (Люблинская, 1968).

Шкала высоты. Основные исследования субъективной шкалы высоты выполнены, исходя из предположения о том, что слуховые отображения частоты тонов образуют некоторое непрерывное множество чисел с фиксированным нулем, подчиняющихся правилу отношений (Stevens, 1951). При этом считается, что связь между частотой тона и ее субъективным коррелятом — высотой — может быть выражена одномерной функцией, однозначной в пределах случайных вариаций системы преобразования (зависимость высоты от других параметров считается пренебрежимо малой и не принимается во внимание).

Широко распространенными экспериментальными способами определения шкалы высоты служат методы прямого численного шкалирования, разработанные Стивенсом (см. раздел «Модели и методы психоакустического эксперимента»). Им же были пред-

362

Рис. 131. Субъективные шкалы высоты.

А — шкалы, полученные методом «деления пополам» по данным: 1 — Stevens et al., 1937; 2 — Stevens, Volkman, 1940; 3 — Siegel, 1965. В — сравнение результатов прямого численного шкалирования высоты (сплошная кривая и кружки) со шкалой, рассчитанной на основании значений дифференциальных порогов по частоте (пунктирная кривая) (Zwislocki, 1965). Остальные объяснения в тексте. По осям абсцисс — частота тона (в гц, логарифмический масштаб); по осям ординат — единицы измерения высоты (мел).

приняты первые попытки получить вид шкалы высоты с помощью процедуры «деления пополам» (Stevens et aL, 1937). В опытах Стивенса испытуемые устанавливали частоту второго из предъявляемых звуков так, чтобы его высота казалась равной половине высоты первого. За единицу высоты была принята условная величина «мел» (от слова мелодия), выбранная по условию: «частоте в 1000 гц соответствует высота в 1000 мел». Полученная таким образом зависимость представлена на рис. 131,4 (кривая 1).

В следующей работе (Stevens, Volkman, 1940) процедура экспериментов была несколько изменена: помимо стандартного и переменного стимулов предъявлялся еще один звук с низкой частотой — в 40 гц, который, как предполагалось, должен был помочь испытуемым установить нулевую точку субъективной шкалы. При этом условии была получена функция, несколько отличающаяся от первой (рис. 131, 4, кривая 2).

Функция, представленная кривой 3 на рис. 131, А есть результат сравнительно недавнего исследования (Siegel, 1965), в котором использовалась та же процедура, что и в первых опытах Стивенса, т. е. деление высоты пополам без предъявления низкочастотного стимула. Наблюдаемое расхождение кривых, полученных одним и тем же способом, Зигель объясняет главным образом за счет разницы в возрасте испытуемых (в его опыте были использованы более молодые слушатели).

Уже эти данные иллюстрируют тот факт, что вид функции, характеризующей шкалу высоты, полученной разными способами и у разных испытуемых, не остается одним и тем же. Бек и Шоу (Beck, Show, 1962), используя для получения шкалы процедуру численной оценки отношения между высотой заданного стимула и высотой стандарта, показали, что наклон функции существенно зависит от частоты стандартного тона. При частоте стандарта 100 гц шкала совпадает со второй из функций, полученной Стивенсом и Фолькманом, а при частоте 523 гц она приближается к первой (основной) шкале.

Подробное изучение шкалы высоты с использованием разнообразных способов численной оценки было предпринято Харрисом (Harris, 1960). Из результатов опытов с уравниванием высотных интервалов (предъявлялись 3 тона с разной частотой, требовалось подобрать частоту третьего, отстоящего от второго на тот же интервал, что второй от первого) оказалось, что характер шкалы систематически зависит от величины исходного интервала. При большом интервале (в частности, 572 гц) подбор равного ему осуществляется в соответствии со второй шкалой мелов Стивенса (рис. 131, 4). Уменьшение интервала приводит к тому, что воспринимаемый как равный ему интервал становится больше того, который предполагается по шкале и, начиная с некоторой величины (примерно треть октавы), уравнивание осуществляется в соответ

364

ствии с логарифмической зависимостью, как это предполагается в музыкальной шкале высот.

Численная оценка высоты, как отмечается всеми авторами, сопровождается очень большими случайными ошибками ответов. Особенно велики ошибки в тех опытах, где предусмотрены прямые численные оценки отношений больших, чем 1 : 2 или 2 :1 (Stevens, Galanter, 1957).

Помимо методов прямого численного шкалирования шкалу высоты можно получить расчетным путем по данным о дифференциальных порогах по частоте. Этот способ основывается на предположении о том, что субъективное расстояние между стимулами, различающимися на Д/ — величину, соответствующую величине дифференциального порога, одинаково для всего множества воспринимаемых слухом частот (в основе его лежит гипотеза ’Фех- нера о субъективном равенстве ощущений едва заметных различий для всех воспринимаемых человеком сигналов, что используется для построения шкал по методу, предложенному Фехнером и Терстоуном — см. обзор: Галунов, 1969).

Постулирование этого свойства дает возможность получить вид функции высоты P ^F(f) путем суммирования (интегрирования) дифференциальных порогов по всей области частот. На основании допущения о непрерывности функции высоты справедливо соотношение

(1)

(2)

где ДР — приращение высоты, соответствующее дифференциаль- ному порогу, Д/ — его физическая мера, определяемая экспери- dP

ментально как функция частоты Д/ = Ф(/) и тт-—производная

высоты по частоте. Из уравнения (1) можно определить dP:

dP^ — -df,

интеграл от которого по / дает P=F (f) в виде:

[ ДР М v^d/-

(3)

Согласно постулату о равенстве субъективных порогов имеем:

ДР — const = К,

тогда

5^к -4f-^df

-df.

365

Если аппроксимировать экспериментальную зависимость А/= :-ф (/) некоторым аналитическим выражением, то можно получить уравнение для функции высоты P^=KF_X (/), в котором коэффициент К, т. е. истинный масштаб функции, остается неопределенным.

Описанная* процедура была выполнена Цвизлоцким (Zwis- locki, 1965), рассчитавшим функцию высоты по данным дифференциальных порогов Цвиккера (Zwicker, 1952), найдя соответствующую аппроксимацию зависимости А/~Ф (/). При условии, что коэффициент масштабности равен 4.5, получилось достаточно хорошее совпадение со шкалой, определенной Стивенсом с помощью методов численных оценок (рис. 131, Б).

Факт совпадения шкал, рассчитанных по дифференциальным порогам и определенных с помощью численных оценок ощущений, рассматривается многими исследователями как подтверждение гипотезы о равенстве пороговых приращений высоты. Однако не следует переоценивать значение этого факта. Достаточно вспомнить, что экспериментальная зависимость А/=Ф (/) имеет разный вид по данным разных авторов (рис. 129) и результаты Цвиккера, по которым была рассчитана функция высоты, дают только один из ее вариантов.

Значительное расхождение результатов шкалирования высоты по данным разных исследований заставляет думать, что установление вида шкалы высоты нельзя рассматривать как решенную проблему. Серьезные сомнения вызывает основное предположение об одномерности субъективных измерений частоты. Ни одна из предлагаемых шкал не отражает известного свойства октавной близости звуков, которое проявляется главным образом при абсолютных оценках высоты (Bachem, 1955; Elfner, 1964; Schreiber, 1965) и выражается в том, что требуемое обозначение высоты присваивается не данному звуку и даже не ближайшему к нему по шкале частот, а такому, частота которого в два раза больше или меньше. Октавные ошибки свидетельствуют о нарушении монотонности множества субъективных измерений частоты, что трудно объяснить с точки зрения одномерного представления.

В связи с этим привлекает внимание идея о том, что слуховое измерение частоты звуков представлено не одномерной величиной, а включает в себя две составляющие, одна из которых отражает собственно высоту (мелодическое качество, т. е. то качество, которое отражено в шкале мелов), а другая — тональную хроматичность или тональность. Считается, что тональность присуща только периодическим сигналам, непериодические сигналы, например шумы с ограниченным спектром, этим свойством не обладают. Они могут между собой различаться только по тому признаку, который обозначается собственно как высота.

Первая составляющая представляется некоторым монотонным аналогом частоты, тогда как вторая — цикличным, по типу часового циферблата, так что вся шкала образует как бы спираль 366

(Shepard, 1964). В цитируемой работе были сделаны попытки экспериментального обоснования идеи спиральной шкалы, не выходящие впрочем, за рамки качественного рассмотрения.

Высота сложных сигналов. Психоакустические исследования явлений, относящихся к восприятию высоты сложных сигналов (в особенности это касается работ последнего времени) органическим образом связаны с попытками составить представление о механизме частотного анализа в слуховой системе и не могут быть изложены без их связи с выдвигаемыми гипотезами.

Чистые тоны, для которых так просто определяется физический коррелят высоты, встречаются в природе очень редко. Как правило, человек имеет дело с гораздо более сложными по своему физическому описанию акустическими сигналами, спектр которых состоит из многих частотных компонент. В этих случаях гораздо труднее ответить на вопрос, чем определяется высота звуков.

Одно из самых ранних представлений по данному вопросу было сформулировано в прошлом веке (Ohm, 1843). Оно основывается на предположении о том, что слуховая система осуществляет анализ Фурье, благодаря чему многокомпонентный сигнал в слуховом описании представлен набором отдельных составляющих, членов ряда Фурье, каждой из которых соответствует своя частота (или ее субъективный коррелят). Это положение известно в литературе под названием акустического закона Ома. Оно было использовано в качестве основной гипотезы при разработке Гельмгольцем (Helmholz, 1863) модели слуховой системы, которая затем была более детально уточнена. История развития теоретических представлений и экспериментальных исследований по этому поводу изложена в книге Бекеши (Bekesy, 1960).

Согласно закону Ома, сложный сигнал, состоящий из нескольких синусоидальных компонент, не связанных между собой гармоническим соотношением и достаточно широко отставленных друг от друга по шкале частот, должен восприниматься как многовысотный и ощущение каждой высоты определяется частотой соответствующей компоненты. Если же сигнал гармонический, т. е. частоты его компонент связаны соотношением целых чисел, то он воспринимается как одновысотный комплекс, и его высота определяется компонентой с самой низкой частотой, т. е. первой гармоникой.

Однако, как показали дальнейшие исследования, справедливость закона Ома подтверждается далеко не для всех звуков. Существует два различных по своему существу класса явлений, на которые не распространяется закон Ома. В первую очередь действие закона Ома ограничивается разрешающей способностью уха как спектрального анализатора. При малом разнесении составляющих вдоль шкалы частот они не могут восприниматься каждая в отдельности. Наиболее тщательное измерение критического расстояния между составляющими, позволяющего воспри

му

нимать на слух отдельные компоненты сложного звукового сигнала, было проведено Пломпом (Plomp, 1964b; Plomp, Mimpen, 1968), который показал, что разделение частотных компонент при восприятии возможно в том случае, если расстояние между ними вдоль частотной оси составляет величину, не меньшую, чем ширина «критической полосы» в данной частотной области.

Чем же определяется высота сложных звуков, спектральные компоненты которых различаются по частоте меньше чем на ширину критической полосы? Для выяснения этого вопроса исследовали восприятие высоты звуков, спектральные компоненты которых (чистые тоны) были сконцентрированы в определенной частотной области (от трети до полной октавы), различаясь на малую величину А/, например 8 гц. Звук с такими свойствами называют «тональной массой». Оказалось, что высота «тональной массы» определяется некоторой средней частотой данного комплекса (Ekdahl, Bjoring, 1934).

Центральной частотой определяется также высота шума, энергия которого концентрируется в относительно узкой (не шире 2 октав) частотной области (Reinbolt, Schubert, 1968). Такой шум образуется, как правило, путем пропускания белого шума через резонансный или полосовой фильтр с ограниченной полосой пропускания. Строго говоря, к таким сигналам неприменимо понятие высоты в том смысле, как оно применяется к обозначению высоты тонов и сложных периодических сигналов, так как шумовые звуки не имеют тонального характера. Однако им свойственна определенная высотная окрашенность, позволяющая судить о том, выше или ниже один звук по отношению к другому, что характерно для восприятия высоты, и поэтому можно считать, что этот признак присущ и шумовым звукам. В случае, если белый шум пропущен через полосовой прямоугольный фильтр, ширина полосы которого составляет две и более октавы, он воспринимается как двухвысотный и эти высоты определяются граничными частотами полосы (Bekesy, 1963; Reinbolt, Schubert, 1968).

Тот факт, что граница спектральной области шума определяет его высоту, подтверждается также данными о восприятии высоты белых шумов, пропущенных через фильтры низких или высоких частот. В этих случаях высота звуков соответствует частоте среза (Small, Daniloff, 1967). При этом была обнаружена интересная особенность восприятия таких сигналов: их высота подчиняется октавным суждениям, т. е. человек может легко подобрать к такому сигналу тональный звук, частота которого в два раза больше или меньше частоты среза.

С точки зрения механизма измерения высоты большая часть описанных явлений может быть объяснена, исходя из предположения, что отклик на сигнал периферических отделов слуховой системы (слуховой эквивалент спектра сигнала) подвергается дополнительной обработке, обеспечивающей выделение особых тоцек

на кривой отклика (максимумов, краев). Положение особых точек на слуховой проекции оси частот и является признаком, определяющим высоту сигнала. Рассмотрение различных моделей, способных осуществлять такую обработку, можно найти в работе Молчанова и Лабутина (1966).

Другой класс явлений, на который не распространяется закон Ома и которые, более того, вообще не могут быть объяснены с точки зрения спектрального анализа, включает в себя восприятие высоты периодических сложных сигналов, в спектре которых отсутствует компонента с частотой, соответствующей воспринимае-

Рис. 132. Форма волны (Z) и спектры (ZZ) резидуальных звуков (схематическое изображение).

А — для импульсных периодических последовательностей, В — для ампли- тудно модулированной синусоиды, В — для периодически прерываемого белого шума. Т_ои, Т_ом, Т_ош — период изменения формы волны соответствующего сигнала; / — частота, S (f) — амплитуда спектральных составляющих (гармоник). Цифры на НА — номера гармоник.

мой высоте. Примерами таких типов сигналов могут служить периодическая импульсная последовательность, в которой подавлены низкочастотные гармоники, амплитудномодулированные синусоидальные колебания или периодически прерываемый шум.

На рис. 132 схематически приведены примеры формы звуковой волны таких сигналов и картины их спектров. С точки зрения восприятия указанные на рисунке сигналы обладают одной и той же высотой, несмотря на то что спектры этих звуков существенно отличаются друг от друга. Как было показано экспериментально, в первом случае (Л) высота соответствует частоте следо- в а ния импульсов -у- (Schouten, 1940а, 1940Ь), во втором (Z>) — ча-

ои

стоте модуляции ™— (Mathes, Miller, 1947) и в третьем (5) — ча-

ОМ 1

стоте прерываний шума ™— (Miller, Taylor, 1948). Можно видеть, что в физических спектрах этих звуков отсутствуют компоненты, соответствующие указанным частотам, и основным свойством,

24 Сенсорные системы 369

определяющим восприятие их высоты, являются периодические изменения звуковой волны. Эти и подобные им явления породили представление о том, что в слуховой системе помимо спектрального анализа производится также временной анализ формы звуковых возбуждений.

Утверждение настоящего представления в психоакустике имеет свою историю. Впервые явление восприятия высоты периодических звуков при отсутствии в спектре основной частоты (первой гармоники) наблюдал в прошлом веке Зеебек (Seebeck, 1841, 1843 — цит. по: Schouten, 1940а). Однако долгое время это явление принято было объяснять возникновением субъективных тонов за счет нелинейных преобразований в слуховой системе (Fletcher, 1935). Действительно, если звук, состоящий из двух синусоидальных компонент, например Д и /₂, (/₂>/iX проходит через канал с нелинейной характеристикой, то на выходе такого канала в спектре сигнала появятся дополнительные комбинационные составляющие, среди которых будет и разностный тон с частотой /₂—f_v Нелинейность слуховой системы служит специальным предметом исследования, и этой теме посвящено много работ, из которых наиболее обстоятельны работы Цвиккера, Пломпа и Голстейна (Zwicker, 1955; Plomp, 1965; Goldstein, 1967). Присутствие комбинационного тона в спектре анализируемого слухом сигнала можно обнаружить по биениям, которые он образует с дополнительным внешним тоном близкой частоты, либо по наличию эффекта маскировки (внешний тон маскируется комбинационным) .

Однако практически оказывается, что при воздействии на слух многокомпонентного гармонического сигнала присутствие комбинационных тонов (наличие указанных эффектов) наблюдается только тогда, когда общий уровень стимулов превышает 50— 55 дб над абсолютным слуховым порогом. В то же время и при более низких уровнях высота этих сигналов совершенно явно воспринимается как соответствующая отсутствующей в спектре частоте, равной разности частот соседних составляющих, т. е. частоте колебаний огибающей (Licklider, 1954; Чистович, 1955; Plomp, 1965).

В сороковых годах настоящего столетия Схоутеном было высказано предположение о том, что восприятие высоты периодических звуков с отсутствующей первой гармоникой ³ может быть объяснено с помощью механизма измерения периода колебаний звуковой волны (Schouten, 1940а, 1940b, 1940с). Согласно гипотезе Схоутена, слуховую систему следует рассматривать не как чисто спектральный, а как спектрально-временной анализатор, в ко

³ Для обозначения таких звуков Схоутен ввел термин «резидуе» (residue), который в настоящее время часто применяется в литературе для обозначения всего явления.

379

тором наряду с разложением в ряд Фурье осуществляется анализ временной формы возбуждающих колебаний.

Если рассматривать, как это обычно принято, слуховой анализатор в виде набора фильтров, то при действии резидуального звука, состоящего из ряда высокочастотных гармоник, информация об этом звуке может быть представлена следующим образом. С одной стороны, можно получить распределение средних уровней выходных сигналов с каждого фильтра и это распределение будет отражать спектральный состав звука — амплитуду и частоту членов ряда Фурье. С другой стороны, можно анализировать мгновенные выходные сигналы каждого фильтра, которые изменяются во времени и форма волны которых отражает низкочастотные колебания огибающей резидуального звука. Согласно гипотезе Схо- утена предполагается, что характер распределения средних уровней фильтров обусловливает восприятие тембра звуков, а измерение периода колебаний мгновенных значений дает возможность оценить высоту. В последующие годы было проведено большое число работ, результаты которых дают серьезные основания считать гипотезу о временном анализе колебаний весьма правдоподобной (обзор подобных работ и их обсуждение можно найти в статьях: Ritsma, 1962; Schouten et al., 1962).

Нейрофизиологические наблюдения не противоречат этой гипотезе, так как они показывают, что в слуховом пути картина нервной импульсации оказывается синхронизированной с частотой возбуждающих колебаний (Гершуни, 1940а, 19406) и синхронизация может сохраняться вплоть до высоких частот порядка 3— 5 кгц (Wever, 1949) (см. раздел «Нейрофизиология слуховой системы»).

Сохранение в картине нервной импульсации информации о периодичности стимулов легло в основу предположения о существовании системы измерения периодов (интервалов между нервными импульсами), модель которой впервые была предложена Ликлайдером (Licklider, 1959). В модели Ликлайдера предполагается, что анализ импульсной периодичности осуществляется с помощью нейронных линий задержки в соединении со схемами совпадений, роль которых заключается в представлении периодического потока импульсов в виде функции автокорреляции.

Наряду с автокорреляционным принципом анализа периодичности в последнее время разрабатывается технически более разумная модель, использующая принцип фильтров совпадений (Schief, 1963; Jenik, Adolphs, 1965; Scheiber, 1965; Рохтла, 1966).

Как правило, во всех моделях предполагается, что нейронные структуры, ответственные за анализ периодичности, подключаются своими входами в определенных точках базилярной мембраны и основная обработка временндй информации для данного звука осуществляется на том пути, который связан с областью мембраны, имеющей максимальное смещение.

24*

371

Психоакустические исследования позволили выяснить целый ряд особенностей восприятия высоты сложных периодических звуков, существенных для характеристики системы частотновременного анализа.

При определении высоты периодических сигналов сложного спектра в большей части работ, как правило, применялась такая процедура опытов, при которой испытуемый настраивает частоту второго из двух предъявляемых звуков (во многих случаях чистого тона), добиваясь совпадения обоих звуков по высоте. Устанавливаемая таким образом частота принимается в качестве оценки высоты исследуемого стимула. Используя указанную процедуру для исследования восприятия амплитудно модулированных колебаний с широким спектром, в частности периодически прерываемого белого шума, было установлено, что высотный характер звуков сохраняется при частоте прерываний вплоть до 2000 гц и в этом диапазоне высота соответствует в среднем частоте прерываний (Goldstein, 1957; Harris, 1963; Pollack, 1969).

Подавляющее большинство экспериментов по восприятию высоты периодических звуков было осуществлено при использовании в качестве стимулов амплитудно модулированных (AM) синусоидальных колебаний и периодических импульсных последовательностей.

В первом случае сигнал представляет собой синусоидальные колебания некоторой частоты / (частота несущей), амплитуда огибающей которых изменяется также по синусоиде с другой частотой g (частота модуляции) и при этом g<Zf. Спектр такого звука состоит из трех компонентов с частотой / + g и f—g. Степень выраженности колебаний огибающей зависит от глубины модуляции (т), которая определяется отношением между амплитудами модулирующего и модулируемого колебаний и выражается в процентах.

В целом ряде работ было показано, что восприятие высоты амплитудно модулированных колебаний зависит от трех факторов: 1) от частоты несущей /; 2) от соотношения частот несущей и огибающей и 3) от глубины модуляции т (Small, 1955;

Чистович, 1956; Ritsma, 1962, и др.). Зависимость эта проявляется следующим образом. Существует определенная область для частоты несущей (примерно от 400 до 5000 гц), в которой только и возможно восприятие тонального характера и оценка высоты амплитудно модулированного звука.

Высота звуков для частот несущей в этой области оценивается тем лучше, чем больше глубина модуляции. При этом для каждой частоты несущей можно указать некоторую оптимальную частоту модуляции (или оптимальное отношение —и минимальную глу

372

бину модуляции (т), при которых тональный характер звука й его высота оцениваются наиболее точно.

На рис. 133 представлены данные, полученные в работе Ритсма (Ritsma, 1962), количественно иллюстрирующие описанные за- висимости. На графике указаны области значений / и g, ограничен- ные величиной тп, при которых восприятие высоты, определяемое периодическим повторением огибающей амплитуды, проявляется наиболее отчетливо.

Данные о зависимости восприятия высоты AM-сигналов от со-

отношения указанных руются с точки зре- ния частотно избира- тельных свойств слу- ховой системы. Для

Рис. 133. Частотные области тонального ре- зидуе для амплитудцо модулированных звуков при различных значениях глубины модуляции (данные одного испытуемого) (по: Ritsma, 1962).

параметров довольно хорошо интерпрети-

По оси абсцисс — частота несущей / (в гц); по оси ординат—частота модуляции g (в гц); ограничивающие кривые (сплошная, прерывистая, штрих-пунктирная и пунктирная линии) — глубина модуляции т (цифры у ограничивающих кривых в процентах); пря- мые линии — значения п = — (цифры у прямых). Прерывистая прямая — данные Гес- слера (Gassier, 1954).

того чтобы информация о периодичности низкочастотных колебаний AM-сигналов сохранилась на выходе спектрального анализатора, необходимо, чтобы боковые составляющие были разнесены по частоте не более чем на ширину полосы одного фильтра, центр которого приходится в область частоты несущей. Разнесение составляющих (увеличение g) при данной несущей частоте приводит к большему подавлению амплитуды боковых гармоник в соответствии с передаточной характеристикой фильтра, а следовательно, и к уменьшению глубины модуляции выходного сигнала. Для того чтобы восстановить необходимую для восприятия высоты четкость низкочастотного колебания, требуется повысить амплитуду боковых составляющих во входном сигнале, т. е. увеличить коэффициент модуляции т.

Существует ряд работ (Zwicker, 1952; Henning, 1966b), в которых удалось показать, что максимальное разнесение боковых составляющих AM-сигнала, при котором возможно резидуальное

373

восприятие его высоты при условий, что глубина модуляций соизмерима с порогом ощущения изменения интенсивности звуков, определяется шириной «критических полос» слуха. Иллюстрация этого факта содержится на рис. 133, где штриховой линией обозначена? зависимость ширины «критических полос» от частоты из работы Гесслера (Gassier, 1954), которые, как можно видеть, попадают в область наиболее оптимальных частот модуляции (для частот несущей примерно 400—3500 гц).

Количественный анализ оценок высоты амплитудно модулированных сигналов показал, что высота соответствует частоте мо- /

дуляции только в тех случаях, когда отношение -у есть целое число,

Рис. 134. Осциллограмма амплитудно модули- рованной синусоиды (по: de Boer, 1956).

/— частота несущей, g — частота модуляции, f_p — час- тота, соответствующая воспринимаемой высоте данного звука.

т. е. для гармонических сигналов. Высота же звуков, для которых это условие не выполняется, соответствует не частоте модуляции (g), а некоторой другой (§•-[-А/), где Д/ небольшая, но реально заметная величина.

Кроме того, AM-звуки неоднозначны по высоте: при их прослушивании ощущается, кроме основной, еще ряд частот, которые человек также способен оценить (Schouten et al., 1962). Неоднозначность высоты резидуальных звуков ощутимо проявляется также при восприятии квазичастотно модулированных сигналов (Ritsma, Engel, 1964), а также импульсных периодических последовательностей (Flanagan, Guttman, 1960а, 1960b; Guttman, Flanagan, 1964).

Объясняются эти явления тем, что в слуховой системе анализируется не сама огибающая, а учитывается тонкая временная структура звуковой волны, включающая колебания более высокой несущей частоты. Высота сигналов определяется периодами, равными расстоянию между положительными пиками высокочастотных колебаний, расположенными вблизи максимумов огибающей. Настоящее положение иллюстрируется рис. 134.

374

Исследованию характера отношений между спектральным и временным анализом в слуховой системе посвящена большая серия работ различных авторов, использующих в качестве стимулов периодические сигналы с широким спектром — последовательности коротких импульсов (Flanagan, Guttman, 1960а, 1960b; Guttman, Flanagan, 1964; Rosenberg, 1965; Ritsma, 1967). Указанные работы были предприняты с целью выяснить, в какой области спектра производится анализ временной формы волны огибающей.

В результате многочисленных экспериментов было установлено, что при оценке высоты резидуальных звуков различные составляющие участвуют в анализе временной картины с разными весами. Для звуков с частотой следования импульсов от 100 до 400 имп./сек. существует некоторая полоса частот, в области примерно от 400 до 2000 гц, которой отводится преобладающая роль, т. е. гармоники в которой имеют максимальный вес. Величина доминирующей полосы различна для звуков с разной частотой следования импульсов (с разной частотой основного тона), ее минимальная ширина соответствует области, в которой располагаются 3 или даже 2 гармоники, а именно 3-я, 4-я и 5-я. Конкретные значения могут несколько варьировать для разных людей (Ritsma, 1967).

При этом чувствительность к восприятию высоты в доминирующей полосе имеет пороговый характер. Достаточно, чтобы уровень интенсивности гармоник с максимальным весом превышал на 7— 10 дб абсолютный порог независимо от уровня интенсивности других составляющих.

При маскировке или подавлении составляющих в доминирующей области оценка высоты основывается на той информации о периодичности, которая содержится в соседних областях.

НАКОПЛЕНИЕ ИНФОРМАЦИИ ВО ВРЕМЕНИ

Установлено, что слуховая система способна накапливать информацию о сигнале во времени. Это вытекает из результатов исследований, в которых была показана зависимость порогов обнаружения звуковых сигналов от их длительности, возрастание громкости звука с увеличением его длительности, уменьшение величины дифференциальных порогов по частоте и интенсивности при увеличении длительности сигналов.

Большое число работ посвящено исследованию зависимости между интенсивностью и длительностью сигнала, описывающей условия порога обнаружения сигнала (Hughes, 1946; Garner, 1947; Feldtkeller, Oetinger, 1956; Zwislocki, 1960; Scholl, 1962a, 1962b). Экспериментальные данные, полученные в таких исследованиях, обычно изображаются в виде графиков, где по оси абсцисс нанесена длительность звука в логарифмическом мас-

375

штабе

а по оси ординат — уровень интенсивности в де-

цибелах (101g .

Экспериментальная зависимость в первом приближении ап-

проксимируется отрезками двух прямых, как это показано на рис. 135, А. При

fC^ioig^c + ioig-^-, (1)

р2 «>t_Kp101g-^-=C. ₍₂)

Так как £_кр, р₀ и С являются константами, уравнение (1)

может быть представлено в виде

101g р2+ 101g t = A ИЛИ рЧ = const.

Это означает, что в пределах критической длительности порог определяется энергией сигнала.

Аналогичная зависимость порогов обнаружения звуковых сигналов от их длительности установлена и при измерении порогов слышимости тональных посылок на фоне маскирующего шума (Feldtkeller, Oetinger, 1956; Green et al., 1957; Plomp, Bouman, 1959; Scholl, 1962b; Zwicker, Wright, 1963).

Величина критической длительности на пороговом уровне интенсивности сигнала составляет по разным данным 175— 225 мсек. (Garner, 1947; Zwislocki, 1960; Zwicker, Wright, 1963). В некоторых работах установлена зависимость величины критической длительности от частоты сигнала (см.: Watson, Gengel, 1969).

Приведенная выше аппроксимация зависимости между интенсивностью и длительностью двумя отрезками прямых является достаточно грубой. Лучшая аппроксимация достигается при допущении, что слуховая система ведет себя, как интегратор акустической энергии с постоянной времени т порядка 200 мсек. (Zwislocki, 1960). Зависимость между интенсивностью и длительностью сигнала, соответствующая условию постоянства наибольшего мгновенного значения сигнала на выходе интегратора, описывается уравнением: 101g—= С + 10]g(——, где р — пороговое звуковое давление синусоидального сигнала длительностью t, т—постоянная времени.

На рис. 135, Б представлены пороги слышимости синусоидальных посылок частотой 1000 гц как функция их длительности, сплошная линия — результат вычислений Цвизлоцкого, точки — обозначают экспериментальные данные, полученные в трех работах (Garner 1947; Feldtkeller, Oetinger, 1956; Zwislocki, Pir- rodda, 1952).

376

Из рис. 135, Б видно хорошее совпадение экспериментальных данных и теоретической кривой. Для сигналов короче 10 мсек, реальный сдвиг порогов оказывается больше вычисленного. По данным большинства исследователей, величина порога сигналов короче 10 мсек, снижается на 4.5 дб при удвоении длительности тональной посылки.

Рис. 135. Зависимость порога слышимости от длительности тональных посылок частотой 1000 гц.

1—3 — результаты измерений, принадлежащие разным авторам (I — Garner, 1947; 2 — Zwislocki, Pirrodda, 1952; з — Feldkeller, Oetinger, 1956). Ha А: аппроксимация отрезками двух прямых; на Б — кривая, результат вычислений (Zwislocki, 1960). По оси абсцисс — длительность сигнала в мсек.; по оси ординат — звуковое давление в дб от условного уровня. За нулевой уровень отсчета дб принято пороговое звуковое давление сигнала длительностью 1000 мсек.

Объяснения причины отклонения экспериментальных данных от теоретической кривой для сигналов короче 10 мсек, рассмотрены в работах Гарнера и Шоля (Garner, 1947; Scholl, 1962а, 1962b).

В определенном временном диапазоне субъективная громкость сигнала также является функцией длительности. В ряде работ было показано, что громкость коротких звуков растет с увеличением длительности таким образом, что уровень громкости прямо пропорционален логарифму длительности. Уровень громкости увеличивается в среднем на 3 дб при удвоении длительности сигнала. Указанная закономерность возрастания громкости корот-

377

ких звуков от их длительности сохраняется для звуков узко- полосного спектра практически на всех уровнях интенсивности (Bekesy, 1929; Munson, 1947; Miller, 1948; Port, 1963; Zwislocki, 1965, 1969).

Однако критическое время суммации громкости оказалось

значительно меньшим, чем при суммации на пороговом уровне. Уже Миллер (Miller, 1948) установил, что критическое время суммации для посылок белого шума на уровне 60 дб над порогом слышимости составляет 65 мсек. Близкое значение критического времени суммации 70 мсек, было получено, как видно из рис. 136 и в работе Порта (Port, 1963). Установленное им критическое

время суммации не за- висело от уровня зву- кового давления и спек- тра импульсов.

Рис. 136. Кривая равной громкости узкополосного шума (шириной полосы в терцию, средн, частотой 2.5 кгц), как функция от его длительности (по: Port, 1963).

Кружки — результаты измерений методом пределов, точки — методом установки. По оси абсцисс — длительность сигнала в мсек.; по оси ординат — звуковое давление в дб от условного уровня. За нулевой уровень принято звуковое давление узкополосного шума длительностью 1.2 сек., интенсивностью 60 дб над порогом слышимости.

Вначале для объяснения зависимости величины порогов обнаружения от длительности сигналов было предложено два объяснения: вероятностное и детермированное.

Вероятностная гипотеза основывается на представлениях о том, что возможность обнаружения сигнала возрастает с увеличением числа независимых измерений, что прямо пропорционально длительности сигнала (Green et al., 1957; Sheeley, Bilder, 1964).

Детермированная гипотеза основывалась на существовании в нервной системе истинной временной суммации.

Если некоторые экспериментальные данные, полученные при установлении зависимости величины порогов обнаружения от длительности сигналов, достаточно хорошо объяснялись как вероятностной гипотезой, так и гипотезой, основанной на истинной временной суммации, то возрастание громкости при увеличении длительности совершенно не могло быть объяснено вероятностными моделями.

Как было показано выше, психоакустические характеристики зависимости обнаружения сигналов как функции от их длительности и измерения громкости звука как функции длительности

378

соответствуют таковым для интегратора акустической энергии. При этом постоянная времени интегратора должна быть порядка 200 мсек, для пороговых уровней и порядка 70—100 мсек, для средних и высоких уровней.

Такое поведение слуховой системы могло бы быть объяснимо, если бы интегрирование осуществлялось до преобразования звуковых колебаний в нервную импульсацию. Однако это пред- положение совершенно несовместимо с существующими электрофизиологическими и психоакустическими фактами.

Данные электрофизиологии слухового нерва говорят о том, что преобразование звуковых колебаний в нервную импульсацию является практически безынерционным процессом, что дает возможность сохранения в картине нервной импульсации информации о тонкой временной структуре сигнала.

Данные психоакустики свидетельствуют о том, что эта информация обрабатывается и используется при определении локализации источника звука в пространстве, определении высоты сложного сигнала и т. д. Из этих данных с необходимостью вытекает, что процесс интегрирования должен осуществляться после преобразования механических колебаний в нервную импульсацию, т. е. что интегратор должен быть расположен в центральных отделах слуховой системы.

Для того чтобы сигналы на выходе этого интегратора были пропорциональны энергии акустического сигнала, на первый взгляд, кажется необходимым, чтобы значения входного сигнала интегратора были связаны линейной зависимостью с интенсивностью (квадратом амплитуды) звуковых колебаний. Вместе с тем данные психоакустических исследований говорят о том, что близкая к линейной зависимость между громкостью и интенсивностью звука наблюдается только в области околопороговых уровней. При средних и больших уровнях громкость примерно пропорциональна корню четвертой степени из квадрата звукового давления g—k (p²)^Q
2b (см. раздел «Громкость» настоящей главы).

О существенно нелинейной зависимости между величиной импульсации и интенсивностью звука говорят данные электрофизиологии.

Легко заметить, что если бы имело место интегрирование громкости звука, то удвоение длительности посылки должно было бы привести к удвоению громкости, что соответствовало бы увеличению уровня громкости на 12 дб. Это резко расходится с экспериментальными данными, приведенными выше (удвоение длительности соответствует возрастанию уровня громкости на 3 дб).

Анализ этих противоречий был сделан Цвизлоцким (Zwis- locki, 1965, 1969), который показал, что противоречия могут быть сняты, если дополнительно учесть процесс адаптации, т. е.

379

принять, что мгновенная громкость сигнала не сохраняется неизменной на протяжении его звучания, а убывает от начала сигнала к его концу.

Предложенная Цвизлоцким теория базируется на трех основных допущениях: 1) наличии интегратора с постоянной времени 200 мсек., расположенного в центральных отделах слуховой системы; 2) наличии нелинейного преобразования амплитуды сигнала, предшествующего временной суммации, со статическими характеристиками, соответствующими функции громкости; 3) затухании во времени процесса на выходе нелинейного преобраз зоват е ля. Рассматривая мгновенную громкость как мгновенную плотность импульсации на выходе ансамбля нейронов, Цвизлоцкий предположил наличие двух эффектов, обеспечивающих падение плотности импульсации с течением времени. Один из них соответствует собственно процессу адаптации и выражается в постепенном уменьшении частоты импульсации в каждом отдельном нейроне. Второй эффект отражает изменение относительного числа одновременно разряжающихся нейронов на протяжении последовательных периодов колебаний.

В настоящее время можно говорить лишь о том, что предложенная Цвизлоцким модель не противоречит физиологическим данным, качественно согласуется с психоакустическими данными и, что весьма существенно, позволяет обойтись без предположения о том, что интегратор изменяет свои свойства (постоянную времени) с изменением уровня сигнала.

Более детальная оценка модели (для случая суммации громкости) и удачности выбранных автором значений параметров (их довольно много) затруднена тем, что сами исходные экспериментальные данные обнаруживают значительный разброс.

Другим проявлением способности слуха накапливать информацию о сигнале является увеличение точности измерения высоты и громкости звуков с увеличением их длительности.

При очень малых длительностях синусоидальные посылки воспринимаются как щелчок, имеющий тональную окраску (т. е. как щелчок того или иного тембра).

Ряд авторов измерили порог тональности, т. е. наименьшую длительность отрезка синусоиды, при которой сохраняется восприятие тональности (Biirck et al., 1935а; Turk, 1940; Doughty, Garner, 1947). Было установлено, что для частот синусоидальных посылок в диапазоне 500—8000 гц при уровне звукового давления 100—110 дб (над 0.0002 мкб) порог тональности составляет 4— 5 мсек. Для частоты ниже 500 гц он зависит от числа периодов. Для возникновения ощущения тональности достаточно 2—3 периодов. Однако и при больших длительностях, при которых полностью сохраняется ощущение тональности, дифференциальные пороги по частоте зависят от длительности сигналов.

380

Зависимость величины дифференциального порога от длительности сигнала при частоте 1000 гц представлена на рис. 137. На рисунке приведены результаты измерений, проведенных в четырех исследованиях (Bekesy, 1929; Oetinger, 1959; Лян Чжи-ань и Чистович, 1960; Cardozo, 1962). Видно, что во всех измерениях при увеличении длительности сигнала вплоть до 150—200 мсек, величина дифференциального порога уменьшается.⁴ Однако абсолютные величины дифференциальных порогов и вид кривых

Рис. 137. Зависимость величины дифференциального порога по ча- стоте от длительности тональных посылок частотой 1000 гц (по: Cardozo, 1962).

1—4 — результаты измерений, принадлежащие разным авторам (I — Oetinger, 1959; 2 — Лян Чжи-ань и Чистович, 1960; 3 — Bekesy, 1929; 4 — Cardozo, 1962). По оси абсцисс — длительность сигнала в мсек.; по оси ординат — величина дифференциального порога в гц.

Рис. 138. Зависимость величины дифференциального порога по интенсивности от длительности сигнала (по: Garner, Miller, 1944).

Кружки и точки — результаты измерений двух разных испытуемых. По оси абсцисс — длительность сигнала в мсек.; по оси ординат — относительный дифференциальный по-

/Д1\ тт

рог (-у) ^в вольтах. Параметр кривых — уровень интенсивности в дб от порога слышимости. Измерения проведены на частотах 500 и 1000 гц.

у различных авторов различаются, что, по-видимому, связано с существенными отличиями в условиях проведения измерений.

Различение интенсивности в меньшей мере зависит от длительности сигналов, чем различение частоты.

Зависимость величины дифференциального порога по интенсивности от длительности стимулов (по данным Garner, Miller, 1944) представлена на рис. 138. Из рисунка видно, что эта зависимость отчетливо выражена при низких уровнях интенсивности (40 дб над порогом слышимости). При большем уровне интенсивности (70 дб над порогом) дифференциальные пороги по интенсивности в меньшей степени зависят от длительности сравниваемых сигналов. Аналогичное явление обнаружено и в работе

⁴ Аналогичная зависимость величины дифференциальных порогов по частоте от длительности сигналов получена и в работе Секей (Sekey, 1965).

381

Хеннинга и Псотка (Henning, Psotka, 1969). Авторы установили, что величина дифференциальных порогов по интенсивности, измеренная в условиях маскировки, не зависит от длительности сигналов в диапазоне от 20 до 200 мсек, при условии, что сохраняется постоянным отношение энергии сигнала к спектральной плотности мощности маскирующего шума.

ВОСПРИЯТИЕ ЗВУКОВОЙ ПОСЛЕДОВАТЕЛЬНОСТИ

Данные относительно способности слуха воспринимать быстрые изменения сигнала во времени были изложены в разделе, посвященном восприятию высоты сложных сигналов. При рассмотрении экспериментов с амплитудномодулированными тонами и шумами было показано, что разрешающая способность слуха по времени довольно высока. Человек может воспринимать изменения формы звуковой волны, происходящие с частотой более 1000 гц. Однако эти эксперименты еще не характеризуют способность слуха воспринимать изменения сигнала во времени как таковые. Как было показано, сигналы, модулированные с частотой порядка сотен герц, воспринимаются как непрерывные, не меняющиеся во времени звуки. Субъективным коррелятом частоты модуляции оказывается высота. Вместе с тем при описании слуха необходимо располагать данными относительно способности человека воспринимать временную структуру в виде временной же последовательности событий.

Способность слуха воспроизводить изменения звука как таковые могла бы характеризовать та предельная частота модуляции сигнала, при которой человек все еще продолжает воспринимать сигнал как изменяющийся во времени, либо та минимальная частота, при которой сигнал приобретает признак высоты. К сожалению такой критерий оказывается довольно неопределенным и позволяет получить лишь ориентировочные данные. Так, например, по данным Уивера (Wever, 1929), ощущение, возникающее при одновременном предъявлении пары тонов разной частоты, изменяется по мере увеличения частотного расстояния между ними следующим образом. При разнице частот менее 6—7 гц человек способен прослеживать изменения громкости суммарного сигнала (биения). При разнице в частотах выше этой величины, но менее 25 гц звук приобретает пульсирующий характер; при больших различиях в частоте отдельные пульсации уже не различаются, и сигнал начинает восприниматься как звук г. При амплитудной модуляции сложных звуков, имеющих спектральные характеристики гласного, наиболее отчетливый звук г возникает при частоте модуляции 40 гц (Christov, 1966). В случае сигнала, образованного путем повторного воспроизведения одного и того же отрезка случайного процесса (шума), ощущение высоты начинает

382

появляться при частоте повторения отрезка 19 раз в секунду и выше (Guttman, Julesz, 1963).

Таким образом, судя по этим данным, по мере увеличения частоты модуляции критерий оценки сигнала последовательно меняется. Первое изменение критерия, видимо, происходит при частоте около 5—7 гц, а второе •— при частоте 19—25 гц или несколько выше. Об изменении критерия оценки при частоте около 5—7 гц позволяют также думать результаты измерения порогов амплитудной модуляции шума. По данным ряда авторов,

Л| 1 1 1 1 1 1 -J 1 1——

О 20 50 100 200 500 1000 2000 10000ги,

Рис. 139. Зависимость длительно- сти временного интервала между началами тонов, достаточного для различения порядка их следова- ния, (At) от частоты отставлен- ного тона (по: В urc k et al., 1935b).

По оси ординат — At в мсек.; по оси абсцисс — частота отставленного тона в гц. Частота первого тона 500 гц.

Рис. 140. Изменение величины обратной маскировки во времени.

По оси абсцисс — интервал между началами сигналов в мсек.; по оси ординат — уровень маскировки в дб. Сплошные линии — маски- ровка тона узкополосным шумом при двух разных уровнях интенсивности маскера (по: Wright, 1964), прерывистая линия — маски- ровка тона тоном (по: Самойлова, 1956). Параметр кривых — уровень маскера в дб.

именно при этой частоте пороги обнаружения амплитудной модуляции начинают возрастать (Тумаркина, Дубровский, 1966), а кривая, характеризуюшая дифференциальную чувствительность к частоте прерывания шума, изменяет наклон (Mowbray et al., 1956).

Более эффективным методом оценки способности воспринимать изменения сигнала во времени являются эксперименты по восприятию последовательности двух разных сигналов. В такого рода экспериментах применяются либо короткие сигналы, непосредственно следующие друг за другом, либо более длинные сигналы, начало одного из которых запаздывает относительно начала второго, в то время как прекращение обоих происходит одновременно. Слушатель должен определить, какой из двух сигналов, составляющих пару, поступает первым.

Систематические исследования в этом направлении были проведены Хиршем (Hirsh, 1959). Им были исследованы стимулы,

383

составленные из посылок двух тонов разной частоты, из посылок тона и шума, из посылок тона со щелчком и посылок шума со щелчком. Было показано, что для правильного распознавания порядка следования таких сигналов с вероятностью 0.75 необходимо, чтобы интервал между их началами превышал 15—20 мсек. Для всех исследованных стимулов длительность этого интервала оказалась одной и той же. Однако характер зависимости между количеством правильных суждений и длительностью, интервала между сигналами не был исследован в цитируемой работе достаточно подробно. Более ранние данные (Burck et al., 1935b) свидетельствуют о том, что длительность интервала между началами тональных сигналов, необходимая для правильной идентификации порядка их следования, зависит от абсолютного значения их частот и от частотного расстояния между ними. На рис. 139 длительность этого интервала представлена как функция частоты одного из тонов, когда частота другого оставалась постоянной и равной 500 гц. Можно видеть, что на краях частотного диапазона длительность критического интервала возрастает. Увеличение длительности интервала наблюдается также при малых различиях между тонами по частоте. При оптимальном соотношении частот длительность интервала между началами тонов, достаточная для определения порядка их следования, составляет величину порядка 10 мсек.

Другая группа данных относительно различения последовательности сигналов получена в экспериментах по обратной маскировке и остаточной маскировке.

Обратная или предшествующая маскировка проявляется в повышении порога восприятия сигнала под влиянием следующего за ним более громкого сигнала. Впервые этот эффект был обнаружен Миллером (Miller, 1947). Подробное исследование явления проведено Самойловой (1956). Обычным способом описания обратной маскировки является график, показывающий, насколько повышается порог обнаружения первого сигнала в зависимости от длительности временного интервала до начала второго сигнала (маскера). За порог принимается то значение интенсивности маскируемого звука, при котором слушатель начинает отличать стимул, состоящий из двух сигналов (маскируемого и маскера) от одного маскера. Параметром полученных таким образом кривых является либо уровень маскера, либо частота одного из сигналов.

На рис. 140 приведены такие кривые, полученные двумя разными авторами и в разных экспериментальных ситуациях. Сплошными линиями обозначены кривые, взятые из работы Райта (Wright, 1964). Маскером в данном случае являлся узкополосный шум длительностью 600 мсек, с центральной частотой 1000 гц, а маскируемым сигналом — посылка тона с частотой 1000 гц. Тональный сигнал во всех случаях прекращался за 100 мсек.

384

до конца маскера, а его длительность варьировала от 500 до 1000 мсек. Таким образом, интервал между началами сигналов изменялся в|пределах от 0 до 500 мсек. Так как порог обнаружения сигнала зависит от его длительности, при вычислении величины маскировки автором были учтены те изменения порога, которые должны быть следствием изменения длительности тона. Приведенные на графике значения были получены после внесения соответствующей поправки.

Кривая, обозначенная на рис. 140 прерывистой линией, построена по данным Самойловой (1956). В данном случае маскером служил тон 1000 гц длительностью 300 мсек., а маскируемым сигналом — посылка того же тона длительностью 10 мсек. В оригинальной работе уровень маскировки представлен как функция от длительности интервала между сигналами, на нашем рисунке — как функция интервала между началами сигналов. Можно видеть, что результаты обоих экспериментов удовлетворительно совпадают несмотря на различия в сигналах и экспериментальной процедуре. На кривых Райта четко выделяются три фазы макси- ровки. При длительности интервала между началами сигналов менее 25 мсек, величина маскировки практически не меняется и приблизительно соответствует величине одновременной макси- ровки. Следует думать, что при данных длительностях интервала порядок предъявления сигналов не определяется, и присутствие маскируемого звука определяется так же, как и при одновременном предъявлении сигналов. При интервалах от 25 до 50 мсек, маскировка резко падает, но зависимость величины маскировки от уровня маскера все еще сохраняется. При больших длительностях указанного интервала эта зависимость исчезает. По данным других авторов, длительность интервала между сигналами, при которой обратная маскировка перестает обнаруживаться, зависит от интенсивности маскирующего стимула (Гольдбурт, 1964). При малых интенсивностях маскера длительность этого интервала не превышает 20 мсек., а при больших интенсивностях достигает 500 мсек, и даже более. Гораздо более быстрый спад величины обратной маскировки наблюдался при маскировке посылки тона короткой посылкой шума (Pickett, 1959; Elliott, 1962). В этом случае маскировка становится незначительной уже за 15— 20 мсек, до начала маскера. Но и в этих экспериментах небольшое повышение порога можно было обнаружить значительно раньше.

Таким образом, по данным первой группы экспериментов, человек начинает воспринимать временную последовательность сигналов только тогда, когда интервал между ними превышает 10—20 мсек. Эксперименты с обратной маскировкой показывают, что обнаружение сигнала в последовательности заметно ухудшается, если интервал между сигналами приближается к 150— 200 мсек. Поскольку временная структура воздействия воспроизводится на уровне первого нейрона достаточно подробно, влия

25 Сенсорные системы 385

ние одного сигнала на другой на протяжении длительных периодов времени необходимо отнести за счет особенностей обработки информации на более высоких уровнях* К сожалению, в настоящее время еще не существует отчетливых представлений о характере этой обработки. Можно, однако, указать ряд процессов, которые несомненно следует учитывать при рассмотрении изложенных экспериментальных фактов.

Прежде всего способность воспринимать последовательность сигналов должна лимитироваться следующим обстоятельством. Как известно, по мере укорочения сигнала точность его измерения слуховой системой понижается. Существование такой зависимости было показано в целом ряде психоакустических экспериментов. При распознавании посылок тона оказывается необходимым различать два критических значения их длительности — ту минимальную длительность, при которой обнаруживается тональный характер сигнала, и ту максимальную длительность, при которой еще наблюдается увеличение точности определения высоты. Первое значение длительности, по данным ряда авторов, составляет величину около 10 мсек. (Burck etal., 1935а; Doughty, Garner, 1947), второе — величину около 150—200 мсек. (Лян Чжи-ань, Чистович, 1960). Таким образом, существует минимальное время наблюдения сигнала, необходимое для выявления и слухового измерения его свойств. Ясно, что для определения порядка следования сигналов необходимо, чтобы результаты измерения отдельных участков звуковой последовательности оказались по какому-то признаку разными. Если длительность соответствующего сегмента окажется меньше критической, порядок следования не будет распознан.

Однако любой механизм накопления информации во времени Tie объясняет зависимость уровня обратной маскировки от длительности интервала между сигналами, если только длительность маскируемого сигнала при всех значениях этого интервала остается постоянной. Таким образом, эффект обратной маскировки требует особого объяснения. Наиболее правдоподобными кажутся два механизма. Во-первых, по мнению ряда авторов, явление обратной маскировки можно объяснить, если допустить, что нервная система передает слабые звуковые сигналы с меньшей скоростью, чем сильные (Elliott, 1962; Wright, 1964). В этом случае слабый и сильный сигналы, предъявленные последовательно, могут оказаться на каком-то уровне слуховой системы одновременными. Тем самым обратная маскировка может быть сведена к одновременной.

С другой стороны, ряд временных эффектов при восприятии звуковых сигналов должен быть связан с процедурой их дальнейшей классификации. Как известно, объем оперативной памяти слуховой системы довольно ограничен. В результате этого при распознавании последовательности должна участвовать процедура

386

перекодирования отдельных сегментов сигнала в некоторое более экономное их описание, которое может сохраняться в нервной системе дольше. В определенном смысле процедуру такого перекодирования можно рассматривать как процесс принятия решения о сигнале. В том случае, когда второй сегмент сигнала поступает раньше, чем принято решение о первом, первый сегмент может подвергнуться забыванию. Подобный эффект проявляется особенно четко, когда применяемая испытуемым классификация сигналов не является для него привычной и процесс принятия решения требует много времени (Чистович и др., 1961).

На зависимость обратной маскировки^от "процессов, "связанных с принятием отдельных решений о сигнале,указывают экспе

рименты по маскировке щелчка щелчком (Чисто- вич, Иванова, 1959). По данным этих авторов, об- ратная маскировка щелчка

Рис. 141. Маскировка щелчка щелчком при разных крите- риях обнаружения сигнала (Чистович, Иванова, 1959).

По оси абсцисс — время в мсек., отсчитанное от момента предъявления маскера; по оси ординат — уровень маскировки в дб." Сплошная кривая — сигнал обнаруживается по изменению звучания маскера; прерывистая кривая — сигнал обнаруживается как само’ стоятельное явление.

щелчком практически отсутствует, если слушатель отличает парные щелчки от одиночных по тембральной окраске сигнала (появление хриплости и т. п.). Если же слушатель определяет наличие первого щелчка как такового, не принимая во внимание изменения в характере звучания маскера, кривая предшествующей маскировки оказывается приблизительно такой же, как и в случае маскировки тона тоном (рис. 141). По-видимому, при длительных интервалах между " сигналами обратная маскировка возникает постольку, поскольку о каждом из сигналов в данном случае должны быть приняты независимые решения.

Еще одним . гипотетическим механизмом, ограничивающим разрешающую способность слуха по времени, является механизм так называемого'остаточного ощущения/Предполагается, что ощущение, вызванное сигналом, исчезает после его прекращения не сразу, а затухает постепенно. При предъявлении последовательности из двух сигналов второй из них может быть обнаружен лишь в том случае, если вызванное им ощущение превысит остаточное. Таким образом, мерой величины остаточного ощущения в некоторый момент времени после предъявления звука может быть та минимальная интенсивность второго сигнала, при которой

25*

387

его присутствие начинает обнаруживаться. Такого рода соображения лежат в основе экспериментов по остаточной маскировке.

Остаточная маскировка проявляется во временном понижении слуховой чувствительности вслед за предъявлением звукового сигнала. Изменение чувствительности можно оценить количественно путем измерения порога восприятия второго, пробного звука, предъявленного вслед за первым. Величина, на которую повышается порог обнаружения пробного сигнала по сравнению с его порогом при изолированном предъявлении, принимается за уровень маскировки. Измеренная таким образом остаточная

Рис. 142. Изменение величины остаточной маскировки во вре- мени по данным разных авторов.

По оси абсцисс — время в мсек., отсчитанное от конца маскера (на Б в логарифмическом масштабе); по оси ординат — уровень остаточной маскировки в дб. А — маскировка тона 200 гц тоном 2000 гц (Rawnsley, Harris, 1952). Б — маскировка шума шумом при трех разных уровнях интенсивности маскера (Plomp, 1954).

маскировка оказывается максимальной сразу после прекращения сигнала и постепенно спадает по мере увеличения расстояния между сигналами.

Кроме такого метода определения величины остаточной маскировки, некоторые авторы применяют и другой. В качестве маскируемого сигнала берется более или менее длинная посылка звука, а маскером является наложенный на него прерывистый шум. Порог обнаружения сигнала измеряется для целого ряда частот прерывания шума вплоть до тех минимальных, при которых он оказывается равным порогу восприятия данного сигнала в тишине. Предполагается, что в данном случае порог обнаружения сигнала характеризует тот минимальный уровень остаточной маскировки, который достигается к концу каждой паузы между шумовыми посылками. Таким образом, откладывая величину порога как функцию длительности интервала между шумовыми посылками, можно получить кривую, характеризующую изменение остаточной маскировки во времени. Следует, однако, отметить, что этот экспериментальный прием не учитывает возможного влияния предшествующей маскировки.

388

Многочисленные исследования были направлены на выяснение того, каким образом происходит изменение остаточной маскировки во времени. Единодушного мнения на этот счет до сих пор не существует. По данным ряда авторов, остаточная маскировка, выраженная в децибелах, уменьшается на одну и ту же величину за каждую последующую единицу времени (Steudel, 1933; Luscher, Zwislocki, 1'947, 1949; Rawnsley, Harris, 1952). При средних уровнях интенсивности маскера скорость спада остаточной маскировки варьировала в разных экспериментах в пределах от 0.13 до 0.25 дб на 1 мсек. Полное исчезновение маскировки при уровнях маскера 50—80 дб наблюдалось этими авторами приблизительно через 250 мсек, после прекращения звука. Такое поведение остаточной маскировки имеет место преимущественно при маскировке тона тоном и только в том случае, когда интенсивность маскера превышает 50 дб над порогом.

Совершенно иной характер зависимости остаточной маскировки от времени наблюдался в экспериментах с прерывистым маскером. Как правило, зависимость в данном случае оказывалась близкой к линейной в логарифмическом масштабе времени (Stein, 1960; Burgtorf, 1961). Такая же зависимость была получена Пломпом (Plomp, 1964а) при обработке данных Миллера (Miller, 1948) и при обработке данных собственного эксперимента по восприятию паузы между тональными посылками. Графики рис. 142 позволяют судить о том, насколько различной оказывается зависимость величины остаточной маскировки от времени по данным разных экспериментов. По оси ординат на этих графиках отложен уровень маскировки, а по оси абсцисс — время. На рис. 142, А время отложено в линейном масштабе, на рис. 142, Б — в логарифмическом. Тем не менее зависимость в обоих случаях аппроксимируется прямыми.

Разногласия относительно характера зависимости остаточной маскировки от времени можно отнести за счет ряда факторов. Прежде всего при определении величины остаточной маскировки разные авторы применяют совершенно различные процедуры. Кроме того, применяемые в разных экспериментах сигналы отличаются по спектральному составу, длительности и т. п. Тем не менее длительность существования остаточной маскировки оценивается многими авторами приблизительно одной и той же величиной. Как правило, через 250—300 мсек, после конца звука маскировка полностью исчезает.

Как уже было сказано, при объяснении явления остаточной маскировки чаще всего прибегают к гипотезе остаточного ощущения. Наряду с этим некоторые авторы предполагают, что в основе остаточной маскировки лежит процесс адаптации. В разделе, посвященном слуховой адаптации, этот вопрос будет рассмотрен более подробно.

389

Суммируя изложенные данные, необходимо сделать следующие выводы. Оценки разрешающей способности слуха во времени,, полученные в экспериментах разного типа, сильно отличаются друг от друга и, видимо, характеризуют процессы обработки сигнала на разных уровнях слуховой системы. Как показывают- данные по восприятию амплитудной модуляции, слуховая система способна воспринимать изменения звуковой волны с частотой более 1000 гц, если даже спектральные признаки таких изменений отсутствуют. Данные нейрофизиологии также говорят о том,, что временная структура сигнала на уровне первого нейрона может быть воспроизведена достаточно подробно.

В то же время эксперименты с восприятием последовательности сигналов указывают на участие довольно инерционных процессов. О том же свидетельствуют явления временной суммации громкости и ряд других эффектов. Таким образом, разрешающая способность слуха по времени не может быть охарактеризована какой-либо одной величиной. Моделируя временные характеристики слуха в целом, следует располагать данными о целой последовательности осуществляемых слухом измерительных и вычислительных процедур. Для этого прежде всего необходимы более детальные сведения о процессах накопления информации во времени и временных характеристиках процедуры принятия решений.

СЛУХОВАЯ АДАПТАЦИЯ

Под слуховой адаптацией понимается повышение слуховых порогов^(понижение чувствительности), возникающее в результате предшествующей звуковой стимуляции.⁵

Слуховая адаптация характеризуется величиной сдвига порогов слышимости и временем восстановления первоначальной, до стимуляции (пороговой) чувствительности.⁶

Хотя изменения порога наблюдаются после воздействия любого надпорогового звукового сигнала (больше 10—20 дб), однако сигналы малой длительности (100—500 мсек.) и умеренной интенсивности (до 80—90 дб) вызывают лишь кратковременное повышение порогов, исчезающее через 200—250 мсек. Слуховая адаптация сравнительно короткой продолжительности исследовалась рядом^гавторов (de Маге, 1939; Harris et al., 1951). Эти кратковременные изменения часто называются остаточной маскировкой (см. раздел «Восприятие звуковой последовательности»). Допускается, что механизмы этих изменений отличны от механизмов, имеющих место при большой длительности и интенсивности

⁵ Ранние работы по слуховой адаптации могут быть найдены в обзорах Ржевкина (1936) и Гринберга (1937).

⁶ В клинической аудиологии время восстановления порогов слышимости обозначается как «время обратной адаптации» (Langenheck_t 1952; Хилов и Преображенский, 1965),

390

воздействующего сигнала. В настоящем разделе речь будет идти о выраженных изменениях порога слышимости, сохраняющихся на протяжении нескольких секунд и более.

Характеристика процесса восстановления порогов слышимости. Можно констатировать, что чем больше времени проходит

после прекращения стимуляции, ние чувствительности. Сдвиг порога, достигающий своего максимума сейчас же после прекращения стимуляции, по- степенно стремится к нулю.

На рис. 143 приведены ре- зультаты ряда работ, в которых адаптация вызывалась длитель- ным воздействием звуков значи- тельной интенсивности. Рис. 143 показывает, что если интервал

Рис. 143. Восстановление пороговой чувствительности после звуковой стимуляции.

10 100 ЮООмин.

По оси абсцисс — время восстановления в мин.; по оси ординат — сдвиг порога в дб Приведенные на рисунке прямые соответствуют данным разных авторов (I — Davis et al. > 1950, стимуляция широкополосным шумом интенсивностью 130 дб, экспозиция 8 мин., тестирование тоном 2000 гц; 2 — Ward et al., 1959, стимуляция широкополосным шумом интенсивностью 106 дб, 12 мин., тестирование тоном 4000 гц; 3 — Ward et al., 1959, стимуляция широкополосным шумом интенсивностью 90 дб, 117 мин., тестирование тоном 4000 гц; 4 — Князева, 1946, стимуляция тоном 2000 гц, 100 дб, 10 мин., тестирование тоном 2000 гц). Точками обозначены величины сдвига пороговой чувствительности, измеренные через разные интервалы после прекращения стимуляции.

времени между прекращением стимуляции и началом тестирующего сигнала изобразить в логарифмическом масштабе, кривая восстановления порога удовлетворительно аппроксимируется линейной зависимостью. Можно видеть, что наклон прямых оказывается одним и тем же при разных абсолютных значениях начального сдвига порога. Это дает возможность вычислить время, необходимое для полного восстановления, на основании измерения сдвига порога при одном отставлении сигнала от момента прекращения воздействия.

Воздействуя тоном 1000 гц интенсивностью 70 дб выше порога слышимости, Гершуни и Волохов (Гершуни и Волохов, 1935) обнаружили дополнительную особенность процесса восстановления. Авторы наблюдали после восстановления первоначальной чувствительности повторное повышение порогов с последующим их восстановлением до исходного уровня. Эта закономерность, характеризующаяся наличием второго максимума, подтвердилась и в других исследованиях (Бронштейн, 1936; Hirsh, Bilger, 1955).

391

На величину возрастания порогов слышимости и длительность процесса восстановления первоначальной чувствительности влияют многочисленные факторы. При стимуляции непрерывным тоном имеет значение его частота, интенсивность и продолжительность воздействия; при воздействии непрерывном шумом — уровень шума, ширина полосы и продолжительность стимуляции. При прерывистых стимулах сдвиг порога зависит от пиковой интен-

дб

т и. Для адаптации диапазоне

сивности, продолжи- тельности и частоты следования импульсов.

Частотные за-

висимое выявления в широком

частот обычно воздейст- вуют тоном одной ка- кой-либо частоты и при этом определяют адап- тацию для других ча- стот.

При стимуляции до 40—50 дб над порогом слышимости наиболь-

Рис. 144. Повышение поро- говой чувствительности для

О 1000 2000 3000 ЬООО 5000 6000 7000 8000гц разных частот после зву- ковой стимуляции.

А — сдвиг пороговой слышимости после 11-секундного раздражения тоном 1000 гц: 1 — интенсивность тона 20 дб над порогом слышимости, 2 — 90 дб (по: Арапова и др., 1950). Б — сдвиг порогов слышимости после 5-минутного раздражения тонами 500, 1000, 2000, 3000 и 4000 гц интенсивностью 100 дб выше порога слышимости (по: Князева, 1946). На А и Б: по оси абсцисс — частоты в гц, на которых производилось измерение порогов слышимости; по оси ординат — сдвиг порогов в дб. На Б: цифры на каждой кривой обозначают частоту стимулирующего звука в гц.

шее повышение порога наблюдается на частоте раздражения. Кривая адаптации, как видно из рис. 144, Л, симметрична относительно частоты стимулирующего тона и по своей конфигурации напоминает резонансную кривую. При интенсивности стимуляции выше 60 дб максимальный сдвиг порога смещается к более высоким частотам и кривая становится асимметричной (Князева, 1946; Causse, Chavasse, 1947; Davis et al., 1950; Арапова и др., 1950; Hood, 1950). Максимальное понижение чувствительности после продолжительного воздействия тонами наблюдается на частоте, лежащей примерно на пол-октавы выше частоты стимуляции (рис. 144, Б).

392

Выше речь шла об адаптационных изменениях, вызываемых тоном определенной частоты в широком диапазоне частот. Рас- смотрим, каковы изменения порогов при разных частотах утомля- ющего тона, когда частоты стимулирующего и тестирующего сигналов совпадают.

Уже ранние исследования показали, что при одном и том же уровне звуковой стимуляции величина сдвига порога в значитель- ной степени зависит от частоты утомляющего тона. На рис. 145 показано, что величина сдвига порога возрастает с повышением частоты. Зависимость еще более выражена для стимулов макси- мальных интенсивностей (Davis et al., 1950). Так, при действии

звука интенсивностью 130 дб составляет для 500 гц — 20 дб, для 1000—2000 гц — 40 дб, для 4000 гц — 65 дб.

При стимуляции уха шу- мом наибольшие изменения порога обнаруживаются для

Рис. 145. Сдвиг порогов на частоте воздействия после прекращения стимуляции (по: Causse, Cha- vasse, 1947).

в течение 12 мин. сдвиг порога

По оси абсцисс — частоты в гц, на которых производилось измерение порогов слышимости; по оси ординат — сдвиг порогов в дб. Точками обозначены величины сдвигов пороговой чувствительности через 25 сек. после прекращения стимуляции (30 дб выше порога слышимости, экспозиция 40 сек.).

тонов от 2 до 6 кгц. Идентичная картина наблюдается при воздействии промышленного шума, вызывающего профессиональную тугоухость (Ruedi, Furrer, 1947; Yokoyama et al., 1967). Наличие выраженной адаптации к высокочастотным составляющим шума рассматривается, с одной стороны, как результат слабого защитного рефлекса мышц среднего уха (Simpson, 1949; Schuknecht, Tonnford, 1960), а с другой — как результат естественного резонанса звукопроводящих структур наружного и среднего уха (Onchi, 1966).

Влияние интенсивности стимуляции. Одним из основных вопросов, который необходимо решить для количественной характеристики слуховой адаптации, является вопрос о зависимости сдвига порогов от интенсивности стимулирующего сигнала. Исследования, проведенные рядом авторов, показали, что понижение чувствительности на частоте раздражения обнаруживает постоянство при изменении интенсивности стимуляции в пределах от 20 до 90—100 дб (Арапова и др., 1950; Lierle, Reger, 1954; Selters, 1964), Лишь дальнейшее увеличение интен

393

сивности стимулирующего звука выше 100 дб приводит к зна- чительному возрастанию сдвига порога на частоте раздражения (Davis et al., 1950; Hood, 1950).

Влияние продолжительности стимуля- ции. Большинство авторов, исследовавших влияние продолжи- тельности стимуляции на величину адаптационных изменений,

варьировали длительность стимулирующего звука в пределах от 10 сек. до 64 мин. Результаты измерений, проведенных разными авторами, представлены на рис. 146. Как видно из рисунка, величина сдвига порога обнаруживает линейную зависимость

от логарифма времени, что наблюдалось и в случае восстановления пороговой чувствительности.

Таким образом, было рассмотрено изолирован- ное действие на адапта-

Рис. 146. Зависимость сдвига порога от продолжитель- ности стимуляции.

По оси абсцисс — продолжительность стимуляции в мин.; по оси ординат — сдвиг порога в дб. Приведенные на рисунке прямые соответствуют данным разных авторов: 1 — Davis et al., 1950; стимуляция тоном 2000 гц интенсивностью 110 дб; 2 — Hood, 1950, соответственно 2000 гц, 110 дб; 3 — Князева, 1946 — 2000 гц, 100 дб; 4 — Causse, Chavasse* 1947 — 800 гц, 40 дб.

цию таких факторов, как частота, интенсивность и продолжительность стимуляции и частота тестируемого сигнала. Зависимость между указанными факторами до сих пор не удалось представить в виде единой формулы, и вопрос о точной количественной характеристике процесса адаптации все еще остается открытым (Ward, 1963).

Разрешение этого вопроса затрудняет^значительная вариабельность адаптационных изменений у разных испытуемых, а также у одного и того же испытуемого при повторных исследованиях.

Пороговая адаптация. До сих пор речь шла дб адаптационных изменениях, наступающих после стимуляции звуками надпрроговых интенсивностей.

В последнее время были проведены исследования изменений слуховой чувствительности, вызываемых воздействием звуковых стимулов пороговых интенсивностей (Earhart, 1957j Sorensen. 1967).

Метод исследования слуховой адаптации при действии непрет рывного тона пороговой интенсивности называется пороговой

394

адаптацией или тестом исчезновения порогового тона — Топе decay test. Исследование основывается на определении той пороговой интенсивности тона, при которой он воспринимается в течение 60—90 сек. Процедура заключается в предъявлении непрерывного тона пороговой интенсивности до его исчезновения, после чего интенсивность увеличивается шагами по 5 дб до достижения стабильного уровня порога восприятия тона. За величину адаптации принимается разница между исходной величиной пороговой интенсивности тона и тем окончательным уровнем, который был обнаружен в течение указанного промежутка времени.

Результаты исследований показали, что величина пороговой адаптации не превышает 10—15 дб у нормально слышащих, но резко увеличивается при некоторых ретрокохлеарных поражениях.

Громкостная адаптация. Измерения основаны на суждении испытуемого о громкости двух выслушиваемых им звуков. В начальный период исследования стимулы предъявляются на оба уха в неадаптированном состоянии. Интенсивность стимула, предъявляемого на сравниваемое ухо, регулируется до тех пор, пока оба звука не будут казаться равногромкими, либо пока не будет достигнуто суждение о локализации звука в середине головы, в зависимости от применяемой методики. Во второй период подается непрерывный стимул на адаптируемое ухо. Повторный баланс громкости проводится либо в процессе стимуляции, либо с момента ее прекращения. Этот метод дает возможность изучать адаптацию надпороговых уровней.

Ряд исследователей изучал громкостную адаптацию вТпро- цессе воздействия адаптирующего стимула (Bekesy, 1929; Hood, 1950; Palva, 1955; Karja, 1968), другие — после стимуляции (Pearce, 1935; Thwing, 1955).

Данные, полученные для разных частот, показали, что величина громкостной адаптации является наименьшей для частот 125 и 250 гц (соответственно 5 и 8 дб), возрастает для 500 гц до 15 дб и достигает максимальных величин для 1000—8000 гц (24—25 дб). Уже в первых работах было показано, что максимальное падение громкости возникает на частоте воздействия (Peorse, 1935). Уменьшение громкости во времени протекает очень быстро в первые 15 сек. от начала стимуляции, затем процесс резко замедляется, протекает асимптотически и достигает, по мнению большинства авторов, стабильных значений к 1—3-й минутам. Однако некоторыми авторами (Jerger, 1957) было показано, что процесс заканчивается к 3-й минуте только для низких частот стимуляции (125—500 гц), для более высоких частот он продолжается дольше.

Что касается процесса восстановления ощущения громкости после прекращения звуковой нагрузки, то всеми авторами отмечается, что восстановление протекает значительно быстрее,

395

однако между полученными данными существуют большие рас- хождения. Так, по данным одних авторов (Hood, 1950), время восстановления колеблется от 10 до 40 сек., по данным других (Thwing, 1955) оно достигает 2—3 мин.

Значительные расхождения получены и при определении зависимости величины громкостной адаптации от продолжитель- ности предъявления звуковой стимуляции. Результаты, получен- ные разными авторами для тона 800—1000 гц, предъявляемого в течение 1 мин. при интенсивности 60—80 дб над порогом слы- шимости оказываются близкими: от 7 до 15 дб. При увеличении

экспозиции до 3 мин. ре- зультаты колеблются от 5 до 35 дб (рис. 147).

Сомнительность пред- положения о полной не- зависимости ушей при громкостной адаптации и, следовательно, воз-

Рис. 147. Зависимость гром- костной адаптации от про- должительности стимуля- ции (по: Harbert et al., 1968).

По оси абсцисс — продолжительность стимуляции в сек.; по оси ординат — величина громкостной адаптации в дб. Кривые соответствуют данным разных авторов: 1 — Wood, 1930 (цитировано по: Harbert et al., 1968); 2— Hood, 1950; 3 — Jerger, 1957; 4 — Thwing, 1955; 5 — Bekesy, 1929; 6 — Harbert et al., 1968; 7 — Egan, Thwing, 1955; 8 — Hallpike, Hood, 1951.

можность возникновения адаптации в тестируемом ухе — все это отчасти может объяснить пестроту данных, полученных разными исследователями.

О природе слуховой адаптации. В ранних работах по исследованию слуховой адаптации временный сдвиг порога рассматривался как процесс, протекающий в самой улитке (Лазарев, 1923; Huizing, 1948; Hood, 1950; Комарович, 1955). Указанные авторы искали корреляцию между величиной адаптации и ускоренным нарастанием громкости, характерным для поражения волосковых клеток улитки. В последующих исследованиях, при воздействии звуками малых интенсивностей, полученные симметричные кривые изменений чувствительности также позволили предположить, что адаптация разыгрывается в чувствительном эпителии органа Корти. Асимметричный характер кривых при дальнейшем увеличении интенсивности стимуляции истолковывался как явление, протекающее в центральных отделах слухового анализатора (Арапова и др., 1950; Hood, 1950; Гершуни и Кня

396

зева, 1959). Однако в электрофизиологических исследованиях при низких уровнях стимуляции не удается обнаружить изменения электрических потенциалов улитки. Между тем эти изменения наблюдаются при исследованиях слухового нерва (Galam- bos, Davis, 1943), верхнеоливарного комплекса (Goldberg et al., 1964) и некоторых других отделов слуховой системы. Исходя из этого, Лоуренс и Янтис (Lawrence, Yantis, 1957) предположили, что адаптация при низких уровнях стимуляции характерна для ретрокохлеарных отделов анализатора. Что же касается действия звуков больших интенсивностей (более 100 дб), то авторы считают, что в этом случае к адаптации центральной природы присоединяется явление, протекающее на периферии.

Хирш и Билджер (Hirsh, Bilger, 1955), наблюдая двухфазный характер восстановления пороговой чувствительности, различают два процесса: R_r— вызывающий повышение чувствительности, непродолжительный (до 1 мин. после прекращения звуковой стимуляции) и 7? ₂ — монофазный процесс, вызывающий понижение чувствительности и зависящий от интенсивности стимуляции. Повторное повышение порогов слышимости объясняется временными нарушениями кохлеарного метаболизма, наступающими при значительных уровнях звукового воздействия (преобладание процесса /?₂). При малой выраженности процесса R ₂ преобладание R_± может вызвать явление сенсибилизации.

Если в процессе исследования сдвига порога предъявлять шум незначительной интенсивности на контрлатеральное ухо, то постстимуляторный сдвиг окажется меньше и период восстановления сократится. Последнее демонстрирует влияние контрлатеральной стимуляции на адаптацию, что следует рассматривать как явление центральной природы (Maspetiol et al., 1961).

Ряд других факторов также свидетельствуют о центральной природе адаптационного явления. Так, слуховая чувствительность значительно уменьшается при одновременном воздействии болевых раздражителей, затемнении глаз, при фармакологических и психофармакологических воздействиях на центральную нервную систему (Гершуни и Волохов, 1935; Темкин и Шейхон, 1955; Трауготт и др., 1968).

Из изложенного видно, что вопрос о механизмах адаптационного явления далеко еще не решен и требует дальнейшего изучения.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 1314 / 2314 15 16 17 18 19 20 21 22 23 > Следующая >>>

Соседние файлы в папке Оториноларингология

#
24.03.202448.61 Mб0Рубцы и их коррекция.pdf
#
24.03.20247.69 Mб1Руководство_для_врачей_Пальчун_В_Т_,_Крюков_А_И_.pdf
#
24.03.20241.02 Mб0Руководство_по_поликлинической_оториноларингологии_Сергеев_М_М_.pdf
#
24.03.202410.99 Mб0Руководство_по_практической_отоларингологии_В_Т_Пальчун.pdf
#
24.03.202411.12 Mб1Руководство_по_практической_оториноларингологии_Пальчун_В_Т_,_Магомедов.pdf
#
24.03.20242.62 Mб0Руководство_по_физиологии_Физиология_сенсорных_систем_Часть_2_Общая-1.docx
#
24.03.20242.62 Mб0Руководство_по_физиологии_Физиология_сенсорных_систем_Часть_2_Общая.docx
#
24.03.202412.13 Mб0Русский_медицинский_журнал_РМЖ_2023_№02_Клинические.pdf
#
24.03.2024130.05 Кб0Сакович А.Р. Острый риносинусит.doc
#
24.03.20241.45 Mб1Сестринское_дело_в_оториноларингологии_Сергеев_М_М_,_Зинкин_А_Н.pdf
#
24.03.2024879.7 Кб0Симуляционное_обучение_студентов_по_специальности_Оториноларингология.pdf