Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4 курс / Оториноларингология / Руководство_по_физиологии_Физиология_сенсорных_систем_Часть_2_Общая.docx
Скачиваний:
0
Добавлен:
24.03.2024
Размер:
2.62 Mб
Скачать

туров от номеров контуров (амплитудно-координатная харак­теристика анализатора) будет иметь форму амплитудночастотной характеристики отдельного контура, но повернутую на 180 град, относительно резонансной частоты. Таким образом, если теперь каким-то способом измерить амплитуды сигналов на выходах всех фильтровых каналов, можно получить амплитудночастотную характеристику одного избирательного элемента, настроенного

/ш111ш1Тгь,.

13 15 1719 2123 25 27 Номер фильтра

0.1 0.2 0.3 0.9 0.6 081,0 2.0 3.0 9.06.0 8.0100 Частота

Рис. 115. Схематическое изображение определения формы ча- стотной характеристики избирательного элемента параллельного анализатора с помощью эффекта маскировки.

а — входной сигнал; б — частотные^характеристики фильтров анализа­тора; в — амплитуды сигналов (вертикальные линии) на выходах фильтров (пунктирная линия — огибающая); г — «кривая маскировки» (сплошная линия), ДА — ошибка в определении амплитуды сигналов за счет ограни­ченной чувствительности измерителя амплитуд; д — частотная характе­ристика одного фильтра анализатора.

на воздействующую частоту (рис. 115). В качестве «зонда» можно использовать другой тон, частота которого будет изменяться от измерения к измерению. Действительно, если подать на вход анализатора два тона с различной частотой, каждый из них воз­будит определенное количество резонаторов ш суммарная огибаю­щая амплитуд на выходах анализатора будет иметь два макси­мума. При значительном уменьшении амплитуды одного из тонов может наступить момент, когда суммарная кривая распределения амплитуд будет мало отличаться от кривой распределения амплитуд при действии одного тона. Если теперь на выходе каждого канала

331

анализатора включить измерители, начинающие реагировать всякий раз, когда абсолютная величина приращения амплитуды, появившегося за счет включения дополнительного слабого сигнала

Рис. 116. Кривые маскировки тона тоном и тона шумом.

А — маскировка тона тоном 1200 гц (Wegel, Lane, 1924). Сплошная линия — «кривая маскировки»; штриховыми линиями показаны об- ласти различного восприятия суммы маскирующего (1-го) и маскируе- мого (2-го) тонов. Области биений заштрихованы. Б — маскировка тона тоном 400 гц (пунктирная линия) и тона шумом, имеющим полосу частот 90 гц и среднюю частоту 410 гц (сплошная линия) (Egan, Hake, 1950).

в момент звучания сильного, превысит некоторую величину, выбран­ную одинаковой для всех измерителей, распределение пороговых значений амплитуды измерительного сигнала по частоте и будет описывать распределение амплитуд на выходах анализатора и

332

после изменения Направления частотной оси — амплитудноча­стотную характеристику его избирательных элементов.

Поскольку второй сигнал (зонд) ниже некоторого порогового значения вообще не будет измеряться (будет замаскирован), получаемые кривые характеризуют маскирующие свойства анали­затора и в психоакустике называются кривыми маски­ровки.

Явление маскировки было известно еще в прошлом веке. Экспериментируя с камертонами и органными трубами, Мейер (Meyer, 1876) пришел к выводу, что даже слабый низкочастотный органный звук подавляет восприятие — маскирует звук одновре­менно звучащего камертона. В то же время обратное явление никогда не наблюдается.

Количественное исследование явления подавления восприятия одного тона, маскируемого, в присутствии другого, маскирующего или маскера, было предпринято Вегелем и Лейном (Wegel, Lane, 1924). Ими измерялись на различных частотах пороговые величины амплитуды маскируемого тона, при которых он начинает восприниматься на фоне маскера, имеющего постоянную частоту и интенсивность. В качестве меры маскировки брался логарифм отношения получаемых пороговых значений амплитуды, измерен­ной в присутствии маскера, к абсолютным пороговым значениям амплитуды на тех же частотах, измеренных в тишине. Таким об­разом были получены кривые (рис. 116), говорящие о том, на сколько децибел надо увеличить интенсивность маскируемого тона над абсолютным порогом, чтобы он мог восприниматься в при­сутствии одновременно звучащего маскирующего тона данной частоты и интенсивности. Полученные кривые оказались несим­метричными, с максимумами на частотах, близких к частотам маскера и его гармоник. На этих частотах воспринимались биения, и наличие маскируемого тона определялось только по моменту возникновения восприятия биений. Авторы аппроксимировали полученные кривые маскировки резонансными кривыми, тем са­мым допуская, что избирательные элементы имеют резонансную форму амплитудно-частотных характеристик. Качество аппрокси­мации получилось плохим вследствие сильной несимметрии кри­вых маскировки, однако это не привело к изменению представлений о форме амплитудно-частотных характеристик избирательных элементов, поскольку факт нелинейного увеличения несимметрии кривых с увеличением интенсивности сигналов мог свидетельст­вовать о наличии нелинейных искажений в органе слуха, возни­кающих до анализа. В этом случае хотя на вход слухового прибора подается чистый тональный сигнал, на вход анализатора поступает искаженный сигнал, который может быть представлен в виде суммы основного тона и его гармоник, названных «субъективными то­пами».

333

Величины добротности избирательных элементов анализатора органа слуха на различных частотах, определенные из кривых Вегеля и Лейна по формуле:

Таблица 9

Частота

(/о)

Добротность (Q)

400

19.4

800

42.6

1200

22.9

2400

14.4

3500

43.0

ве маскера оказались.

так же

где /0 — частота маскера, Д/ — полоса частот, измеренная на на уровне -—3 дб от максимального значения, приведены в табл. 9 (Makita, Miyatani, 1950).

Видно, что значения добротности избирательных элементов сильно варьируют (в 2—3 раза) от точки к точке и по существу невозможно выявить какую-то закономерную зависимость доброт- ности от частоты. Опыты с маскировкой многократно повторялись различными исследователями, причем в качестве маскеров в опы-

тах использовались не только тональ- ные сигналы, но и узкополосные шумы, шумы со срезами в сторону высоких и низких частот, а также сигналы слож- ной формы спектра.

В этих работах были получены допол- нительные сведения об эффекте одно- временной маскировки и о форме ампли- тудночастотных характеристик избира- тельных элементов органа слуха. Так, кривые маскировки, полученные в экспериментах, в которых в качест- я узкополосный шум (Ehmer, 1959), и кривые маскировки тона тоном,

сильно несимметричными, в то же время никаких максимумов на других частотах, кроме частот занимаемых полосой шума, не наблюдается (рис. 116, Б). Аналогичные результаты были полу­чены в экспериментах, в которых в качестве маскеров были исполь­зованы широкополосные шумы с резким спадом спектральной плотности энергии в сторону низких или в сторону высоких частот (Шупляков, 1967). Эти данные говорят о том, что несимметричная форма кривых маскировки вызвана не появлением субъективных тонов вследствие нелинейности слуха, а скорее всего является отражением несимметричной формы амплитудночастотных ха­рактеристик самих избирательных элементов слухового анализа­тора. Несимметричная форма кривых наблюдается и в экспери­ментах по непосредственному измерению частотных характеристик эффекта маскировки (Чистович, 1957; Small, 1959). В этих экспе­риментах частота и интенсивность маскируемого тона сохранялась неизменной, а интенсивность маскирующего тона на различных частотах увеличивалась до тех пор, пока маскируемый тон не пере­ставал восприниматься (рис. 117).

334

В экспериментах по маскировке было, кроме того, показано, что наклон кривых маскировки в сторону низких частот увеличи­вается с увеличением интенсивности маскера и может достигать весьма значительных величин, в то время как наклон кривых мас­кировки в сторону высоких частот уменьшается.

100 1000 ги,

Рис. 117. Частотные характеристики эффекта маски- ровки (Small, 1959).

По оси абсцисс — частоты маскирующих тонов; по оси орди­нат — уровни их интенсивности, а — частота маскирую­щего сигнала 400 гц, б — 800, в — 1600, г — 3200 и д — 6400 гц; интенсивность — 15 дб над порогом (2) и 30 дб (2). Величина вертикальной линии у точек характеризует раз­брос данных измерений. Стрелкой показана кривая абсо­лютного порога слуха.

В табл. 10 приведены значения максимальной крутизны кри­вых в сторону низких частот, полученные в экспериментах по маскировке различными авторами.

Измерение крутизны кривых маскировки в сторону высоких частот значительно сложнее, поскольку кривые имеют переменную крутизну от точки к точке и плохо аппроксимируются прямыми и, кроме того, их крутизна зависит от уровней сигналов.

335

Таблица 10

Автор

Крутизна кривой в дб/октаву

Маскировка тона тоном

Wegel, Lane, 1924

185

Fletcher, Munson, 1937

90

Egan, Hake, 1950

80

Deatherage, Bilger, Eldredge, 1957

105

Small, 1959

280

Шупляков, 1967

150

Маскировка тона

узкополосным шумом

Wegel, Lane, 1924

55

Fletcher, Munson, 1937

108

Egan, Hake, 1950

80

Deatherage, Bilger, 1957

85

Spicth, 1957

100

Z wicker, 1958

160

Маскировка тона

синтетическим шумом

Spicth, 1957

| 190

Чистович, 1957 I

1 160

Таблица И

Крутизна кривой

Автор

в дб/октаву

Wegel, Lane, 1924

10-15

Zwicker, 1958

20—60

Чистович, 1957

10—40

Ehmer, 1959 . . .

10—20

Small, 1959

30—50

Шупляков, 1967

15—35

В табл. 11 приведены значения крутизны кривых маскировки в сторону высоких частот, которые могут служить лишь для при­ближенной оценки порядка величин.

Поскольку крутизна кривых маскировки зависит от интенсив­ности сигналов, разброс данных различных экспериментов может быть объяснен тем, что авторы использовали в своих экспери­ментах сигналы различной интенсивности. Кроме того, в случае использования в качестве маскеров узкополосных шумов кривая маскировки естественно не может быть круче крутизны ампли­тудно-частотной характеристики фильтра, формирующего спектр шума, и в сторону низких частот ею в основном ц определяется,

336

Если принять в качестве средней крутизны кривых маскировки в сторону низких частот величину, равную 150 дб на октаву, ста­новится совершенно ясно, что амплитудночастотные характе­ристики избирательных элементов органа слуха имеют нерезонанс­ную форму. Действительно, как показывают расчеты, для полу­чения крутизны характеристики, равной 150 дб на октаву в самой оптимальной точке, резонансный контур должен иметь добротность порядка нескольких тысяч, т. е. соизмеримую с добротностью кварцевых резонаторов и превышающую измеренные с помощью других методик значения добротности амплитудно-частотных характеристик слуха на несколько порядков.

Допущение несимметричной формы самих амплитудночастот­ных характеристик избирательных элементов слуха объясняет несимметричную форму кривых маскировки; в то же время остается неясной причина возникновения столь высокой крутизны скло­нов, с большим трудом достигаемой в лучших технических устрой­ствах.

Определение эффективной полосы пропускания избирательных элементов. Критические полосы. Измерение параметров изби­рательных элементов слуха производится в психоакустике не только с помощью кривых маскировки, но и другими способами. В частности, большая группа экспериментов основана на вышеупо­мянутом свойстве контура отвечать на целый комплекс составляю­щих, попадающих в полосу его пропускания.

Если на вход избирательного контура подать широкополосный шум, на выходе контура появится сигнал, огибающая распределе­ния амплитуд по частотной оси (или огибающая энергий) которого будет повторять форму частотной характеристики, и, следова­тельно, суммарная энергия такого сигнала невыходе контура будет пропорциональна площади, занимаемой амплитудно-частот­ной характеристикой. Если же на вход контура подавать поло­совой шум, зависимость энергии на выходе контура от ширины полосы входного шума будет иметь вид, как показано на рис. 118, А. Видно, что основная энергия выходного сигнала сосредоточена в некоторой полосе частот, характерной для дан­ного фильтра. В случае многоканального анализатора эффектив­ную полосу пропускания одного из фильтров, а из нее и доброт­ность, можно определить, измеряя каким-либо способом энергию сигнала на выходе данного канала анализатора и строя зависимость величины энергии от полосы частот шума. Полоса пропускания фильтра названа эффективной потому, что с помощью данного спо­соба можно определить истинную полосу пропускания только таких фильтров, частотная характеристика которых симметрична относительно средней частоты. Во всех остальных случаях речь может идти только о некоторой усредненной полосе частот, в ко­торой содержится основная часть энергии фильтра.

22 Сенсорные системы

337

Так как непосредственное измерение энергии на выходах кана-

лов анализатора слуха не представляется возможным, при измере- нии добротности избирательных элементов слуха этим способом

в психоакустике пользу- ются допущением, что то- нальный сигнал воспри- нимается на фоне шумово- го в том случае, если его энергия на выходе данного фильтрового канала пре- вышает энергию шумового сигнала на некоторую по- стоянную величину.

Рис. 118. Зависимость энергии сигнала на выходе фильтра от ширины по- лосы шума на входе фильтра (4) и зависимость отношения интенсивности тона 1т к спектральной плотности мощности шума /у от ширины полосы маскирующего шума Д/ (Б) (Fletcher, 1940).

На А — кривые при разных формах частотных характеристик фильтров (1 — прямо­угольной, 2 — резонансных). На Б — кривые для разных частот маскируемых тонов (обозначены слева вверху и справа у прямых). Сплошные линии — аппроксимирующие Прямые, нижняя прямая объединяет 125, 250 и 500 гц.

Измеряя маскировку тонального сигнала шумовыми сигналами, можно построить зависимость пороговой амплитуды тонального сигнала от ширины полосы шума. Она будет повторять с каким-то неизвестным постоянным сдвигом зависимость энергии шума на выходе фильтра от полосы шума и, следовательно, на основании этой кривой может быть определена величина эффективной полосы пропускания фильтра. По существу этот способ является упрощен­

338

ным вариантом способа измерения добротности по кривым маски­ровки; главным недостатком этого способа является то, что он не дает возможности получить сведения о форме амплитудно- частотных характеристик избирательных элементов, в особенности если они имеют асимметричную форму.

Вышеописанный способ определения величины эффективной полосы частот избирательных элементов органа слуха впервые был использован в экспериментах Флетчера (Fletcher, 1940), в которых было получено, что с увеличением ширины полосы маски­рующего шума пороговая амплитуда маскируемого тона вначале

возрастает, а затем остается почти постоянной и не зави- сит от ширины полосы шума (рис. 118, Б). Флетчер аппро- ксимировал полученные за- висимости прямыми, тем са- мым допуская, что избира- тельные элементы слуха име- ют прямоугольную форму

Рис. 119. Зависимости величины критических полос от частоты (2 — по: Fletcher, 1940; 2 — по: Zwicker et al., 1957), а также за- висимость пороговой расстройки между тонами при восприятии биений (3) — по: Meyer, 1876).

Масштаб осей логарифмический.

Частота

амплитудно-частотных характеристик, т. е. являются полосовыми фильтрами.

Пороговые значения ширины полосы маскирующего шума, при которых амплитуда маскируемого тона перестает зависеть от ширины полосы шума, были названы «критическими». Зави­симость ширины критических полос от частоты, полученная в эк­спериментах Флетчера, приведена на рис. 119 (кривая 7).

Несмотря на произвольность исходного допущения, представле­ние о слуховом анализаторе как состоящем из набора избиратель­ных элементов типа критических полос хорошо согласуется с боль­шим числом явлений, наблюдаемых в психоакустических экспери­ментах (см. обзор: Фрейдин, 1968).

Эксперименты по методу измерения суммарной энергии на выхо­дах фильтровых каналов анализатора производились затем различными исследователями. Имеется большое количество ва­риантов этого метода, отличающихся друг от друга не только видом маскеров, но и способами измерения энергии сигналов

22*

339

на выходах фильтровых каналов. Например, в экспериментах Цвиккера (Zwicker, 1954) в качестве маскеров использовались наборы из двух симметрично расположенных тонов, расстояние между которыми менялось, а в качестве маскируемого сигнала (измерительного) использовался узкополосный шум. Критические полосы, полученные в экспериментах Цвиккера, оказались при­мерно в 2—2.5 раза больше критических полос Флетчера (рис. 119). Ход зависимости величины критических полос от частоты примерно совпал.

Предполагая, что для восприятия сигналов на выходе фильтро­вого канала необходима некоторая пороговая энергия сигнала, Гесслер (Gassier, 1954) произвел измерения порога восприятия сложного сигнала в зависимости от ширины его полосы. В ка­честве такого сигнала использовались наборы из различного числа тональных сигналов. Если все тоны в комплексе имеют одинаковую амплитуду и одинаковое расстояние по частоте, а измерение производится на частотах в области горизонтального хода абсо­лютного порога, энергия комплекса будет пропорциональна числу составляющих. Если теперь измерять пороги восприятия комп­лекса при различном числе составляющих, пороговый уровень звукового давления каждого тона в комплексе будет вначале быстро уменьшаться с увеличением числа тонов, а затем скорость изме­нения уменьшится и добавление тонов к комплексу уже не скажется на величине порогового уровня звукового давления, поскольку эти тоны попадут в другой фильтровой канал. Гесслер также ап­проксимировал полученные кривые с помощью двух прямых и по точке их пересечения определил критическое число тонов, а из него и критическую полосу избирательного фильтра органа слуха. Зависимость величины критической полосы от частоты примерно совпала с зависимостью Цвиккера.

Определение временных параметров избирательных элемен­тов. Другой класс экспериментов связан с измерением временных параметров избирательных элементов органа слуха.

В начале настоящего раздела уже говорилось о том, что постоян­ная времени фильтра и его добротность взаимосвязаны. Измеряя каким-либо образом постоянную времени, можно вычислить эф­фективную полосу пропускания фильтра. Однако и методы измере­ния временных параметров, так же как и предыдущие, не позво­ляют определить форму амплитудно-частотных характеристик избирательных элементов; обычно предполагаются симметричные характеристики типа резонансных или идеальных прямоуголь­ных.

В качестве сигналов, подаваемых на вход анализатора в этом случае, обычно используются сигналы, параметры которых (ампли­туда или частота) изменяются во времени по определенному закону и спектры которых имеют по возможности простую форму, с тем чтобы можно было затем анализировать результаты экспериментов.

340

Такими сигналами являются сигналы, состоящие из двух или трех тонов, сдвинутых по частоте относительно друг друга.

Если сигнал состоит из суммы двух тональных сигналов вида:

Л (*) = А sin 4-ft) и

/2 (t) = А2 sin (wj + Q) t,

то результирующее колебание

/ (0 = Л W + /2 (t) = A (г) sin ? (t)]

в общем случае представляет сигнал, амплитуда A (t) и частота которого изменяются во времени по закону:

A (t) = \Ja* Al 4- 2Л1Л2 cos (Qt — и

Л, sin Vi 4- А9 sin Qt

~ A± cos ft 4- A2 cos Qt ’

Особенно наглядно это видно, если каждое колебание изобра­зить с помощью вектора, длина которого равна амплитуде сигнала и который вращается вокруг точки, соответствующей началу вектора с данной круговой частотой. Суммарное колебание в этом случае будет изображаться вектором, представляющим сумму исходных векторов, а проекция суммарного вектора на некоторую ось амплитуд будет давать зависимость амплитуды суммарного колебания во времени.

Если подать такое сложное колебание на параллельный анали­затор, состоящий из большого количества избирательных элемен­тов, то в случае, если тоны незначительно различаются по частоте, оба они попадут в один и тот же фильтровой канал и энергия на вы­ходе канала будет изменяться в такт с изменением низкочастотной огибающей амплитуд. С увеличением расстояния между тонами данный фильтровой канал, настроенный на частоту одного из то­нов, будет все слабее реагировать на другой тон и на выход будет попадать все меньше энергии от другого тона. Это выразится в том, что величина модуляции амплитуды и частоты сигнала на выходе будет уменьшаться, частота модуляции будет возрастать.

Если задаться некоторой определенной, пороговой величиной амплитуды модуляции на выходе данного фильтрового канала, пороговая величина будет достигнута при определенном расстоя­нии между тонами по частоте, при котором можно считать, что они Ьопадают в разные каналы. Таким образом можно измерить разрешающую способность анализатора по частоте, характеризую­щую способность анализатора выделять из сложного сигнала две рядом находящиеся спектральные составляющие. Аналогич­ные эксперименты могут быть проведены и с сигналами, состоя­щими из трех компонент. Из большого разнообразия различных

341

вариантов сложных сигналов, состоящих из трех компонент, наибольшее применение в психоакустических экспериментах нашли два: сигналы с модуляцией амплитуды и сигналы с моду­ляцией частоты.

В векторном изображении первые сигналы могут быть пред­ставлены в виде суммы из трех векторов, один из которых вра­щается с угловой частотой, равной несущей частоте 2, а для других — с одинаковыми угловыми скоростями о), равными частоте модуляции, но взаимно противоположно направленными. Проекция суммарного вектора на ось амплитуд даст зависимость суммарной амплитуды во времени.

Другое колебание (частотномодулированное) получается, если вектор, изображающий несущее колебание в AM сигнале повер­нуть на 90°. В этом случае частота суммарного сигнала будет ко­лебаться вокруг несущей частоты 2 на некоторую величину, определяемую амплитудами составляющих.

Нетрудно видеть, что спектры и тех и других колебаний при малых величинах составляющих состоят из трех компонент, две из которых расположены симметрично относительно несущей

I w и находятся от нее по частоте на + •

Если подать такое колебание на анализатор, состоящий из на­бора параллельных резонаторов, при малых частотах модуляции все три компоненты попадут в один резонатор и на выходе его мо­гут быть зарегистрированы колебания частоты или амплитуды с периодом модуляции. Увеличивая частоту модуляции, можно достигнуть момента, когда боковые составляющие выйдут из эф­фективной полосы пропускания фильтра и модуляция сигнала на его выходе значительно уменьшится. Задаваясь некоторым по­роговым значением величины модуляции на выходе фильтра, можно определить его полосу пропускания.

Психоакустические эксперименты по измерению порога вос­приятия биений в случае прослушивания двух равногромких тонов впервые были проведены еще Мейером (Meyer, 1876). Кри­вая, полученная им, приведена на рис. 119. Видно, что величина порога восприятия биений имеет такую же зависимость от частоты, что и ширина критических полос. С учетом предыдущих наших рассуждений это и понятно, поскольку вышеназванные кривые отражают по сути одно и то же явление. Различия в абсолютных величинах могут быть объяснены различными критериями оценки.

Эксперименты с измерением пороговых частот модуляции при восприятии AM и ЧМ-сигналов проводились различными авто­рами (Mathes, Miller, 1947; Zwicker, 1952; Чистович, 1956).

В экспериментах Цвиккера измерялись пороговые значения

А коэффициента модуляции, равного т = -■мод , при различных ча- ^нес

стотах модуляции в случае AM-колебаний и пороговые значения

342

индекса модуляции, равного v — , в случае ЧМ-колебаний, также

при различных частотах модуляции. Энергетические спектры этих двух колебаний при пороговых уровнях модуляции прак­тически совпадают.

В экспериментах определялись пороговые значения частоты модуляции на различных несущих часотах, при которых слушатели уже не в состоянии отличить AM-колебания от ЧМ. Поскольку частота модуляции характеризует расстояние по частоте между компонентами в спектрах колебаний, пороговая частота моду­ляции каким-то образом характеризует эффективную полосу частот избирательных элементов анализатора. Ширина полосы избирательных элементов, определенная из пороговых величин модуляции, оказалась совпадающей со значениями критических полос, измеренных в других экспериментах (Gassier, 1954; Zwicker, 1954; Feldtkeller, 1955; Zwicker et al., 1957).

Сравнение с данными исследований улитки и слухового нерва. Естественно возникает вопрос, в какой степени психоакустиче­ские данные о частотно избирательных свойствах слуха согла­суются с данными, полученными при исследовании улитки и слу­хового нерва.

Отметим, что первые представления о маскировке, так же как и о других свойствах слуха, строились исходя из предположения о периферической природе анализа сигналов органом слуха. Однако с развитием исследований и в связи с расширением знаний о слуховой системе такое представление перестало быть очевидным. Особенно это относится к объяснению высокой крутизны кривых маскировки в сторону низких частот (или соответственно крутизны амплитудно-частотных характеристик эффекта маскировки в сто­рону высоких частот).

Наибольшая крутизна кривых, характеризующих амплитудно- частотные свойства маскировки, была получена в экспериментах Смолла (Small, 1959), где она достигает 280 дб на октаву. Частотно­пороговые кривые отдельных нейронов, полученные в электро­физиологических исследованиях при измерениях на уровне первого слухового нейрона (Tasaki, 1954; Sumi et al., 1956; Kiang et al., 1962), практически совпадают с кривыми маскировки (рис. 120),

Также при исследовании частотных свойств суммарных ответов большого числа нейронов (Lowy, 1945; Finck, 1966) оказывается, что они близки к частотным свойствам эффекта маскировки. На­пример, в экспериментах Финка (Finck, 1966), построенных по той Я<е методике, что и эксперименты, выполненные Смоллом, но в которых измерялись медленные потенциалы при отведении от слухового нерва, оказалось, что зависимость этих потенциалов от частоты также практически совпадает с частотными характери­стиками эффекта маскировки, полученными в психоакустических экспериментах, как по форме характеристики, так и по крутизне

343

склонов, достигающей в сторону высоких частот 200 дб на октаву. Кривая Финка также изображена на рис. 120.

Если эффект маскировки является периферическим процессом, то тогда необходимо сравнить частотные характеристики эффекта маскировки с амплитудно-частотными характеристиками базиляр­ной мембраны — периферического образования, безусловно от­ветственного за первичный анализ сигналов органом слуха.

К настоящему времени имеется всего две работы, посвященные непосредственному измерению амплитудно-координатных и ам­плитудно-частотных характеристик базилярной мембраны. Прежде

1000 10000 га

Частота

Рис. 120. Нормированные частотные характеристики различных эффектов в слуховой системе.

Сплошные линии — частотные характеристики точек базиляр­ной мембраны (1 — по: Bekesy, 1960; 2 — по: Johnstone, Boyle, 1967), штриховые — частотные характеристики пер­вого слухового нейрона (3 — по: Sumi et al., 1956; 4 — по: Tasaki, 1954), пунктирные — частотные характеристики эффекта маскировки (5 — по: Чистович, 1957; 6 — по: Small, 1959), штрих-пунктирная — частотная характеристика мед­ленных потенциалов при регистрации суммарного ответа слухо­вого нерва (7 — по: Finck, 1966). Остальные объяснения в тексте.

всего это работа Бекеши (Bekesy, 1960) по непосредственному измере­нию амплитуды колебаний различных точек базилярной мембраны в ответ на воздействующие синусоидальные сигналы. С тем чтобы можно было удобно сравнивать эти кривые с кривыми маскировки и с другими частотно-зависимыми эффектами слуха, на рис. 120 кривые Бекеши представлены в логарифмическом масштабе.

Из кривых видно, что они имеют много общего с кривыми мас­кировки. Во-первых, эти кривые, так же как и кривые маскировки, являются резко несимметричными, с крутым спадом в сторону вы­соких частот и значительно менее крутые в сторону низ­ких частот. По этой причине становится ясным, что величины до­бротности избирательных элементов, вычисленной формально как отношение резонансной частоты фильтра к полосе его пропуска­ния на уровне —3 дб от максимального значения, оказывается не­достаточно для описания характеристик базилярной мембрана, 344

Йе менее Ьажнымй для описания кривых являются значения кру­тизны склонов характеристик в сторону высоких и в сторону низ­ких частот.

К сожалению, как видно из рисунка, амплитудно-частотные характеристики оказалось возможным измерить в очень неболь­шом диапазоне амплитуд и поэтому трудно оценить значения ве­личины крутизны этих характеристик. В измеренном диапазоне амплитуд крутизна кривых в сторону высоких частот составляет всего примерно 45 дб на октаву и около 3—10 дб на октаву в сто­рону низких частот.

Несколько более близкие к кривым маскировки амплитудно- частотные характеристики базилярной мембраны были получены в недавнем исследовании Джонстона и Бойля (Johnstone, Boyle, 1967), в котором колебания базилярной мембраны измерялись с по­мощью эффекта Мессбауэра. Крутизна полученной в этом экспе­рименте амплитудно-частотной характеристики в сторону низких частот, измеренной на улитке морской свинки в точке на расстоя­нии 1.5 мм от стремечка, оказалась равной 10—13 дб на октаву, а в сторону высоких частот — 60—75 дб на октаву (рис. 120).

Таким образом, результаты сравнения показывают, что психо­акустические и электрофизиологические данные о частотной из­бирательности слуха оказываются достаточно близкими. В то же время наблюдается весьма сильное несоответствие этих данных с характеристиками базилярной мембраны.

Попыткам объяснить это несоответствие посвящено значитель­ное количество работ по рассмотрению и моделированию возмож­ных механизмов «обострения» частотной избирательности слуха (Licklider, 1950, 1951; Ranke, 1950; Huggins, Licklider, 1951; Молчанов, Лабутин, 1966, и др.). Окончательное решение вопроса пока еще не найдено.

ГРОМКОСТЬ

Громкость является наиболее универсальным из признаков, используемых слухом для описания звукового сиг­нала. Человек способен оценивать и сравнивать по громкости лю­бые звуковые сигналы: тоны, акустические импульсы, шумы, периодические сигналы со сложным спектром.

Исследования громкости составляют один из ведущих разде­лов психоакустики. Основной целью экспериментальных работ является разработка теории громкости, т. е. создание методов, позволяющих вычислить (объективно измерить) громкость лю­бого произвольного сигнала.

Хотя исследования громкости являются психоакустическими, в основе теории лежат физиологические представления. Практи­чески все исследователи принимают, что громкость является мерой количества импульсов, вызванных сигналом в слуховом нерве.

345

Предполагается, что звуку соответствует некоторый рельеф плот­ности импульсации. Одной осью является проекция улитки, вто­рой — время. Принимается, что громкость образуется путем ин­тегрирования плотности импульсации по оси проекции улитки и по времени.

В соответствии с этими общими представлениями разработка модели громкости должна включать решение таких крупных проб­лем, как проблема перехода от сигнала к соответствующему ему

Рис. 121. Упрощенная блок-схема слухового измере- ния громкости.

Ус — усилитель, Фп фильтры, При Прп преобразо­ватели, Сум — сумматор. Остальные объяснения в тексте.

рельефу плотности импульсации и проблема интегрирования им­пульсации.

К настоящему времени в первом приближении разработана (Zwicker, 1958; Zwicker, Scharf, 1965) процедура перехода от спек­тра сигнала к кривой распределения средних по времени значе­ний плотности импульсации (плотности громкости) вдоль проекции оси частот. Площадь под кривой дает общую громкость звука. Основная часть экспериментальных работ была направлена на решение именно этой задачи. Поэтому исследователи использо­вали только спектральные представления как при описании сиг­нала, так и при описании реакции на сигнал слуховой системы. Разработка моделей, описывающих временную картину плот­ности импульсации и процесс интегрирования импульсации по времени, находится пока в самом начале (Zwislocki, 1960, 1969; Zwicker, 1968).

На рис. 121 изображен несколько упрощенный вариант схемы слухового измерения громкости, предполагаемой большинством исследователей. Схема включает: предварительный усилитель (среднее ухо), набор фильтров, центральные частоты которых пе­

346

рекрывают весь частотный диапазон слуха (механические системы улитки), связанные с каждым фильтром преобразователи энергии колебаний в количество нервных импульсов, общий сумматор.

Эта блок-схема удобна тем, что позволяет определить, какая информация необходима для того, чтобы можно было перейти от спектра сигнала к общей громкости — сигналу на выходе сумма­тора.

Для описания усилителя необходимо указать его частотную и амплитудную характеристики.

Относительно набора фильтров нужно установить, каковы частотные характеристики фильтров и каково относительное число фильтров в различных частотных диапазонах. Для описания преобразователя необходимо указать зависимость между энергией сигнала на его входе и величиной громкости на выходе. Относи­тельно сумматора следует выяснить применяемое в нем правило суммирования.

Экспериментальные исследования, позволившие получить нуж­ную информацию, группируются вокруг трех основных вопросов: а) зависимость громкости тона от его частоты, б) зависимость громкости сложного сигнала от ширины полосы его спектра, в) вид зависимости между энергией сигнала и его громкостью.

Основной экспериментальный метод исследования базируется на способности человека оценивать равенство (различие) громко­стей двух последовательно предъявляемых звуков. Это дает воз­можность избрать некоторый звук (чаще тон с частотой 1 кгц) в качестве стандарта и выражать громкость любого исследуемого звука в значениях уровня интенсивности или уровня звуко­вого давления (УЗД) стандарта, равногромкого с исследуемым звуком.

Зависимость громкости тона от его частоты. Для характе­ристики интенсивности чистого тона достаточно указать уровень звукового давления (УЗД). Звуковое давление измеряется или непосредственно у барабанной перепонки, или в точке звукового поля, куда помещается голова испытуемого. Так как зависимость между давлением в поле и давлением у барабанной перепонки известна (Beranek, 1949), мы ограничимся рассмотрением зави­симости громкости тона от его частоты и УЗД, измеренного у бара­банной перепонки.

На рис. 122 приведены данные дл^ одного из испытуемых, ис­следованных Россом (Ross, 1967). По оси ординат показаны ве­личины УЗД тона 800 гц у барабанной перепонки этого испытуе­мого, по оси абсцисс — величины УЗД тонов 3200 гц и 32 гц. Точки указывают условия равенства громкости тонов 800 и 3200 гц. Уравнение кривой, аппроксимирующей экспериментально полученную зависимость, известно как уравнение (функция) равной громкости.

Установлено, что для любых пар тонов, частоты которых лежат

347

выше 500 гц, условие равенства громкости приближенно описы­вается линейной зависимостью с коэффициентом наклона, равным 1 (Stevens, 1966; Ross, 1967). Иначе говоря УЗД1—УЗД2+А (дб).

Как можно видеть из рис. 122 (крестики), громкость тона с час­тотой 32 гц растет значительно быстрее, чем громкость тона с час­тотой 800 гц. Скорость роста громкости для тонов с частотами ниже 500 гц является тем большей, чем ниже частота тона.

На рис. 123 приведены частотные контуры равной громкости, полученные Флетчером и Мансоном (Fletcher, Munson, 1933); они достаточно хорошо совпадают с контурами равной громкости, полученными в более поздних работах (Zwicker, Feldkeller, 1955;

Рис. 122. Результаты экспери- мента по уравниванию двух тонов по громкости (по: Ross, 1967).

По оси абсцисс — уровень звуко- вого давления тонов 3200 гц и 32 гц; по оси ординат — уровень звукового давления тона 800 гц.

Рис. 123. Частотные контуры равной громкости (по: Fletcher, Munson, 1933).

По оси абсцисс — частота тона; по оси ординат — уровень звукового давления у барабанной перепонки. Кривые — кон- туры равной громкости, цифры у кривых — значения уровня громкости (L).

Ross, 1967). По оси ординат указан УЗД у барабанной перепонки (реально в эксперименте измерялись значения электрического напряжения на клеммах телефона, значения давления вычисля­лись на основании калибровки телефона на группе естественных ушей). Контур равной громкости показывает, какие УЗД должны быть на разных частотах для того, чтобы громкость тонов была оди­наковой. На рис. 123 около каждого контура указано значение L — уровня громкости. В данном случае за уровень громкости принят уровень интенсивности над средним слуховым порогом тона 1000 гц (при определении давления в поле за уровень гром­кости принимается просто УЗД тона 1000 гц). За единицу уровня громкости был принят фон (1 фон равен 1 дб на частоте 1000 гц), однако этот термин не получил повсеместного распростране­ния — часто говорят об уровне громкости в децибелах. Пользуясь рис. 123, легко определить для любого тона его уровень громкости. 348

Например, тон 100 гц с УЗД, равным 80 дб имеет уровень гром­кости, равный 60 дб (фонам).

Факторы, ответственные за наблюдаемую форму контуров равной громкости, частично проанализированы. Подъем кривых (падение громкости) на частотах выше 2 кгц связывают с пониже­нием коэффициента передачи среднего уха на высоких частотах. Подъем кривых на частотах ниже 500 гц связывают с характери­стиками внутреннего уха.

Зависимость громкости от ширины спектра сигнала. Обра­тившись к рис. 121, легко заметить, что громкость сигнала, образо­ванного из двух тонов, всегда должна быть больше громкости каждо­го из тонов в отдельности. Однако механизмы, за счет которых про­изойдет это увеличение громкости, будут разными в зависимости от того, близки или далеки друг от друга частоты тонов. Если тоны далеки по частоте, они будут попадать в разные фильтры и ответ фильтра, настроенного на один из тонов, не будет зависеть от того, есть или нет в сигнале второй тон. Увеличение громкости будет при этом происходить за счет увеличения числа работающих каналов. В простейшем случае (каждый тон действует только на один фильтр) суммарная громкость должна быть просто равна сумме громкостей тонов.

Если два тона очень близки по частоте (разность их частот меньше ширины полосы фильтра), можно считать, что при действии каждого из них работает тот же самый канал; этот же канал ра­ботает и тогда, когда оба тона действуют вместе. Так как фильтр пропускает оба тона, энергия колебаний на его выходе будет равна сумме энергий колебаний, вызываемых каждым из тонов в от­дельности. Отсюда следует, что, если именно энергия колебаний в фильтре определяет количество импульсации (плотность гром­кости) в данном канале, громкость двух близких по частоте тонов будет равна громкости одного тона, имеющего ту же самую энер­гию. Это значит, что громкость двух близких тонов с одинаковым УЗД должна быть равна громкости одного тона с УЗД, увеличен­ным на 3 дб.

Рассмотрим, что должно произойти, если энергию сигнала сох­ранять постоянной, но полосу частот, в которой находятся его со­ставляющие, существенно расширить. В этом случае энергия колебаний на выходе фильтра уменьшится (ча^ть составляющих сигнала уже будет находиться вне полосы пропускания фильтра), однако количество работающих каналов увеличится. Громкость сигнала может остаться неизменной только при том условии, что увеличение громкости, связанное с возрастанием числа каналов, будет точно компенсировать уменьшение громкости, обусловлен­ное уменьшением энергии в основном канале. Таким образом, естественно ожидать, что при расширении полосы сигнала за пре­делы некоторой критической полосы громкость звука с постоян­ной энергией начнет изменяться. Будет она возрастать или па-

349

дать, должно зависеть от конкретного вида функции громкости, описывающей связь между энергией и громкостью в отдельном канале.

На рис. 124 приведена зависимость уровня громкости четырех­компонентного комплекса от ширины полосы частот, в которой расположен этот комплекс (Zwicker, Flottorp, Stevens, 1957). За ширину полосы (А/7) принята разность частот между самым высоким и самым низким тоном в комплексе. Все тоны в комплексе

10 20 50 100200 50010002000гц.

ДЕ

Рис. 124. Зависимость уровня громкости четырехкомпонентного комплекса (по оси ординат) от частотного расстояния (AF, по оси абсцисс) между самым вы­соким и самым низким тонами в комплексе (Zwicker et al., 1957).

Буквы Т и С соответствуют двум вариантам эксперимента: испытуемый управляет или интенсивностью тона сравнения (Г и j;) или интенсивностью комплекса (С и о) УЗД.

ные были получены при

имели одинаковую интенсивность и были расположены вокруг цент- ральной частоты, указанной циф- рами над кривыми рис. 124. Мерой уровня громкости служил УЗД тона центральной частоты. Ширина горизонтального участка кривых, приведенных на рисунке, соответ- ствует ширине критической поло- сы, определенной на основании группы разного рода эксперимен- тов (Gassier, 1954; Zwicker, 1954; Feldkeller, Zwicker, 1956), опи- санных в разделе «Частотно из- бирательные свойства слуха». Мож- но видеть, что экспериментальные данные соответствуют предполо- жению авторов, что громкость комплекса с постоянной энергией сохраняется постоянной, пока все составляющие комплекса находят- ся в пределах критической поло- сы; при расширении полосы сиг- нала за пределы критической полосы громкость комплекса на- чинает расти. Аналогичные дан- использовании в качестве сти-

мула полосового шума с постоянной энергией и переменной шириной полосы (Zwicker, Flottorp, Stevens, 1957). Измерения,

проведенные с сигналами различного уровня интенсивности, по­казали, что нарастание громкости с расширением полосы наиболее

выражено при средних уровнях интенсивности, при малых уров­нях может наблюдаться обратный эффект — расширение полосы сигнала за пределы критической полосы приводит к падению гром­кости.

Функция громкости. Во всех описанных выше экспериментах мерой громкости сигнала служил уровень громкости (Л). Естест­венно считать, что между громкостью (g) и уровнем громкости (L) существует непрерывная и монотонная зависимость. Это позволяет

350

утверждать, что если двум звукам соответствует одно и то же зна- чение уровня громкости, то эти звуки равны по громкости. Можно также утверждать, что звук с большим уровнем громкости является более громким. Однако не зная вида зависимости между L и g, ничего нельзя сказать о том, па сколько или во сколько раз гром- кость топа с уровнем громкости Lr больше громкости тона с уров- нем громкости Л2.

Один из подходов к определению функции громкости, получив-

кости тона в зависимости от исходного уровня громкости (по: Zwicker, 1958).

По оси абсцисс — уровень громкости в дб тона 1000 гц; по оси ординат — увеличе- ние уровня громкости, необходимое для того, чтобы звук воспринимался как в два раза более громкий. Сплошная кривая — данные Цвикера (Zwicker, 1958), пунктир- ная — Робинсона (Robinson, 1957).

ровании громкости сигнала. В одном из вариантов методики ис­пытуемому предъявляется эталон (звук с определенным УЗД), которому присваивается число (чаще 10 или 100). Затем испытуе­мый слушает набор сигналов, оценивая отношение громкости каж­дого из этих сигналов к эталону. Полученная таким образом за­висимость между звуковым давлением сигнала и оценкой его громкости довольно хорошо аппроксимируется выражением g= ^kp^. Это выражение, предложенное Стивенсом (Stevens, 1955, 1957), получило название степенного закона Стивенса.

При использовании логарифмического масштаба по обеим осям график зависимости приобретает вид прямой, наклон которой указывает значение 9 —- показателя степени.

К сожалению, значения 0, определенные на основании дан­ных экспериментов по прямому численному шкалированию, очень сильно варьируют (см.: Пьерон, 1966).

Более устойчивые результаты дает метод, при котором испытуе­мому предлагают подобрать сигнал, который вдвое тише или вдвое

351

громче эталона. На рис. 125 приведены данные Цвиккера (Zwi­cker, 1958) и данные Робинсона (Robinson, 1957), полученные этим методом для тона 1000 гц.

Если бы громкость была степенной функцией интенсивности звука, причем показатель степени сохранялся бы постоянным на всем диапазоне уровней интенсивности, для удвоения громкости сигнала всегда нужно было бы увеличивать его уровень интенсив­ности на одно и то же число децибел. Рис. 125 показывает, что при малых уровнях для удвоения громкости достаточно увеличить уровень на 6 дб, при уровнях порядка 50—70 дб для удвоения гром­кости требуется увеличение уровня на 12 дб или больше.

Из данных рис. 125 следует, что на интервале уровней от 10 дб до 50'дб значения показателя степени должны изменяться от 0.5 до 0.25.

Еще один метод определения функции громкости основан на сравнении уровней громкости двух звуков, один из которых из теоретических соображений должен казалось бы быть вдвое громче другого. Сюда относится сравнение громкости одного тона с гром­костью комплекса из двух равногромких тонов, далеко разнесен­ных по частоте, а также сравнение громкости тона, предъявленного монаурально, с громкостью того же тона при бинауральном предъ­явлении. Результаты этих двух типов эксперимента дают сильно различающиеся между собой результаты.

Прирост уровня громкости двух равногромких разнесенных по частоте тонов, действующих на одно ухо, составляет в среднем диапазоне уровней 10—12 дб (Fletcher, 1953), что хорошо со­гласуется с данными рис. 125.

Прирост уровня громкости тона при бинауральном предъяв­лении составляет в среднем диапазоне уровней примерно 6 дб, при близких к порогу уровнях он уменьшается, приближаясь к 3 дб (Reynolds, Stevens, 1960; Treisman, Irwin, 1967). Это со­ответствует тому, что значения показателя степени, вычисленные на основании этих данных, должны изменяться с увеличением уровня от 1.0 до примерно 0.5.

Существенно, что такой малый прирост уровня громкости при бинауральном предъявлении сигнала наблюдается в том случае, если на оба уха действует тон одной и той же частоты. Если од­новременно на разные уши подаются два равногромких сигнала, далеко разнесенных по спектру, прирост суммарной громкости этого сложного сигнала составляет 8—13 дб (Клаас и Чистович, 1959). Этот факт заставляет предполагать, что при бинауральном предъявлении тона одной и той же частоты не происходит полного суммирования громкости (импульсации), поступающей из двух ушей, т. е. что общая громкость оказывается меньшей суммы гром­костей, связанных с каждым из ушей.

Таким образом, результаты различного рода экспериментов позволяют считать, что при средних и высоких уровнях сигнала 352

его громкость пропорциональна степенной функции от интенсив- ности звука g~kr (I/Iof—kz (P/PQ)2B с показателем степени 9, близким к 0.25.

Отклонение от этой зависимости при малых уровнях интенсив- ности сигнала окончательно не объяснено; его часто связывают с действием собственных шумов, которыми при малых уровнях сигнала уже нельзя пренебрегать. Модельные представления,

объясняющие влияние шума на

вид экспериментально опреде- ляемой функции громкости, бу- дут изложены ниже после опи- сания данных о громкости сиг- нала, действующего на фоне внешнего шума.

В качестве единицы гром- кости используется сон. Один сон соответствует громкости тона 1000 гц с уровнем интен- сивности, равным 40 дб над нормальным слуховым порогом.

Влияние шума на громкость сигнала, действующего на его фоне. Громкость тона или слож- ного звука, действующего на фоне шума, всегда оказывается меньшей громкости этого же звука в тишине. Однако чем больше уровень сигнала, тем меньше вызванное шумом по- нижение его громкости.

На рис. 126 приведены резуль

Рис. 126. Зависимость между уров- нем интенсивности тона (по оси абсцисс) и его уровнем громкости (по оси ординат) в условиях, когда тон предъявляется на фоне шума (Stevens, 1966).

Пунктирная линия — тон действует в ти- шине; кружки, квадраты и треугольники соответствуют трем разным уровням ин- тенсивности маскирующего шума.

таты эксперимента по уравнива­

нию громкости тона 1000 гц, действующего в тишине, с громкостью того жетона, действующего на фоне октавного шума (700—1400 гц) с тремя разными уровнями интенсивности. График построен Сти­венсом (Stevens, 1966) по данным Лохнера и Бургера (Lochner, Burger, 1961). Из графика следует, что чем выше уровень маскирую­щего шума, тем быстрее растет громкость маскируемого тона с уве­личением его интенсивности. При больших уровнях маскируемого

тона его громкость уже не отличается от громкости того же тона, действующего в тишине. Это явление быстрого роста громкости сигнала в условиях маскировки получило название эффекта вы­равнивания громкости.

Было предложено несколько различных моделей эффекта. Наи­более привлекательной из них представляется модель, предложен­ная Цвиккером (Zwicker, 1958). Ее проще всего пояснить, обра­тившись к схеме рис. 121. Примем для простоты, что сигнал яв-

23 Сенсорные системы

353

ляется чистым тоном и что его действие ограничено тем фильтром, центральная частота которого равна частоте тона. При действии одного шума на выходе этого фильтра будут наблюдаться колеба­ния с интенсивностью Р%. Допуская, что между интенсивностью колебаний и величиной импульсации (громкости) на выходе пре­образователя существует степенная зависимость, получим, что громкость, обусловленная шумом, будет равна СР^. При добавле­нии тона к шуму интенсивность колебаний возрастет до (Р^ + Р|), а величина импульсации (громкости) станет равной С (P# + Psf-

Для того чтобы слуховая система могла разделить сигнал от шума, она должна располагать какими-то механизмами измерения прироста импульсации, т. е. вычисления разности С(Р^-\-Рв)В — СР%.

Эта разность и является, по Цвиккеру, значением громкости тона в канале, настроенном на частоту данного тона. Общая гром­кость тона на фоне шума получается путем суммирования таких разностей по всему множеству каналов.

Приняв, что показатель степени 6 равен 0.25, Цвиккер вы­числил теоретическую зависимость громкости тона от его интен­сивности при различных значениях интенсивности маскера. Тео­ретические кривые достаточно близки с экспериментально полу­ченными зависимостями.

Такое же рассмотрение применимо и для случая действия тона в тишине, с той разницей, что теперь роль внешнего шума выпол­няют собственные шумы. Оно позволяет объяснить более быстрый рост громкости тона при малых уровнях интенсивности.

Дальнейшее развитие подхода, предложенного Цвиккером, требует изучения и моделирования механизма, обеспечивающего вычисление прироста импульсации (громкости). Пока можно только предполагать, что этот механизм тесно связан с явлениями адаптации, обнаруживаемыми при физиологических исследова­ниях слуховой системы.

Дифференциальные пороги по интенсивности. Дифференци­альный порог (ДП) по интенсивности обычно рассматривается как мера точности измерения громкости.

Первое методически совершенное исследование ДП было вы­полнено в 1928 г. (Riesz, 1928). Было обнаружено, что значения ДП мало зависят от частоты, но существенно зависят от УЗД — порог резко возрастает при уменьшении уровня интенсивности тона. В области средних уровней и частот дифференциальный порог ^ЦП == 10 lg составляет 0.3—0.7 дб.

На рис. 127 приведена зависимость ДП от уровня ощущения тона (Chocholle, 1955). Дифференциальный порог может быть прёдставлен как 101g^. По данным рис. 127 легко вычислить,

4TolO]g~- изменяется в пределах от 0 дб (на пороге ощущения) 354

до —12 дб при больших уровнях. Дифференциальные пороги для белого шума оказываются довольно близкими к дифференциаль­ным порогам для тонов (Miller, 1947).

Процедура вычисления громкости. Предложена процедура, позволяющая вычислять громкость звука по его спектру (Zwi- cker, 1958; Zwicker, Scharf, 1965). Она основывается на представ­лении, что каждому звуку соответствует определенная кривая распределения плотности громкости по проекции оси частот; общая громкость звука определяется путем интегрирования — вычисления площади под кривой.

Рис. 127. Дифференциальный порог (ДП) по интенсивности ^ДП = 10lg —jв за­висимости от исходной интенсивности (уровня ошущения) тона (по: Chocholle,

По оси абсцисс — уровень ощущения тона; по оси ординат — ДП; а — частота тона равна 200 гц, б — 1000 гц, в — 10 000 гц.

Рис. 128. Зависимость между частотой (по оси ординат) и субъективной высотой (Z, по оси абсцисс), принятая в мо­дели Цвиккера (Zwicker, 1958).

В качестве шкалы, соответствующей слуховой проекции оси частот, принимается шкала Z. Единицей шкалы является барк; один барк соответствует частотному интервалу, равному одной критической полосе. На рис. 128 приведена зависимость между шкалой частот и шкалой Z. Шкалу Z можно интерпретировать как пронумерованный ряд фильтров (см. рис. 121) с возрастающими центральными частотами. Рис. 128 можно тогда рассматривать как указание связи между номером фильтра (канала) и централь­ной частотой фильтра. Если число каналов конечно, определение общей громкости соответствует суммированию громкостей по всем каналам. Плотность громкости в таком случае интерпретируется как значение громкости в одном канале. Единицей плотности гром­кости является сон/барк.

Первый этап построения кривой плотности громкости состоит в конструировании рисунка маскировки, соответствующего за­

23*

355

данному спектру. Это осуществляется с помощью набора стандарт­ных контуров маскировки, экспериментально определенных для ряда узкополосных шумов с различными центральными частотами.

Как обычно, принимается, что величина маскировки на ча­стоте f. отражает энергию колебаний, вызываемых маскером, на выходе фильтра с центральной частотой Д.. Считается, что обна­ружение маскируемого тона происходит при том условии, что энер­гия тона превысит в К раз энергию маскера на выходе фильтра, настроенного на частоту тона; К принимается постоянным во всем диапазоне интенсивностей. Это дает возможность легко вычислить по величине маскировки тона на частоте Д, какова должна быть интенсивность маскера на выходе фильтра с центральной часто­той Д. Вычисленная величина принимается в качестве меры ин­тенсивности данного сигнала в точке шкалы Z, соответствующей частоте Д.

Для перехода от интенсивности сигнала в точке Z. к значению плотности громкости в этой точке (ZV') используется отношение N1 = С [(P2n + — Pn], где P2S вычисленная интенсивность

сигнала, 9, С и P2N константы, принятые в модели.

Хотя отдельные детали предложенной процедуры, которых мы здесь не касались, вызывают возражения, применение ее позво­ляет качественно воспроизвести основные эффекты, наблюдавшиеся при экспериментальном исследовании громкости. Во многих слу­чаях удается получить также вполне удовлетворительное количе­ственное соответствие расчетных и экспериментально полученных величин.

Это дает возможность считать данную процедуру сжатым и формализованным представлением существующей психоакусти­ческой теории громкости.

Ограниченность теории состоит в том, что она пока не рас­сматривает нестационарных сигналов и игнорирует тот.факт, что само слуховое измерение громкости является процессом, происхо­дящим во времени.

ВЫСОТА

Относительное различение высоты тонов. Считается, что высота тонального звука есть результат измерения слуховой системой его частоты (Licklider, 1951b). Точность измерения ча­стоты в слуховой системе человека характеризуется величиной дифференциального порога (ДП).

Как следует из модели процесса различения (см. раздел «Мо­дели и методы психоакустического эксперимента»), величина диф­ференциального порога определяется не только ограничением чув­ствительности слухового анализатора, но также ошибками звена принятия решений. Дифференциальные пороги, определенные с помощью различных экспериментальных процедур, таких, где ис­

356

пользуются разные ответные реакции и возможны различные кри­терии оценок, могут существенно отличаться друг от друга (Har­ris, 1952а). Кроме того, на величину порогов влияют свойства ис­пытуемых — возраст, степень тренированности и т. д.

Приступая к определению дифференциальных порогов, ис­следователи, как правило, стремятся так организовать процедуру опытов, чтобы ответы испытуемых в большей степени отражали свойства слуховой системы, а ошибки реакций сводились бы к ми­нимуму. Обычно наиболее подходящим считается такой способ, при котором удается получить минимальные значения порогов.

Основные методы, которые используются при определении дифференциальных порогов по частоте, описаны в разделе «Мо­дели и методы психоакустического эксперимента».

Одним из наиболее существенных требований при измерении дифференциальной чувствительности по частоте является тщатель­ный выбор и контроль параметров стимулов. Длительность стиму­лов устанавливается достаточно большой, чтобы относительное время переходных процессов, возникающих в слуховом анализаторе в начале и конце звуковых посылок, было мало по сравнению с дли­тельностью стационарного процесса. С целью уменьшить спект­ральные искажения, возникающие при переходных процессах, применяют стимулы с плавным нарастанием и спадом амплитуды.

Существенное значение имеет также установление оптимальной паузы между стандартным и тестирующим сигналами. С одной сто­роны, пауза не должна быть слишком короткой, чтобы избежать взаимной маскировки стимулов, с другой — она не должна быть и очень большой, так как при значительном разнесении сти­мулов во времени на точности их различения начинает сказываться забывание. Увеличение ошибки (повышение дифференциального порога) наблюдается при разнесении стимулов на 1 сек. и больше (библиографию и модель явления см.: Wickelgren, 1969).

Некоторые исследователи предпочитают применять стимулы с непрерывно изменяющейся частотой (Schower, Biddulph, 1931; Zwicker, 1952; Feth et al., 1969). Такое изменение достигается при частотной модуляции тона, осуществляемой по синусоидальному закону с низкой частотой модулирующего сигнала (порядка 2— 4 гц). За дифференциальный порог принимается значение отклоне­ния центральной частоты (девиация частоты), при котором ста­новятся ощутимыми медленные периодические колебания высоты звука.

На рис. 129 приведены данные двух работ (Schower, Biddulph, 1931; Harris, 1952b), которые в настоящее время считаются наи­более обстоятельными и обычно используются при попытках со­ставить теоретическое объяснение механизма слухового восприя­тия частоты (другие литературные данные можно найти в указан­ных статьях, содержащих обзоры более ранних исследований). В работе Шауэра и Бидальфа с помощью метода едва заметных

357

различий измерялись пороги восприятия периодического изме­нения высоты тонов, частота которых модулировалась по синусо­идальному закону с частотой в 2 гц. Исследования Харриса были выполнены с помощью метода постоянных стимулов (АХ-метод) с использованием 2 отдельных стационарных тонов. В обеих ра­ботах дифференциальные пороги были измерены в широком диапа­зоне частот и для нескольких уровней ощущения стимулов (от 5

Рис. 129. Дифференциальные пороги по частоте.

Крестики — по данным Schower, Biddulph, 1931; точки — по данным Harris, 1952Ь. А — зависимость абсолютного значения порогов (осъ ординат, в дб) от частоты стимулов (осъ абсцисс, в гц); Б — зависимость относительной величины порогов (осъ ординат, в дб) от частоты стимулов (осъ абсцисс, в гц). Уровень интенсивности стимулов 30 дб над порогом ощущения.

до 90 дб у Шауэра и Бидальфа и от 5 до 30 дб у Харриса). Приве­денные данные характеризуют чувствительность достаточно трени­рованных людей (усредненные ответы 5 и3 человек). Помимо этого, Харрисом были определены пороги у больших групп испытуемых (от 30 до 90 человек), не имеющих тренировки, в условиях одно­разовых испытаний и получены распределения величин дифферен­циальных порогов у людей с нормальным слухом.

Обе работы дают весьма близкие результаты относительно ве­личин и характера зависимости дифференциальных порогов в об­ласти средних и высоких частот. Наблюдаемое в этой области по­стоянство относительных порогов отмечалось также и в более ран­них исследованиях.

Значения дифференциальных порогов свидетельствуют об очень высокой точности слухового измерения частоты тонов: например,

358

звуки с частотой в области 2000 гц воспринимаются как различ­ные, если они отличаются по частоте всего лишь на 0.1—0.4%.

Однако рассматриваемые зависимости дифференциальных по­рогов от частоты в целом несколько отличаются друг от друга. В области низких частот (до 1000 гц) абсолютные значения по­рогов, измеренные Шауэром и Бидальфом, остаются примерно постоянными (А/=const), а в высокочастотной области быстро возрастают по такому закону, что постоянными сохраняются относительные значения (A///=const). Аналогичный характер зависимости наблюдался в более поздних исследованиях (Zwi- cker, 1952), в которых также использовались частотномодулиро- ванные тоны. В то же время пороги, измеренные Харрисом для отдельных тонов, по своему абсолютному значению монотонно возрастают, а по относительному остаются примерно постоянными почти во всей области частот, за исключением самых низких (62.5— 125 гц).

Существуют некоторые сомнения относительно постоянства относительной величины дифференциальных порогов для сигналов самых высоких частот (Henning, 1966а). Для звуков этой области абсолютные значения порогов не так уж малы, а при большем раз­личии тонов по частоте возрастает возможность большего раз­личия их по громкости за счет неравномерности частотной ха­рактеристики как самого уха, так и электроакустического пре­образователя. В этих случаях человек может основываться при различении тонов не только на разнице их высот, но и на разнице громкостей.

Хеннинг измерял дифференциальные пороги по частоте (ме­тодом АХ) для стимулов, амплитуды которых варьировали в слу­чайном отношении друг к другу. При этих условиях, исключаю­щих возможность для испытуемых руководствоваться различием громкостей, чувствительность к различению высоты на высоких частотах оказалась значительно хуже по сравнению с тем, что наблюдалось при постоянной интенсивности. По результатам Хеннинга относительная величина дифференциального порога ре­гулярно возрастает при увеличении частоты стимулов начиная от 5000 гц и выше и на частоте 10 000 гц оказывается на порядок больше, чем, например, у Шауэра и Бидальфа.

Приводимые данные о значениях дифференциальных порогов по частоте относятся к звукам, характеризующимся некоторым средним уровнем громкости (30 дб над абс. порогом) и доста­точной длительностью (порядка 1 сек.). Однако известно, что при небольших уровнях стимулов и при малых длительностях точность различения высоты понижается. По данным указанных выше работ Шауэра, Бидальфа и Харриса, зависимость диф­ференциального порога по частоте от интенсивности наблюдается только для уровней интенсивности стимулов до 30 дб над поро­гом, а на более высоких уровнях она практически отсутствует

359

(рис. 130). Данные о зависимости дифференциальных порогов от длительности см. в разделе «Накопление информации во вре­мени».

Абсолютные оценки высоты. Проблема абсолютной оценки

высоты с давних пор интересовала психологов в основном в связи с изучением музыкальной одаренности: способность человека

точно узнавать высоту отдельных звуков характеризует наличие

Рис. 130. Зависимость дифференциальных

у человека особого свой- ства — абсолютного слу- ха, интересного феномена, природа и механизм кото- рого является предметом ряда исследований (Теп- лов, 1947; Гарбузов, 1948).

В последнее время за- дача изучения поведения человека при абсолютном узнавании стала вызывать более широкий интерес в связи с общей пробле- мой распознавания внеш- них сигналов. В этом ас- пекте интерес представля- ют как раз сведения, касающиеся поведения на- иболее представительной части людей — людей с обычным слухом. Абсолют-

порогов по частоте от уровня интенсивности стимулов (Harris, 1952b).

По оси абсцисс — уровень интенсивности в дб по отношению к порогу слышимости; по оси орди­нат — абсолютное значение дифференциального порога в гц; параметр кривых (цифры слева от кривых) — частота стандартного стимула в гц.

ное узнавание высоты ис- следуется с помощью экс- периментов, в процессе ко- торых испытуемые иден- тифицируют последова-

тельно предъявляемые оди- ночные стимулы разной частоты, обозначая их одним из заранее принятых симво- лов — нотным знаком или числом. Этот метод предусматривает необходимость предварительного обучения, во время которого испытуемых знакомят с тестовым множеством сигналов (ограни- ченным набором значений частоты) и их обозначениями. Пред- метом анализа служат ошибки ответов.

Существует несколько способов количественного представле- ния данных по абсолютному узнаванию. Наиболее простым яв- ляется определение процента правильных оценок. Более подроб- ный анализ осуществляется при составлении матрицы ответов —

распределения вероятности присвоения каждому стимулу каждого из возможных обозначений.

360

Один из вариантов анализа предусматривает определение по мат­рице ответов количества принятой информации, выражаемой либо в дв. ед., либо числом безошибочно различаемых категорий (изло­жение методов расчета см.: Attneave, 1959). Использование ука­занных характеристик для описания свойств слухового восприя­тия основано на применении в психофизике некоторых положений теории информации. Человек в условиях опытов рассматривается как канал связи, а сами эксперименты ставятся с целью определить его способность передавать информацию, т. е. пропускную спо­собность или емкость сенсорной системы. Предполагается, что основной причиной разрушения информации является наличие внутренних помех случайной природы, ограничивающих емкость канала.

Исследования пропускной способности слуховой системы в ус­ловиях абсолютного различения частоты тональных стимулов, проведенные Поллаком (Pollack, 1952, 1953), показали, что че­ловек может правильно различать не более чем б звуков.

Подробный обзор психофизических данных, характеризующих способность человека передавать информацию при восприятии сигналов различной природы, можно найти в работе Миллера (Miller, 1956).

Более удобное представление данных об абсолютном суждении дает способ определения среднего квадратичного значения флю­ктуаций исходных стимулов вдоль субъективной шкалы измере­ния частоты (вариация высоты — о, разработанный Чистович и Войтинским (1957)). Он дает возможность непосредственно сравнивать между собой точность абсолютного и относительного различения.

Характеризуя точность абсолютных суждений, довольно трудно указать какую-либо одну определенную величину, как бы она ни была выражена. Оказывается, что ошибки, с которыми оценивается высота, могут очень широко варьировать в зависимости от многих факторов, таких как степень обученности, размер тестового множества стимулов, частотный диапазон, природа источника сигналов, состав и количество испытуемых и т. д. Единственное общее утверждение, которое можно сделать на основании всех исследований по данному вопросу, заключается в том, что точность абсолютных оценок высоты значительно уступает точности отно­сительного различения (Войтинский, 1959; Теплов и Борисова, 1957).

По результатам указанной работы Войтинского, подробно из­мерявшего точность абсолютных оценок тональных сигналов, оказалось, что ошибки абсолютных суждений (а) превышают диф­ференциальные пороги по частоте (использованы данные Харриса, 1952) не менее чем в 20 раз.

Пределы флюктуаций высоты существенно меняются в зависи­мости от числа используемых категорий и от диапазона варьиро­

361

вания частот стимулов. Так, если оцениваются звуки из 2 тесто­вых наборов, таких что частотный диапазон варьирования у обоих одинаков, но в одном из них используется большее число градаций, чем в другом, то флюктуация высоты (значение о) будет больше в первом случае. В то же время при одном и том же числе града­ций, но при разном частотном диапазоне флюктуации будут тем больше, чем больше частотный диапазон (Войтинский, 1959; Клаас, 1959). По данным Войтинского, ошибки абсолютных сужде­ний для стимулов из диапазона 500—-2000 гц примерно в 10 раз больше, чем для стимулов из диапазона 980—1020 гц (исходный набор стимулов один и тот же и равен 5).

Точность абсолютных оценок высоты повышается по мере уве­личения тренированности испытуемых (Hartman, 1954). Однако уменьшение ошибок за счет обучения происходит не беспредельно: начиная с некоторого момента (в опытах Хартмана после 4 не­дель тренировки) процесс улучшения затухает и ошибки до­стигают стабильной величины.

Процедурой, при которой также осуществляется абсолютная оценка высоты звука, можно считать голосовое воспроизведение высоты в условиях, когда человек создает ответный сигнал после предварительного прослушивания стимулов с заданной частотой (голосовая имитация высоты). Параметрами ответов в этом случае служат значения частоты основного тона голоса, которые связаны монотонной зависимостью с частотой исходных звуков (Чистович и др., 1968) для области примерно от 100 до 500 гц.

Результаты исследования особенностей голосовой имитации высоты тонов у людей без специальной вокальной тренировки и без музыкального образования показали, что большая часть из этих людей воспроизводит высоту тонов таким образом, что частота основного тона голоса в среднем довольно близко совпадает с ча­стотой исходных звуков, а случайные ошибки (стандартное откло­нение от среднего) составляет 9—30 гц у разных испытуемых (Лю­блинская, 1968).

Шкала высоты. Основные исследования субъективной шкалы высоты выполнены, исходя из предположения о том, что слуховые отображения частоты тонов образуют некоторое непрерывное мно­жество чисел с фиксированным нулем, подчиняющихся правилу отношений (Stevens, 1951). При этом считается, что связь между частотой тона и ее субъективным коррелятом — высотой — может быть выражена одномерной функцией, однозначной в пределах случайных вариаций системы преобразования (зависимость вы­соты от других параметров считается пренебрежимо малой и не принимается во внимание).

Широко распространенными экспериментальными способами определения шкалы высоты служат методы прямого численного шкалирования, разработанные Стивенсом (см. раздел «Модели и методы психоакустического эксперимента»). Им же были пред-

362

Рис. 131. Субъективные шкалы высоты.

А — шкалы, полученные методом «деления пополам» по данным: 1 — Stevens et al., 1937; 2 — Stevens, Volkman, 1940; 3 — Siegel, 1965. В — сравнение результатов прямого численного шкалирования высоты (сплошная кривая и кружки) со шкалой, рассчитанной на основании значений дифференциальных порогов по частоте (пунктирная кривая) (Zwislocki, 1965). Остальные объяснения в тексте. По осям абсцисс — частота тона (в гц, логарифмический масштаб); по осям ординат — единицы измерения высоты (мел).

приняты первые попытки получить вид шкалы высоты с помощью процедуры «деления пополам» (Stevens et aL, 1937). В опытах Стивенса испытуемые устанавливали частоту второго из предъяв­ляемых звуков так, чтобы его высота казалась равной половине высоты первого. За единицу высоты была принята условная ве­личина «мел» (от слова мелодия), выбранная по условию: «частоте в 1000 гц соответствует высота в 1000 мел». Полученная таким об­разом зависимость представлена на рис. 131,4 (кривая 1).

В следующей работе (Stevens, Volkman, 1940) процедура эк­спериментов была несколько изменена: помимо стандартного и переменного стимулов предъявлялся еще один звук с низкой частотой — в 40 гц, который, как предполагалось, должен был помочь испытуемым установить нулевую точку субъектив­ной шкалы. При этом условии была получена функция, несколько отличающаяся от первой (рис. 131, 4, кривая 2).

Функция, представленная кривой 3 на рис. 131, А есть ре­зультат сравнительно недавнего исследования (Siegel, 1965), в котором использовалась та же процедура, что и в первых опытах Стивенса, т. е. деление высоты пополам без предъявления низко­частотного стимула. Наблюдаемое расхождение кривых, получен­ных одним и тем же способом, Зигель объясняет главным образом за счет разницы в возрасте испытуемых (в его опыте были исполь­зованы более молодые слушатели).

Уже эти данные иллюстрируют тот факт, что вид функции, характеризующей шкалу высоты, полученной разными способами и у разных испытуемых, не остается одним и тем же. Бек и Шоу (Beck, Show, 1962), используя для получения шкалы процедуру численной оценки отношения между высотой заданного стимула и высотой стандарта, показали, что наклон функции существенно зависит от частоты стандартного тона. При частоте стандарта 100 гц шкала совпадает со второй из функций, полученной Стивен­сом и Фолькманом, а при частоте 523 гц она приближается к пер­вой (основной) шкале.

Подробное изучение шкалы высоты с использованием разно­образных способов численной оценки было предпринято Хар­рисом (Harris, 1960). Из результатов опытов с уравниванием вы­сотных интервалов (предъявлялись 3 тона с разной частотой, тре­бовалось подобрать частоту третьего, отстоящего от второго на тот же интервал, что второй от первого) оказалось, что характер шкалы систематически зависит от величины исходного интервала. При большом интервале (в частности, 572 гц) подбор равного ему осуществляется в соответствии со второй шкалой мелов Стивенса (рис. 131, 4). Уменьшение интервала приводит к тому, что вос­принимаемый как равный ему интервал становится больше того, который предполагается по шкале и, начиная с некоторой величины (примерно треть октавы), уравнивание осуществляется в соответ­

364

ствии с логарифмической зависимостью, как это предполагается в музыкальной шкале высот.

Численная оценка высоты, как отмечается всеми авторами, сопровождается очень большими случайными ошибками ответов. Особенно велики ошибки в тех опытах, где предусмотрены прямые численные оценки отношений больших, чем 1 : 2 или 2 :1 (Stevens, Galanter, 1957).

Помимо методов прямого численного шкалирования шкалу высоты можно получить расчетным путем по данным о дифферен­циальных порогах по частоте. Этот способ основывается на пред­положении о том, что субъективное расстояние между стимулами, различающимися на Д/ — величину, соответствующую величине дифференциального порога, одинаково для всего множества вос­принимаемых слухом частот (в основе его лежит гипотеза ’Фех- нера о субъективном равенстве ощущений едва заметных различий для всех воспринимаемых человеком сигналов, что используется для построения шкал по методу, предложенному Фехнером и Терстоуном — см. обзор: Галунов, 1969).

Постулирование этого свойства дает возможность получить вид функции высоты P ^F(f) путем суммирования (интегрирования) дифференциальных порогов по всей области частот. На основании допущения о непрерывности функции высоты справедливо со­отношение

dP

(1)

(2)

где ДР — приращение высоты, соответствующее дифференциаль- ному порогу, Д/ — его физическая мера, определяемая экспери- dP

ментально как функция частоты Д/ = Ф(/) и тт-—производная

высоты по частоте. Из уравнения (1) можно определить dP:

dP^ — -df,

интеграл от которого по / дает P=F (f) в виде:

[ ДР М vd/-

(3)

Согласно постулату о равенстве субъективных порогов имеем:

ДР — const = К,

тогда

f

5к -4f-df

-df.

365

Если аппроксимировать экспериментальную зависимость А/= :-ф (/) некоторым аналитическим выражением, то можно получить уравнение для функции высоты P^=KFX (/), в котором коэффициент К, т. е. истинный масштаб функции, остается неопределенным.

Описанная* процедура была выполнена Цвизлоцким (Zwis- locki, 1965), рассчитавшим функцию высоты по данным дифферен­циальных порогов Цвиккера (Zwicker, 1952), найдя соответствую­щую аппроксимацию зависимости А/~Ф (/). При условии, что коэффициент масштабности равен 4.5, получилось достаточно хо­рошее совпадение со шкалой, определенной Стивенсом с помощью методов численных оценок (рис. 131, Б).

Факт совпадения шкал, рассчитанных по дифференциальным порогам и определенных с помощью численных оценок ощущений, рассматривается многими исследователями как подтверждение гипотезы о равенстве пороговых приращений высоты. Однако не следует переоценивать значение этого факта. Достаточно вспом­нить, что экспериментальная зависимость А/=Ф (/) имеет разный вид по данным разных авторов (рис. 129) и результаты Цвиккера, по которым была рассчитана функция высоты, дают только один из ее вариантов.

Значительное расхождение результатов шкалирования высоты по данным разных исследований заставляет думать, что установле­ние вида шкалы высоты нельзя рассматривать как решенную проблему. Серьезные сомнения вызывает основное предположение об одномерности субъективных измерений частоты. Ни одна из предлагаемых шкал не отражает известного свойства октавной близости звуков, которое проявляется главным образом при аб­солютных оценках высоты (Bachem, 1955; Elfner, 1964; Schreiber, 1965) и выражается в том, что требуемое обозначение высоты при­сваивается не данному звуку и даже не ближайшему к нему по шкале частот, а такому, частота которого в два раза больше или меньше. Октавные ошибки свидетельствуют о нарушении моно­тонности множества субъективных измерений частоты, что трудно объяснить с точки зрения одномерного представления.

В связи с этим привлекает внимание идея о том, что слуховое измерение частоты звуков представлено не одномерной величиной, а включает в себя две составляющие, одна из которых отражает собственно высоту (мелодическое качество, т. е. то качество, ко­торое отражено в шкале мелов), а другая — тональную хроматич­ность или тональность. Считается, что тональность присуща только периодическим сигналам, непериодические сигналы, нап­ример шумы с ограниченным спектром, этим свойством не обла­дают. Они могут между собой различаться только по тому признаку, который обозначается собственно как высота.

Первая составляющая представляется некоторым монотонным аналогом частоты, тогда как вторая — цикличным, по типу часо­вого циферблата, так что вся шкала образует как бы спираль 366

(Shepard, 1964). В цитируемой работе были сделаны попытки эк­спериментального обоснования идеи спиральной шкалы, не вы­ходящие впрочем, за рамки качественного рассмотрения.

Высота сложных сигналов. Психоакустические исследования явлений, относящихся к восприятию высоты сложных сигналов (в особенности это касается работ последнего времени) органиче­ским образом связаны с попытками составить представление о ме­ханизме частотного анализа в слуховой системе и не могут быть изложены без их связи с выдвигаемыми гипотезами.

Чистые тоны, для которых так просто определяется физический коррелят высоты, встречаются в природе очень редко. Как пра­вило, человек имеет дело с гораздо более сложными по своему физическому описанию акустическими сигналами, спектр которых состоит из многих частотных компонент. В этих случаях гораздо труднее ответить на вопрос, чем определяется высота звуков.

Одно из самых ранних представлений по данному вопросу было сформулировано в прошлом веке (Ohm, 1843). Оно основывается на предположении о том, что слуховая система осуществляет ана­лиз Фурье, благодаря чему многокомпонентный сигнал в слухо­вом описании представлен набором отдельных составляющих, членов ряда Фурье, каждой из которых соответствует своя ча­стота (или ее субъективный коррелят). Это положение известно в литературе под названием акустического закона Ома. Оно было использовано в качестве основной гипотезы при разработке Гельмгольцем (Helmholz, 1863) модели слуховой системы, которая затем была более детально уточнена. История развития теорети­ческих представлений и экспериментальных исследований по этому поводу изложена в книге Бекеши (Bekesy, 1960).

Согласно закону Ома, сложный сигнал, состоящий из несколь­ких синусоидальных компонент, не связанных между собой гар­моническим соотношением и достаточно широко отставленных друг от друга по шкале частот, должен восприниматься как многовы­сотный и ощущение каждой высоты определяется частотой со­ответствующей компоненты. Если же сигнал гармонический, т. е. частоты его компонент связаны соотношением целых чисел, то он воспринимается как одновысотный комплекс, и его высота определяется компонентой с самой низкой частотой, т. е. первой гармоникой.

Однако, как показали дальнейшие исследования, справедли­вость закона Ома подтверждается далеко не для всех звуков. Существует два различных по своему существу класса явлений, на которые не распространяется закон Ома. В первую очередь действие закона Ома ограничивается разрешающей способностью уха как спектрального анализатора. При малом разнесении со­ставляющих вдоль шкалы частот они не могут восприниматься каждая в отдельности. Наиболее тщательное измерение критиче­ского расстояния между составляющими, позволяющего воспри­

му

нимать на слух отдельные компоненты сложного звукового сигнала, было проведено Пломпом (Plomp, 1964b; Plomp, Mimpen, 1968), который показал, что разделение частотных компонент при вос­приятии возможно в том случае, если расстояние между ними вдоль частотной оси составляет величину, не меньшую, чем ширина «критической полосы» в данной частотной области.

Чем же определяется высота сложных звуков, спектральные компоненты которых различаются по частоте меньше чем на ши­рину критической полосы? Для выяснения этого вопроса исследо­вали восприятие высоты звуков, спектральные компоненты ко­торых (чистые тоны) были сконцентрированы в определенной частотной области (от трети до полной октавы), различаясь на малую величину А/, например 8 гц. Звук с такими свойствами на­зывают «тональной массой». Оказалось, что высота «тональной массы» определяется некоторой средней частотой данного комп­лекса (Ekdahl, Bjoring, 1934).

Центральной частотой определяется также высота шума, энер­гия которого концентрируется в относительно узкой (не шире 2 октав) частотной области (Reinbolt, Schubert, 1968). Такой шум образуется, как правило, путем пропускания белого шума через резонансный или полосовой фильтр с ограниченной полосой про­пускания. Строго говоря, к таким сигналам неприменимо понятие высоты в том смысле, как оно применяется к обозначению высоты тонов и сложных периодических сигналов, так как шумовые звуки не имеют тонального характера. Однако им свойственна определенная высотная окрашенность, позволяющая судить о том, выше или ниже один звук по отношению к другому, что характерно для восприятия высоты, и поэтому можно считать, что этот признак присущ и шумовым звукам. В случае, если белый шум пропущен через полосовой прямоугольный фильтр, ширина полосы которого составляет две и более октавы, он воспринимается как двухвысот­ный и эти высоты определяются граничными частотами полосы (Bekesy, 1963; Reinbolt, Schubert, 1968).

Тот факт, что граница спектральной области шума определяет его высоту, подтверждается также данными о восприятии высоты белых шумов, пропущенных через фильтры низких или высоких частот. В этих случаях высота звуков соответствует частоте среза (Small, Daniloff, 1967). При этом была обнаружена интерес­ная особенность восприятия таких сигналов: их высота подчи­няется октавным суждениям, т. е. человек может легко подобрать к такому сигналу тональный звук, частота которого в два раза больше или меньше частоты среза.

С точки зрения механизма измерения высоты большая часть описанных явлений может быть объяснена, исходя из предполо­жения, что отклик на сигнал периферических отделов слуховой системы (слуховой эквивалент спектра сигнала) подвергается до­полнительной обработке, обеспечивающей выделение особых тоцек

на кривой отклика (максимумов, краев). Положение особых то­чек на слуховой проекции оси частот и является признаком, опре­деляющим высоту сигнала. Рассмотрение различных моделей, способных осуществлять такую обработку, можно найти в работе Молчанова и Лабутина (1966).

Другой класс явлений, на который не распространяется закон Ома и которые, более того, вообще не могут быть объяснены с точки зрения спектрального анализа, включает в себя восприятие высоты периодических сложных сигналов, в спектре которых от­сутствует компонента с частотой, соответствующей воспринимае-

Л

Рис. 132. Форма волны (Z) и спектры (ZZ) резидуальных звуков (схематическое изображение).

А — для импульсных периодических последовательностей, В — для ампли- тудно модулированной синусоиды, В — для периодически прерываемого бе­лого шума. Тои, Том, Тош — период изменения формы волны соответствующего сигнала; / — частота, S (f) — амплитуда спектральных составляющих (гармо­ник). Цифры на НА — номера гармоник.

мой высоте. Примерами таких типов сигналов могут служить периодическая импульсная последовательность, в которой по­давлены низкочастотные гармоники, амплитудномодулированные синусоидальные колебания или периодически прерываемый шум.

На рис. 132 схематически приведены примеры формы звуко­вой волны таких сигналов и картины их спектров. С точки зрения восприятия указанные на рисунке сигналы обладают одной и той же высотой, несмотря на то что спектры этих звуков суще­ственно отличаются друг от друга. Как было показано эксперимен­тально, в первом случае (Л) высота соответствует частоте следо- в а ния импульсов -у- (Schouten, 1940а, 1940Ь), во втором (Z>) — ча-

  • ои

стоте модуляции ™— (Mathes, Miller, 1947) и в третьем (5) — ча-

  • ОМ 1

стоте прерываний шума ™— (Miller, Taylor, 1948). Можно видеть, что в физических спектрах этих звуков отсутствуют компоненты, соответствующие указанным частотам, и основным свойством,

24 Сенсорные системы 369

определяющим восприятие их высоты, являются периодические изменения звуковой волны. Эти и подобные им явления породили представление о том, что в слуховой системе помимо спектраль­ного анализа производится также временной анализ формы зву­ковых возбуждений.

Утверждение настоящего представления в психоакустике имеет свою историю. Впервые явление восприятия высоты периодиче­ских звуков при отсутствии в спектре основной частоты (первой гармоники) наблюдал в прошлом веке Зеебек (Seebeck, 1841, 1843 — цит. по: Schouten, 1940а). Однако долгое время это явле­ние принято было объяснять возникновением субъективных то­нов за счет нелинейных преобразований в слуховой системе (Fletcher, 1935). Действительно, если звук, состоящий из двух синусоидальных компонент, например Д и /2, (/2>/iX проходит через канал с нелинейной характеристикой, то на выходе такого канала в спектре сигнала появятся дополнительные комбина­ционные составляющие, среди которых будет и разностный тон с частотой /2fv Нелинейность слуховой системы служит спе­циальным предметом исследования, и этой теме посвящено много работ, из которых наиболее обстоятельны работы Цвиккера, Пломпа и Голстейна (Zwicker, 1955; Plomp, 1965; Goldstein, 1967). При­сутствие комбинационного тона в спектре анализируемого слухом сигнала можно обнаружить по биениям, которые он образует с дополнительным внешним тоном близкой частоты, либо по на­личию эффекта маскировки (внешний тон маскируется комбина­ционным) .

Однако практически оказывается, что при воздействии на слух многокомпонентного гармонического сигнала присутствие ком­бинационных тонов (наличие указанных эффектов) наблюдается только тогда, когда общий уровень стимулов превышает 50— 55 дб над абсолютным слуховым порогом. В то же время и при более низких уровнях высота этих сигналов совершенно явно воспринимается как соответствующая отсутствующей в спектре частоте, равной разности частот соседних составляющих, т. е. частоте колебаний огибающей (Licklider, 1954; Чистович, 1955; Plomp, 1965).

В сороковых годах настоящего столетия Схоутеном было высказано предположение о том, что восприятие высоты периодиче­ских звуков с отсутствующей первой гармоникой 3 может быть объяснено с помощью механизма измерения периода колебаний звуковой волны (Schouten, 1940а, 1940b, 1940с). Согласно гипотезе Схоутена, слуховую систему следует рассматривать не как чисто спектральный, а как спектрально-временной анализатор, в ко­

3 Для обозначения таких звуков Схоутен ввел термин «резидуе» (resi­due), который в настоящее время часто применяется в литературе для обо­значения всего явления.

379

тором наряду с разложением в ряд Фурье осуществляется анализ временной формы возбуждающих колебаний.

Если рассматривать, как это обычно принято, слуховой ана­лизатор в виде набора фильтров, то при действии резидуального звука, состоящего из ряда высокочастотных гармоник, информация об этом звуке может быть представлена следующим образом. С од­ной стороны, можно получить распределение средних уровней вы­ходных сигналов с каждого фильтра и это распределение будет отражать спектральный состав звука — амплитуду и частоту чле­нов ряда Фурье. С другой стороны, можно анализировать мгно­венные выходные сигналы каждого фильтра, которые изменяются во времени и форма волны которых отражает низкочастотные ко­лебания огибающей резидуального звука. Согласно гипотезе Схо- утена предполагается, что характер распределения средних уров­ней фильтров обусловливает восприятие тембра звуков, а изме­рение периода колебаний мгновенных значений дает возможность оценить высоту. В последующие годы было проведено большое число работ, результаты которых дают серьезные основания считать гипотезу о временном анализе колебаний весьма прав­доподобной (обзор подобных работ и их обсуждение можно найти в статьях: Ritsma, 1962; Schouten et al., 1962).

Нейрофизиологические наблюдения не противоречат этой ги­потезе, так как они показывают, что в слуховом пути картина нерв­ной импульсации оказывается синхронизированной с частотой возбуждающих колебаний (Гершуни, 1940а, 19406) и синхрониза­ция может сохраняться вплоть до высоких частот порядка 3— 5 кгц (Wever, 1949) (см. раздел «Нейрофизиология слуховой си­стемы»).

Сохранение в картине нервной импульсации информации о периодичности стимулов легло в основу предположения о суще­ствовании системы измерения периодов (интервалов между нерв­ными импульсами), модель которой впервые была предложена Ликлайдером (Licklider, 1959). В модели Ликлайдера предпола­гается, что анализ импульсной периодичности осуществляется с помощью нейронных линий задержки в соединении со схемами совпадений, роль которых заключается в представлении периодиче­ского потока импульсов в виде функции автокорреляции.

Наряду с автокорреляционным принципом анализа периодич­ности в последнее время разрабатывается технически более ра­зумная модель, использующая принцип фильтров совпадений (Schief, 1963; Jenik, Adolphs, 1965; Scheiber, 1965; Рохтла, 1966).

Как правило, во всех моделях предполагается, что нейронные структуры, ответственные за анализ периодичности, подключаются своими входами в определенных точках базилярной мембраны и основная обработка временндй информации для данного звука осуществляется на том пути, который связан с областью мембраны, имеющей максимальное смещение.

24*

371

Психоакустические исследования позволили выяснить целый ряд особенностей восприятия высоты сложных периодических звуков, существенных для характеристики системы частотно­временного анализа.

При определении высоты периодических сигналов сложного спектра в большей части работ, как правило, применялась такая процедура опытов, при которой испытуемый настраивает частоту второго из двух предъявляемых звуков (во многих случаях чи­стого тона), добиваясь совпадения обоих звуков по высоте. Уста­навливаемая таким образом частота принимается в качестве оценки высоты исследуемого стимула. Используя указанную процедуру для исследования восприятия амплитудно модулированных ко­лебаний с широким спектром, в частности периодически преры­ваемого белого шума, было установлено, что высотный характер звуков сохраняется при частоте прерываний вплоть до 2000 гц и в этом диапазоне высота соответствует в среднем частоте преры­ваний (Goldstein, 1957; Harris, 1963; Pollack, 1969).

Подавляющее большинство экспериментов по восприятию вы­соты периодических звуков было осуществлено при использова­нии в качестве стимулов амплитудно модулированных (AM) синусоидальных колебаний и периодических импульсных последо­вательностей.

В первом случае сигнал представляет собой синусоидальные колебания некоторой частоты / (частота несущей), амплитуда огибающей которых изменяется также по синусоиде с другой ча­стотой g (частота модуляции) и при этом g<Zf. Спектр такого звука состоит из трех компонентов с частотой / + g и f—g. Степень выра­женности колебаний огибающей зависит от глубины модуляции (т), которая определяется отношением между амплитудами мо­дулирующего и модулируемого колебаний и выражается в про­центах.

В целом ряде работ было показано, что восприятие высоты амплитудно модулированных колебаний зависит от трех факторов: 1) от частоты несущей /; 2) от соотношения частот несущей и огибающей и 3) от глубины модуляции т (Small, 1955;

Чистович, 1956; Ritsma, 1962, и др.). Зависимость эта проявляется следующим образом. Существует определенная область для ча­стоты несущей (примерно от 400 до 5000 гц), в которой только и возможно восприятие тонального характера и оценка высоты ам­плитудно модулированного звука.

Высота звуков для частот несущей в этой области оценивается тем лучше, чем больше глубина модуляции. При этом для каждой частоты несущей можно указать некоторую оптимальную частоту модуляции (или оптимальное отношение —и минимальную глу­

372

бину модуляции (т), при которых тональный характер звука й его высота оцениваются наиболее точно.

На рис. 133 представлены данные, полученные в работе Ритсма (Ritsma, 1962), количественно иллюстрирующие описанные за- висимости. На графике указаны области значений / и g, ограничен- ные величиной тп, при которых восприятие высоты, определяемое периодическим повторением огибающей амплитуды, проявляется наиболее отчетливо.

Данные о зависимости восприятия высоты AM-сигналов от со-

отношения указанных руются с точки зре- ния частотно избира- тельных свойств слу- ховой системы. Для

Рис. 133. Частотные области тонального ре- зидуе для амплитудцо модулированных звуков при различных значе­ниях глубины модуля­ции (данные одного ис­пытуемого) (по: Ritsma, 1962).

параметров довольно хорошо интерпрети-

По оси абсцисс — частота несущей / (в гц); по оси ординат—частота модуляции g (в гц); ограничивающие кривые (сплошная, прерывистая, штрих-пунктирная и пунктирная линии) — глубина модуляции т (цифры у ограничивающих кривых в процентах); пря- мые линии — значения п = — (цифры у прямых). Прерывистая прямая — данные Гес- слера (Gassier, 1954).

того чтобы информация о периодичности низкочастотных колебаний AM-сигналов сохранилась на выходе спектраль­ного анализатора, необходимо, чтобы боковые составляющие были разнесены по частоте не более чем на ширину полосы одного фильтра, центр которого приходится в область частоты несущей. Разнесение составляющих (увеличение g) при данной несущей ча­стоте приводит к большему подавлению амплитуды боковых гар­моник в соответствии с передаточной характеристикой фильтра, а следовательно, и к уменьшению глубины модуляции выходного сигнала. Для того чтобы восстановить необходимую для восприя­тия высоты четкость низкочастотного колебания, требуется по­высить амплитуду боковых составляющих во входном сигнале, т. е. увеличить коэффициент модуляции т.

Существует ряд работ (Zwicker, 1952; Henning, 1966b), в ко­торых удалось показать, что максимальное разнесение боковых составляющих AM-сигнала, при котором возможно резидуальное

373

восприятие его высоты при условий, что глубина модуляций со­измерима с порогом ощущения изменения интенсивности звуков, определяется шириной «критических полос» слуха. Иллюстрация этого факта содержится на рис. 133, где штриховой линией обозна­чена? зависимость ширины «критических полос» от частоты из работы Гесслера (Gassier, 1954), которые, как можно видеть, попадают в область наиболее оптимальных частот модуляции (для частот несущей примерно 400—3500 гц).

Количественный анализ оценок высоты амплитудно модулиро­ванных сигналов показал, что высота соответствует частоте мо- /

дуляции только в тех случаях, когда отношение -у есть целое число,

Рис. 134. Осциллограмма амплитудно модули- рованной синусоиды (по: de Boer, 1956).

/— частота несущей, g — частота модуляции, fp час- тота, соответствующая воспринимаемой высоте данного звука.

т. е. для гармонических сигналов. Высота же звуков, для которых это условие не выполняется, соответствует не частоте модуляции (g), а некоторой другой (§•-[-А/), где Д/ небольшая, но реально заметная величина.

Кроме того, AM-звуки неоднозначны по высоте: при их прослу­шивании ощущается, кроме основной, еще ряд частот, которые человек также способен оценить (Schouten et al., 1962). Неодно­значность высоты резидуальных звуков ощутимо проявляется также при восприятии квазичастотно модулированных сигналов (Ritsma, Engel, 1964), а также импульсных периодических после­довательностей (Flanagan, Guttman, 1960а, 1960b; Guttman, Flanagan, 1964).

Объясняются эти явления тем, что в слуховой системе анали­зируется не сама огибающая, а учитывается тонкая временная структура звуковой волны, включающая колебания более высо­кой несущей частоты. Высота сигналов определяется периодами, равными расстоянию между положительными пиками высоко­частотных колебаний, расположенными вблизи максимумов оги­бающей. Настоящее положение иллюстрируется рис. 134.

374

Исследованию характера отношений между спектральным и временным анализом в слуховой системе посвящена большая серия работ различных авторов, использующих в качестве стиму­лов периодические сигналы с широким спектром — последователь­ности коротких импульсов (Flanagan, Guttman, 1960а, 1960b; Guttman, Flanagan, 1964; Rosenberg, 1965; Ritsma, 1967). Указан­ные работы были предприняты с целью выяснить, в какой области спектра производится анализ временной формы волны огибающей.

В результате многочисленных экспериментов было установлено, что при оценке высоты резидуальных звуков различные составляю­щие участвуют в анализе временной картины с разными весами. Для звуков с частотой следования импульсов от 100 до 400 имп./сек. существует некоторая полоса частот, в области при­мерно от 400 до 2000 гц, которой отводится преобладающая роль, т. е. гармоники в которой имеют максимальный вес. Величина доминирующей полосы различна для звуков с разной частотой сле­дования импульсов (с разной частотой основного тона), ее мини­мальная ширина соответствует области, в которой располагаются 3 или даже 2 гармоники, а именно 3-я, 4-я и 5-я. Конкретные зна­чения могут несколько варьировать для разных людей (Ritsma, 1967).

При этом чувствительность к восприятию высоты в доминирую­щей полосе имеет пороговый характер. Достаточно, чтобы уровень интенсивности гармоник с максимальным весом превышал на 7— 10 дб абсолютный порог независимо от уровня интенсивности других составляющих.

При маскировке или подавлении составляющих в доминирую­щей области оценка высоты основывается на той информации о периодичности, которая содержится в соседних областях.

НАКОПЛЕНИЕ ИНФОРМАЦИИ ВО ВРЕМЕНИ

Установлено, что слуховая система способна накап­ливать информацию о сигнале во времени. Это вытекает из резуль­татов исследований, в которых была показана зависимость поро­гов обнаружения звуковых сигналов от их длительности, воз­растание громкости звука с увеличением его длительности, умень­шение величины дифференциальных порогов по частоте и интенсивности при увеличении длительности сигналов.

Большое число работ посвящено исследованию зависи­мости между интенсивностью и длительностью сигнала, описы­вающей условия порога обнаружения сигнала (Hughes, 1946; Garner, 1947; Feldtkeller, Oetinger, 1956; Zwislocki, 1960; Scholl, 1962a, 1962b). Экспериментальные данные, полученные в таких исследованиях, обычно изображаются в виде графиков, где по оси абсцисс нанесена длительность звука в логарифмическом мас-

375

штабе

а по оси ординат — уровень интенсивности в де-

цибелах (101g .

Экспериментальная зависимость в первом приближении ап-

проксимируется отрезками двух прямых, как это показано на рис. 135, А. При

fC^ioig^c + ioig-^-, (1)

р2 «>tKp101g-^-=C. (2)

Так как £кр, р0 и С являются константами, уравнение (1)

может быть представлено в виде

101g р2+ 101g t = A ИЛИ рЧ = const.

Это означает, что в пределах критической длительности порог определяется энергией сигнала.

Аналогичная зависимость порогов обнаружения звуковых сигналов от их длительности установлена и при измерении поро­гов слышимости тональных посылок на фоне маскирующего шума (Feldtkeller, Oetinger, 1956; Green et al., 1957; Plomp, Bouman, 1959; Scholl, 1962b; Zwicker, Wright, 1963).

Величина критической длительности на пороговом уровне интенсивности сигнала составляет по разным данным 175— 225 мсек. (Garner, 1947; Zwislocki, 1960; Zwicker, Wright, 1963). В некоторых работах установлена зависимость величины крити­ческой длительности от частоты сигнала (см.: Watson, Gengel, 1969).

Приведенная выше аппроксимация зависимости между интен­сивностью и длительностью двумя отрезками прямых является достаточно грубой. Лучшая аппроксимация достигается при допу­щении, что слуховая система ведет себя, как интегратор аку­стической энергии с постоянной времени т порядка 200 мсек. (Zwislocki, 1960). Зависимость между интенсивностью и длитель­ностью сигнала, соответствующая условию постоянства наи­большего мгновенного значения сигнала на выходе интегратора, описывается уравнением: 101g—= С + 10]g(——, где р — пороговое звуковое давление синусоидального сигнала длитель­ностью t, т—постоянная времени.

На рис. 135, Б представлены пороги слышимости синусо­идальных посылок частотой 1000 гц как функция их длительности, сплошная линия — результат вычислений Цвизлоцкого, точки — обозначают экспериментальные данные, полученные в трех рабо­тах (Garner 1947; Feldtkeller, Oetinger, 1956; Zwislocki, Pir- rodda, 1952).

376

Из рис. 135, Б видно хорошее совпадение экспериментальных данных и теоретической кривой. Для сигналов короче 10 мсек, реальный сдвиг порогов оказывается больше вычисленного. По данным большинства исследователей, величина порога сиг­налов короче 10 мсек, снижается на 4.5 дб при удвоении длитель­ности тональной посылки.

Рис. 135. Зависимость порога слышимости от длительности тональных посылок частотой 1000 гц.

1—3 — результаты измерений, принадлежащие разным авторам (I — Garner, 1947; 2 — Zwislocki, Pirrodda, 1952; з — Feldkeller, Oetinger, 1956). Ha А: аппроксимация отрезками двух прямых; на Б — кривая, результат вычислений (Zwislocki, 1960). По оси абсцисс — длительность сигнала в мсек.; по оси ординат — звуко­вое давление в дб от условного уровня. За нулевой уровень отсчета дб принято пороговое звуковое давление сигнала длительностью 1000 мсек.

Объяснения причины отклонения экспериментальных данных от теоретической кривой для сигналов короче 10 мсек, рассмо­трены в работах Гарнера и Шоля (Garner, 1947; Scholl, 1962а, 1962b).

В определенном временном диапазоне субъективная громкость сигнала также является функцией длительности. В ряде работ было показано, что громкость коротких звуков растет с увели­чением длительности таким образом, что уровень громкости прямо пропорционален логарифму длительности. Уровень гром­кости увеличивается в среднем на 3 дб при удвоении длительности сигнала. Указанная закономерность возрастания громкости корот-

377

ких звуков от их длительности сохраняется для звуков узко- полосного спектра практически на всех уровнях интенсивности (Bekesy, 1929; Munson, 1947; Miller, 1948; Port, 1963; Zwislocki, 1965, 1969).

Однако критическое время суммации громкости оказалось

значительно меньшим, чем при суммации на пороговом уровне. Уже Миллер (Miller, 1948) установил, что критическое время суммации для посылок белого шума на уровне 60 дб над порогом слышимости составляет 65 мсек. Близкое значение критического времени суммации 70 мсек, было получено, как видно из рис. 136 и в работе Порта (Port, 1963). Установленное им критическое

время суммации не за- висело от уровня зву- кового давления и спек- тра импульсов.

Рис. 136. Кривая равной громкости узкополосного шума (шириной полосы в терцию, средн, частотой 2.5 кгц), как функция от его длительности (по: Port, 1963).

Кружки — результаты измерений методом пределов, точки — методом установки. По оси абсцисс — длительность сигнала в мсек.; по оси ординат — звуковое давление в дб от условного уровня. За нулевой уровень принято звуковое давление узкополосного шума длительностью 1.2 сек., интенсивностью 60 дб над порогом слышимости.

Вначале для объяснения зависимости величины порогов обнару­жения от длительности сигналов было предложено два объяснения: вероятностное и детермированное.

Вероятностная гипотеза основывается на представлениях о том, что возможность обнаружения сигнала возрастает с увели­чением числа независимых измерений, что прямо пропорционально длительности сигнала (Green et al., 1957; Sheeley, Bilder, 1964).

Детермированная гипотеза основывалась на существовании в нервной системе истинной временной суммации.

Если некоторые экспериментальные данные, полученные при установлении зависимости величины порогов обнаружения от дли­тельности сигналов, достаточно хорошо объяснялись как веро­ятностной гипотезой, так и гипотезой, основанной на истинной временной суммации, то возрастание громкости при увеличении длительности совершенно не могло быть объяснено вероятност­ными моделями.

Как было показано выше, психоакустические характеристики зависимости обнаружения сигналов как функции от их длитель­ности и измерения громкости звука как функции длительности

378

соответствуют таковым для интегратора акустической энергии. При этом постоянная времени интегратора должна быть порядка 200 мсек, для пороговых уровней и порядка 70—100 мсек, для средних и высоких уровней.

Такое поведение слуховой системы могло бы быть объяснимо, если бы интегрирование осуществлялось до преобразования звуковых колебаний в нервную импульсацию. Однако это пред- положение совершенно несовместимо с существующими электро­физиологическими и психоакустическими фактами.

Данные электрофизиологии слухового нерва говорят о том, что преобразование звуковых колебаний в нервную импуль­сацию является практически безынерционным процессом, что дает возможность сохранения в картине нервной импульсации информации о тонкой временной структуре сигнала.

Данные психоакустики свидетельствуют о том, что эта инфор­мация обрабатывается и используется при определении локали­зации источника звука в пространстве, определении высоты слож­ного сигнала и т. д. Из этих данных с необходимостью вытекает, что процесс интегрирования должен осуществляться после прео­бразования механических колебаний в нервную импульсацию, т. е. что интегратор должен быть расположен в центральных отделах слуховой системы.

Для того чтобы сигналы на выходе этого интегратора были пропорциональны энергии акустического сигнала, на первый взгляд, кажется необходимым, чтобы значения входного сигнала интегратора были связаны линейной зависимостью с интенсив­ностью (квадратом амплитуды) звуковых колебаний. Вместе с тем данные психоакустических исследований говорят о том, что близкая к линейной зависимость между громкостью и интен­сивностью звука наблюдается только в области околопороговых уровней. При средних и больших уровнях громкость примерно пропорциональна корню четвертой степени из квадрата звуко­вого давления g—k (p2)Q 2b (см. раздел «Громкость» настоящей главы).

О существенно нелинейной зависимости между величиной импульсации и интенсивностью звука говорят данные электро­физиологии.

Легко заметить, что если бы имело место интегрирование громкости звука, то удвоение длительности посылки должно было бы привести к удвоению громкости, что соответствовало бы увеличению уровня громкости на 12 дб. Это резко расходится с экспериментальными данными, приведенными выше (удвоение длительности соответствует возрастанию уровня громкости на 3 дб).

Анализ этих противоречий был сделан Цвизлоцким (Zwis- locki, 1965, 1969), который показал, что противоречия могут быть сняты, если дополнительно учесть процесс адаптации, т. е.

379

принять, что мгновенная громкость сигнала не сохраняется неизменной на протяжении его звучания, а убывает от начала сигнала к его концу.

Предложенная Цвизлоцким теория базируется на трех основ­ных допущениях: 1) наличии интегратора с постоянной времени 200 мсек., расположенного в центральных отделах слуховой системы; 2) наличии нелинейного преобразования амплитуды сигнала, предшествующего временной суммации, со статическими характеристиками, соответствующими функции громкости; 3) зату­хании во времени процесса на выходе нелинейного преобраз зоват е ля. Рассматривая мгновенную громкость как мгновенную плотность импульсации на выходе ансамбля нейронов, Цвизлоцкий предпо­ложил наличие двух эффектов, обеспечивающих падение плот­ности импульсации с течением времени. Один из них соответ­ствует собственно процессу адаптации и выражается в постепен­ном уменьшении частоты импульсации в каждом отдельном нейроне. Второй эффект отражает изменение относительного числа одновременно разряжающихся нейронов на протяжении последовательных периодов колебаний.

В настоящее время можно говорить лишь о том, что предло­женная Цвизлоцким модель не противоречит физиологическим данным, качественно согласуется с психоакустическими данными и, что весьма существенно, позволяет обойтись без предположения о том, что интегратор изменяет свои свойства (постоянную вре­мени) с изменением уровня сигнала.

Более детальная оценка модели (для случая суммации гром­кости) и удачности выбранных автором значений параметров (их довольно много) затруднена тем, что сами исходные эксперимен­тальные данные обнаруживают значительный разброс.

Другим проявлением способности слуха накапливать инфор­мацию о сигнале является увеличение точности измерения высоты и громкости звуков с увеличением их длительности.

При очень малых длительностях синусоидальные посылки воспринимаются как щелчок, имеющий тональную окраску (т. е. как щелчок того или иного тембра).

Ряд авторов измерили порог тональности, т. е. наименьшую длительность отрезка синусоиды, при которой сохраняется вос­приятие тональности (Biirck et al., 1935а; Turk, 1940; Doughty, Garner, 1947). Было установлено, что для частот синусоидальных посылок в диапазоне 500—8000 гц при уровне звукового давления 100—110 дб (над 0.0002 мкб) порог тональности составляет 4— 5 мсек. Для частоты ниже 500 гц он зависит от числа периодов. Для возникновения ощущения тональности достаточно 2—3 перио­дов. Однако и при больших длительностях, при которых полностью сохраняется ощущение тональности, дифференциальные пороги по частоте зависят от длительности сигналов.

380

Зависимость величины дифференциального порога от дли­тельности сигнала при частоте 1000 гц представлена на рис. 137. На рисунке приведены результаты измерений, проведенных в четы­рех исследованиях (Bekesy, 1929; Oetinger, 1959; Лян Чжи-ань и Чистович, 1960; Cardozo, 1962). Видно, что во всех измерениях при увеличении длительности сигнала вплоть до 150—200 мсек, величина дифференциального порога уменьшается.4 Однако абсо­лютные величины дифференциальных порогов и вид кривых

Рис. 137. Зависимость величины дифференциального порога по ча- стоте от длительности тональных посылок частотой 1000 гц (по: Cardozo, 1962).

1—4 — результаты измерений, при­надлежащие разным авторам (I — Oetinger, 1959; 2 — Лян Чжи-ань и Чистович, 1960; 3 — Bekesy, 1929; 4 — Cardozo, 1962). По оси абсцисс — длительность сигнала в мсек.; по оси ординат — величина дифференциаль­ного порога в гц.

Рис. 138. Зависимость величины диффе­ренциального порога по интенсивности от длительности сигнала (по: Garner, Miller, 1944).

Кружки и точки — результаты измерений двух разных испытуемых. По оси абсцисс — длительность сигнала в мсек.; по оси орди­нат — относительный дифференциальный по-

/Д1\ тт

рог (-у) в вольтах. Параметр кривых — уро­вень интенсивности в дб от порога слышимости. Измерения проведены на частотах 500 и 1000 гц.

у различных авторов различаются, что, по-видимому, связано с существенными отличиями в условиях проведения измерений.

Различение интенсивности в меньшей мере зависит от дли­тельности сигналов, чем различение частоты.

Зависимость величины дифференциального порога по интен­сивности от длительности стимулов (по данным Garner, Miller, 1944) представлена на рис. 138. Из рисунка видно, что эта зави­симость отчетливо выражена при низких уровнях интенсивности (40 дб над порогом слышимости). При большем уровне интенсив­ности (70 дб над порогом) дифференциальные пороги по интен­сивности в меньшей степени зависят от длительности сравнива­емых сигналов. Аналогичное явление обнаружено и в работе

4 Аналогичная зависимость величины дифференциальных порогов по частоте от длительности сигналов получена и в работе Секей (Sekey, 1965).

381

Хеннинга и Псотка (Henning, Psotka, 1969). Авторы установили, что величина дифференциальных порогов по интенсивности, изме­ренная в условиях маскировки, не зависит от длительности сигналов в диапазоне от 20 до 200 мсек, при условии, что сохра­няется постоянным отношение энергии сигнала к спектральной плотности мощности маскирующего шума.

ВОСПРИЯТИЕ ЗВУКОВОЙ ПОСЛЕДОВАТЕЛЬНОСТИ

Данные относительно способности слуха воспри­нимать быстрые изменения сигнала во времени были изложены в разделе, посвященном восприятию высоты сложных сигналов. При рассмотрении экспериментов с амплитудномодулированными тонами и шумами было показано, что разрешающая способность слуха по времени довольно высока. Человек может воспринимать изменения формы звуковой волны, происходящие с частотой более 1000 гц. Однако эти эксперименты еще не характеризуют способность слуха воспринимать изменения сигнала во времени как таковые. Как было показано, сигналы, модулированные с частотой порядка сотен герц, воспринимаются как непрерыв­ные, не меняющиеся во времени звуки. Субъективным коррелятом частоты модуляции оказывается высота. Вместе с тем при опи­сании слуха необходимо располагать данными относительно способности человека воспринимать временную структуру в виде временной же последовательности событий.

Способность слуха воспроизводить изменения звука как тако­вые могла бы характеризовать та предельная частота модуляции сигнала, при которой человек все еще продолжает воспринимать сигнал как изменяющийся во времени, либо та минимальная частота, при которой сигнал приобретает признак высоты. К сожа­лению такой критерий оказывается довольно неопределенным и позволяет получить лишь ориентировочные данные. Так, напри­мер, по данным Уивера (Wever, 1929), ощущение, возникающее при одновременном предъявлении пары тонов разной частоты, изменяется по мере увеличения частотного расстояния между ними следующим образом. При разнице частот менее 6—7 гц человек способен прослеживать изменения громкости суммарного сигнала (биения). При разнице в частотах выше этой величины, но менее 25 гц звук приобретает пульсирующий характер; при больших различиях в частоте отдельные пульсации уже не раз­личаются, и сигнал начинает восприниматься как звук г. При амплитудной модуляции сложных звуков, имеющих спектральные характеристики гласного, наиболее отчетливый звук г возникает при частоте модуляции 40 гц (Christov, 1966). В случае сигнала, образованного путем повторного воспроизведения одного и того же отрезка случайного процесса (шума), ощущение высоты начинает

382

появляться при частоте повторения отрезка 19 раз в секунду и выше (Guttman, Julesz, 1963).

Таким образом, судя по этим данным, по мере увеличения частоты модуляции критерий оценки сигнала последовательно меняется. Первое изменение критерия, видимо, происходит при частоте около 5—7 гц, а второе •— при частоте 19—25 гц или несколько выше. Об изменении критерия оценки при частоте около 5—7 гц позволяют также думать результаты измерения порогов амплитудной модуляции шума. По данным ряда авторов,

Л| 1 1 1 1 1 1 -J 1 1——

О 20 50 100 200 500 1000 2000 10000ги,

Рис. 139. Зависимость длительно- сти временного интервала между началами тонов, достаточного для различения порядка их следова- ния, (At) от частоты отставлен- ного тона (по: В urc k et al., 1935b).

По оси ординат — At в мсек.; по оси абсцисс — частота отставленного тона в гц. Частота первого тона 500 гц.

Рис. 140. Изменение величины обратной маскировки во времени.

По оси абсцисс — интервал между началами сигналов в мсек.; по оси ординат — уровень маскировки в дб. Сплошные линии — маски- ровка тона узкополосным шумом при двух разных уровнях интенсивности маскера (по: Wright, 1964), прерывистая линия — маски- ровка тона тоном (по: Самойлова, 1956). Параметр кривых — уровень маскера в дб.

именно при этой частоте пороги обнаружения амплитудной моду­ляции начинают возрастать (Тумаркина, Дубровский, 1966), а кривая, характеризуюшая дифференциальную чувствительность к частоте прерывания шума, изменяет наклон (Mowbray et al., 1956).

Более эффективным методом оценки способности восприни­мать изменения сигнала во времени являются эксперименты по восприятию последовательности двух разных сигналов. В такого рода экспериментах применяются либо короткие сигналы, непо­средственно следующие друг за другом, либо более длинные сигналы, начало одного из которых запаздывает относительно начала второго, в то время как прекращение обоих происходит одновременно. Слушатель должен определить, какой из двух сигналов, составляющих пару, поступает первым.

Систематические исследования в этом направлении были про­ведены Хиршем (Hirsh, 1959). Им были исследованы стимулы,

383

составленные из посылок двух тонов разной частоты, из посылок тона и шума, из посылок тона со щелчком и посылок шума со щел­чком. Было показано, что для правильного распознавания порядка следования таких сигналов с вероятностью 0.75 необходимо, чтобы интервал между их началами превышал 15—20 мсек. Для всех исследованных стимулов длительность этого интервала оказалась одной и той же. Однако характер зависимости между количеством правильных суждений и длительностью, интервала между сигналами не был исследован в цитируемой работе доста­точно подробно. Более ранние данные (Burck et al., 1935b) сви­детельствуют о том, что длительность интервала между началами тональных сигналов, необходимая для правильной идентификации порядка их следования, зависит от абсолютного значения их частот и от частотного расстояния между ними. На рис. 139 дли­тельность этого интервала представлена как функция частоты одного из тонов, когда частота другого оставалась постоянной и равной 500 гц. Можно видеть, что на краях частотного диапа­зона длительность критического интервала возрастает. Увели­чение длительности интервала наблюдается также при малых различиях между тонами по частоте. При оптимальном соотно­шении частот длительность интервала между началами тонов, достаточная для определения порядка их следования, составляет величину порядка 10 мсек.

Другая группа данных относительно различения последо­вательности сигналов получена в экспериментах по обратной маскировке и остаточной маскировке.

Обратная или предшествующая маскировка проявляется в повышении порога восприятия сигнала под влиянием следующего за ним более громкого сигнала. Впервые этот эффект был обнару­жен Миллером (Miller, 1947). Подробное исследование явления проведено Самойловой (1956). Обычным способом описания обрат­ной маскировки является график, показывающий, насколько повышается порог обнаружения первого сигнала в зависимости от длительности временного интервала до начала второго сигнала (маскера). За порог принимается то значение интенсивности маскируемого звука, при котором слушатель начинает отличать стимул, состоящий из двух сигналов (маскируемого и маскера) от одного маскера. Параметром полученных таким образом кри­вых является либо уровень маскера, либо частота одного из сиг­налов.

На рис. 140 приведены такие кривые, полученные двумя раз­ными авторами и в разных экспериментальных ситуациях. Сплош­ными линиями обозначены кривые, взятые из работы Райта (Wright, 1964). Маскером в данном случае являлся узкополосный шум длительностью 600 мсек, с центральной частотой 1000 гц, а маскируемым сигналом — посылка тона с частотой 1000 гц. Тональный сигнал во всех случаях прекращался за 100 мсек.

384

до конца маскера, а его длительность варьировала от 500 до 1000 мсек. Таким образом, интервал между началами сигналов изме­нялся в|пределах от 0 до 500 мсек. Так как порог обнаружения сигнала зависит от его длительности, при вычислении величины маскировки автором были учтены те изменения порога, которые должны быть следствием изменения длительности тона. Приведен­ные на графике значения были получены после внесения соответ­ствующей поправки.

Кривая, обозначенная на рис. 140 прерывистой линией, постро­ена по данным Самойловой (1956). В данном случае маскером служил тон 1000 гц длительностью 300 мсек., а маскируемым сигналом — посылка того же тона длительностью 10 мсек. В ори­гинальной работе уровень маскировки представлен как функция от длительности интервала между сигналами, на нашем рисунке — как функция интервала между началами сигналов. Можно видеть, что результаты обоих экспериментов удовлетворительно совпадают несмотря на различия в сигналах и экспериментальной процедуре. На кривых Райта четко выделяются три фазы макси- ровки. При длительности интервала между началами сигналов менее 25 мсек, величина маскировки практически не меняется и приблизительно соответствует величине одновременной макси- ровки. Следует думать, что при данных длительностях интервала порядок предъявления сигналов не определяется, и присутствие маскируемого звука определяется так же, как и при одновременном предъявлении сигналов. При интервалах от 25 до 50 мсек, маски­ровка резко падает, но зависимость величины маскировки от уров­ня маскера все еще сохраняется. При больших длительностях указанного интервала эта зависимость исчезает. По данным дру­гих авторов, длительность интервала между сигналами, при кото­рой обратная маскировка перестает обнаруживаться, зависит от интенсивности маскирующего стимула (Гольдбурт, 1964). При малых интенсивностях маскера длительность этого интервала не превышает 20 мсек., а при больших интенсивностях достигает 500 мсек, и даже более. Гораздо более быстрый спад величины обратной маскировки наблюдался при маскировке посылки тона короткой посылкой шума (Pickett, 1959; Elliott, 1962). В этом случае маскировка становится незначительной уже за 15— 20 мсек, до начала маскера. Но и в этих экспериментах небольшое повышение порога можно было обнаружить значительно раньше.

Таким образом, по данным первой группы экспериментов, человек начинает воспринимать временную последовательность сигналов только тогда, когда интервал между ними превышает 10—20 мсек. Эксперименты с обратной маскировкой показывают, что обнаружение сигнала в последовательности заметно ухудша­ется, если интервал между сигналами приближается к 150— 200 мсек. Поскольку временная структура воздействия воспро­изводится на уровне первого нейрона достаточно подробно, влия­

25 Сенсорные системы 385

ние одного сигнала на другой на протяжении длительных перио­дов времени необходимо отнести за счет особенностей обработки информации на более высоких уровнях* К сожалению, в настоящее время еще не существует отчетливых представлений о характере этой обработки. Можно, однако, указать ряд процессов, которые несомненно следует учитывать при рассмотрении изложенных экспериментальных фактов.

Прежде всего способность воспринимать последовательность сигналов должна лимитироваться следующим обстоятельством. Как известно, по мере укорочения сигнала точность его измерения слуховой системой понижается. Существование такой зависи­мости было показано в целом ряде психоакустических экспери­ментов. При распознавании посылок тона оказывается необхо­димым различать два критических значения их длительности — ту минимальную длительность, при которой обнаруживается тональный характер сигнала, и ту максимальную длительность, при которой еще наблюдается увеличение точности определения высоты. Первое значение длительности, по данным ряда авторов, составляет величину около 10 мсек. (Burck etal., 1935а; Doughty, Garner, 1947), второе — величину около 150—200 мсек. (Лян Чжи-ань, Чистович, 1960). Таким образом, существует мини­мальное время наблюдения сигнала, необходимое для выявления и слухового измерения его свойств. Ясно, что для определения порядка следования сигналов необходимо, чтобы результаты измерения отдельных участков звуковой последовательности ока­зались по какому-то признаку разными. Если длительность соответствующего сегмента окажется меньше критической, поря­док следования не будет распознан.

Однако любой механизм накопления информации во времени Tie объясняет зависимость уровня обратной маскировки от дли­тельности интервала между сигналами, если только длительность маскируемого сигнала при всех значениях этого интервала оста­ется постоянной. Таким образом, эффект обратной маскировки требует особого объяснения. Наиболее правдоподобными кажутся два механизма. Во-первых, по мнению ряда авторов, явление обрат­ной маскировки можно объяснить, если допустить, что нервная система передает слабые звуковые сигналы с меньшей скоростью, чем сильные (Elliott, 1962; Wright, 1964). В этом случае слабый и сильный сигналы, предъявленные последовательно, могут ока­заться на каком-то уровне слуховой системы одновременными. Тем самым обратная маскировка может быть сведена к одновре­менной.

С другой стороны, ряд временных эффектов при восприятии звуковых сигналов должен быть связан с процедурой их дальней­шей классификации. Как известно, объем оперативной памяти слуховой системы довольно ограничен. В результате этого при распознавании последовательности должна участвовать процедура

386

перекодирования отдельных сегментов сигнала в некоторое более экономное их описание, которое может сохраняться в нервной системе дольше. В определенном смысле процедуру такого пере­кодирования можно рассматривать как процесс принятия решения о сигнале. В том случае, когда второй сегмент сигнала поступает раньше, чем принято решение о первом, первый сегмент может подвергнуться забыванию. Подобный эффект проявляется осо­бенно четко, когда применяемая испытуемым классификация сигналов не является для него привычной и процесс принятия решения требует много времени (Чистович и др., 1961).

На зависимость обратной маскировки^от "процессов, "связан­ных с принятием отдельных решений о сигнале,указывают экспе­

рименты по маскировке щелчка щелчком (Чисто- вич, Иванова, 1959). По данным этих авторов, об- ратная маскировка щелчка

Рис. 141. Маскировка щелчка щелчком при разных крите- риях обнаружения сигнала (Чистович, Иванова, 1959).

По оси абсцисс — время в мсек., отсчитанное от момента предъявления маскера; по оси ординат — уровень маскировки в дб." Сплошная кривая — сигнал обнаруживается по изменению звучания маскера; прерывистая кривая — сигнал обнаруживается как само’ стоятельное явление.

щелчком практически отсутствует, если слушатель отличает парные щелчки от одиночных по тембральной окраске сигнала (появление хриплости и т. п.). Если же слушатель определяет наличие первого щелчка как такового, не принимая во внимание изменения в характере звучания маскера, кривая предшествую­щей маскировки оказывается приблизительно такой же, как и в случае маскировки тона тоном (рис. 141). По-видимому, при длительных интервалах между " сигналами обратная маскировка возникает постольку, поскольку о каждом из сигналов в данном случае должны быть приняты независимые решения.

Еще одним . гипотетическим механизмом, ограничивающим разрешающую способность слуха по времени, является механизм так называемого'остаточного ощущения/Предполагается, что ощу­щение, вызванное сигналом, исчезает после его прекращения не сразу, а затухает постепенно. При предъявлении последователь­ности из двух сигналов второй из них может быть обнаружен лишь в том случае, если вызванное им ощущение превысит оста­точное. Таким образом, мерой величины остаточного ощущения в некоторый момент времени после предъявления звука может быть та минимальная интенсивность второго сигнала, при которой

25*

387

его присутствие начинает обнаруживаться. Такого рода сообра­жения лежат в основе экспериментов по остаточной маскировке.

Остаточная маскировка проявляется во временном понижении слуховой чувствительности вслед за предъявлением звукового сигнала. Изменение чувствительности можно оценить количествен­но путем измерения порога восприятия второго, пробного звука, предъявленного вслед за первым. Величина, на которую повы­шается порог обнаружения пробного сигнала по сравнению с его порогом при изолированном предъявлении, принимается за уровень маскировки. Измеренная таким образом остаточная

Рис. 142. Изменение величины остаточной маскировки во вре- мени по данным разных авторов.

По оси абсцисс — время в мсек., отсчитанное от конца маскера (на Б в ло­гарифмическом масштабе); по оси ординат — уровень остаточной маски­ровки в дб. А — маскировка тона 200 гц тоном 2000 гц (Rawnsley, Harris, 1952). Б — маскировка шума шумом при трех разных уровнях интенсив­ности маскера (Plomp, 1954).

маскировка оказывается максимальной сразу после прекращения сигнала и постепенно спадает по мере увеличения расстояния между сигналами.

Кроме такого метода определения величины остаточной маскировки, некоторые авторы применяют и другой. В качестве маскируемого сигнала берется более или менее длинная посылка звука, а маскером является наложенный на него прерывистый шум. Порог обнаружения сигнала измеряется для целого ряда частот прерывания шума вплоть до тех минимальных, при которых он оказывается равным порогу восприятия данного сигнала в тишине. Предполагается, что в данном случае порог обнаружения сигнала характеризует тот минимальный уровень остаточной маскировки, который достигается к концу каждой паузы между шумовыми посылками. Таким образом, откладывая величину порога как функцию длительности интервала между шумовыми посылками, можно получить кривую, характеризующую изме­нение остаточной маскировки во времени. Следует, однако, отме­тить, что этот экспериментальный прием не учитывает возможного влияния предшествующей маскировки.

388

Многочисленные исследования были направлены на выясне­ние того, каким образом происходит изменение остаточной маски­ровки во времени. Единодушного мнения на этот счет до сих пор не существует. По данным ряда авторов, остаточная маскировка, выраженная в децибелах, уменьшается на одну и ту же величину за каждую последующую единицу времени (Steudel, 1933; Luscher, Zwislocki, 1'947, 1949; Rawnsley, Harris, 1952). При средних уров­нях интенсивности маскера скорость спада остаточной маскировки варьировала в разных экспериментах в пределах от 0.13 до 0.25 дб на 1 мсек. Полное исчезновение маскировки при уровнях маскера 50—80 дб наблюдалось этими авторами приблизительно через 250 мсек, после прекращения звука. Такое поведение остаточной маскировки имеет место преимущественно при маскировке тона то­ном и только в том случае, когда интенсивность маскера превы­шает 50 дб над порогом.

Совершенно иной характер зависимости остаточной маскировки от времени наблюдался в экспериментах с прерывистым маскером. Как правило, зависимость в данном случае оказывалась близкой к линейной в логарифмическом масштабе времени (Stein, 1960; Burgtorf, 1961). Такая же зависимость была получена Пломпом (Plomp, 1964а) при обработке данных Миллера (Miller, 1948) и при обработке данных собственного эксперимента по восприя­тию паузы между тональными посылками. Графики рис. 142 позволяют судить о том, насколько различной оказывается зависимость величины остаточной маскировки от времени по дан­ным разных экспериментов. По оси ординат на этих графиках отложен уровень маскировки, а по оси абсцисс — время. На рис. 142, А время отложено в линейном масштабе, на рис. 142, Б — в логарифмическом. Тем не менее зависимость в обоих случаях аппроксимируется прямыми.

Разногласия относительно характера зависимости остаточной маскировки от времени можно отнести за счет ряда факторов. Прежде всего при определении величины остаточной маскировки разные авторы применяют совершенно различные процедуры. Кроме того, применяемые в разных экспериментах сигналы отли­чаются по спектральному составу, длительности и т. п. Тем не менее длительность существования остаточной маскировки оценивается многими авторами приблизительно одной и той же величиной. Как правило, через 250—300 мсек, после конца звука маскировка полностью исчезает.

Как уже было сказано, при объяснении явления остаточной маскировки чаще всего прибегают к гипотезе остаточного ощуще­ния. Наряду с этим некоторые авторы предполагают, что в основе остаточной маскировки лежит процесс адаптации. В разделе, посвященном слуховой адаптации, этот вопрос будет рассмотрен более подробно.

389

Суммируя изложенные данные, необходимо сделать следующие выводы. Оценки разрешающей способности слуха во времени,, полученные в экспериментах разного типа, сильно отличаются друг от друга и, видимо, характеризуют процессы обработки сигнала на разных уровнях слуховой системы. Как показывают- данные по восприятию амплитудной модуляции, слуховая система способна воспринимать изменения звуковой волны с частотой более 1000 гц, если даже спектральные признаки таких изменений отсутствуют. Данные нейрофизиологии также говорят о том,, что временная структура сигнала на уровне первого нейрона может быть воспроизведена достаточно подробно.

В то же время эксперименты с восприятием последователь­ности сигналов указывают на участие довольно инерционных про­цессов. О том же свидетельствуют явления временной суммации громкости и ряд других эффектов. Таким образом, разрешающая способность слуха по времени не может быть охарактеризована какой-либо одной величиной. Моделируя временные характери­стики слуха в целом, следует располагать данными о целой после­довательности осуществляемых слухом измерительных и вычисли­тельных процедур. Для этого прежде всего необходимы более детальные сведения о процессах накопления информации во времени и временных характеристиках процедуры принятия решений.

СЛУХОВАЯ АДАПТАЦИЯ

Под слуховой адаптацией понимается повышение слуховых порогов^(понижение чувствительности), возникающее в результате предшествующей звуковой стимуляции.5

Слуховая адаптация характеризуется величиной сдвига поро­гов слышимости и временем восстановления первоначальной, до стимуляции (пороговой) чувствительности.6

Хотя изменения порога наблюдаются после воздействия любо­го надпорогового звукового сигнала (больше 10—20 дб), однако сигналы малой длительности (100—500 мсек.) и умеренной интен­сивности (до 80—90 дб) вызывают лишь кратковременное повы­шение порогов, исчезающее через 200—250 мсек. Слуховая адап­тация сравнительно короткой продолжительности исследовалась рядомгавторов (de Маге, 1939; Harris et al., 1951). Эти кратко­временные изменения часто называются остаточной маскировкой (см. раздел «Восприятие звуковой последовательности»). Допу­скается, что механизмы этих изменений отличны от механизмов, имеющих место при большой длительности и интенсивности

5 Ранние работы по слуховой адаптации могут быть найдены в обзорах Ржевкина (1936) и Гринберга (1937).

6 В клинической аудиологии время восстановления порогов слышимости обозначается как «время обратной адаптации» (Langenheckt 1952; Хилов и Преображенский, 1965),

390

воздействующего сигнала. В настоящем разделе речь будет идти о выраженных изменениях порога слышимости, сохраняющихся на протяжении нескольких секунд и более.

Характеристика процесса восстановления порогов слыши­мости. Можно констатировать, что чем больше времени проходит

после прекращения стимуляции, ние чувствительности. Сдвиг порога, достигающий своего максимума сейчас же после прекращения стимуляции, по- степенно стремится к нулю.

На рис. 143 приведены ре- зультаты ряда работ, в которых адаптация вызывалась длитель- ным воздействием звуков значи- тельной интенсивности. Рис. 143 показывает, что если интервал

Рис. 143. Восстановление пороговой чувствительности после звуковой стимуляции.

10 100 ЮООмин.

По оси абсцисс — время восстановления в мин.; по оси ординат — сдвиг порога в дб Приведенные на рисунке прямые соответствуют данным разных авторов (I — Davis et al. > 1950, стимуляция широкополосным шумом интенсивностью 130 дб, экспозиция 8 мин., тестирование тоном 2000 гц; 2 — Ward et al., 1959, стимуляция широкополосным шумом интенсивностью 106 дб, 12 мин., тестирование тоном 4000 гц; 3 — Ward et al., 1959, сти­муляция широкополосным шумом интенсивностью 90 дб, 117 мин., тестирование тоном 4000 гц; 4 — Князева, 1946, стимуляция тоном 2000 гц, 100 дб, 10 мин., тестирование тоном 2000 гц). Точками обозначены величины сдвига пороговой чувствительности, из­меренные через разные интервалы после прекращения стимуляции.

времени между прекращением стимуляции и началом тестирующего сигнала изобразить в логарифмическом масштабе, кривая вос­становления порога удовлетворительно аппроксимируется линей­ной зависимостью. Можно видеть, что наклон прямых оказывается одним и тем же при разных абсолютных значениях начального сдвига порога. Это дает возможность вычислить время, необхо­димое для полного восстановления, на основании измерения сдвига порога при одном отставлении сигнала от момента пре­кращения воздействия.

Воздействуя тоном 1000 гц интенсивностью 70 дб выше порога слышимости, Гершуни и Волохов (Гершуни и Волохов, 1935) обнаружили дополнительную особенность процесса восстановле­ния. Авторы наблюдали после восстановления первоначальной чувствительности повторное повышение порогов с последующим их восстановлением до исходного уровня. Эта закономерность, характеризующаяся наличием второго максимума, подтвердилась и в других исследованиях (Бронштейн, 1936; Hirsh, Bilger, 1955).

391

На величину возрастания порогов слышимости и длительность процесса восстановления первоначальной чувствительности влияют многочисленные факторы. При стимуляции непрерывным тоном имеет значение его частота, интенсивность и продолжительность воздействия; при воздействии непрерывном шумом — уровень шума, ширина полосы и продолжительность стимуляции. При прерывистых стимулах сдвиг порога зависит от пиковой интен-

дб

т и. Для адаптации диапазоне

сивности, продолжи- тельности и частоты следования импульсов.

Частотные за-

висимое выявления в широком

частот обычно воздейст- вуют тоном одной ка- кой-либо частоты и при этом определяют адап- тацию для других ча- стот.

При стимуляции до 40—50 дб над порогом слышимости наиболь-

Рис. 144. Повышение поро- говой чувствительности для

О 1000 2000 3000 ЬООО 5000 6000 7000 8000гц разных частот после зву- ковой стимуляции.

А — сдвиг пороговой слышимости после 11-секундного раздражения тоном 1000 гц: 1 — интенсивность тона 20 дб над порогом слышимости, 2 — 90 дб (по: Арапова и др., 1950). Б — сдвиг порогов слышимости после 5-минутного раздражения тонами 500, 1000, 2000, 3000 и 4000 гц интенсивностью 100 дб выше порога слышимости (по: Князева, 1946). На А и Б: по оси абсцисс — частоты в гц, на которых производилось измерение порогов слышимости; по оси ординат — сдвиг порогов в дб. На Б: цифры на каждой кривой обозначают частоту стимулирующего звука в гц.

шее повышение порога наблюдается на частоте раздражения. Кривая адаптации, как видно из рис. 144, Л, симметрична отно­сительно частоты стимулирующего тона и по своей конфигурации напоминает резонансную кривую. При интенсивности стимуляции выше 60 дб максимальный сдвиг порога смещается к более высо­ким частотам и кривая становится асимметричной (Князева, 1946; Causse, Chavasse, 1947; Davis et al., 1950; Арапова и др., 1950; Hood, 1950). Максимальное понижение чувствительности после продолжительного воздействия тонами наблюдается на ча­стоте, лежащей примерно на пол-октавы выше частоты стимуля­ции (рис. 144, Б).

392

Выше речь шла об адаптационных изменениях, вызываемых тоном определенной частоты в широком диапазоне частот. Рас- смотрим, каковы изменения порогов при разных частотах утомля- ющего тона, когда частоты стимулирующего и тестирующего сигналов совпадают.

Уже ранние исследования показали, что при одном и том же уровне звуковой стимуляции величина сдвига порога в значитель- ной степени зависит от частоты утомляющего тона. На рис. 145 показано, что величина сдвига порога возрастает с повышением частоты. Зависимость еще более выражена для стимулов макси- мальных интенсивностей (Davis et al., 1950). Так, при действии

звука интенсивностью 130 дб составляет для 500 гц — 20 дб, для 1000—2000 гц — 40 дб, для 4000 гц — 65 дб.

При стимуляции уха шу- мом наибольшие изменения порога обнаруживаются для

Рис. 145. Сдвиг порогов на частоте воздействия после прекращения стимуляции (по: Causse, Cha- vasse, 1947).

в течение 12 мин. сдвиг порога

По оси абсцисс — частоты в гц, на которых производилось измерение порогов слышимости; по оси ординат — сдвиг порогов в дб. Точками обозначены величины сдвигов пороговой чувствительности через 25 сек. после прекращения стимуляции (30 дб выше порога слы­шимости, экспозиция 40 сек.).

тонов от 2 до 6 кгц. Идентичная картина наблюдается при воздействии промышленного шума, вызывающего про­фессиональную тугоухость (Ruedi, Furrer, 1947; Yokoyama et al., 1967). Наличие выраженной адаптации к высокочастотным составляющим шума рассматривается, с одной стороны, как резуль­тат слабого защитного рефлекса мышц среднего уха (Simpson, 1949; Schuknecht, Tonnford, 1960), а с другой — как резуль­тат естественного резонанса звукопроводящих структур наруж­ного и среднего уха (Onchi, 1966).

Влияние интенсивности стимуляции. Од­ним из основных вопросов, который необходимо решить для коли­чественной характеристики слуховой адаптации, является воп­рос о зависимости сдвига порогов от интенсивности стимулирую­щего сигнала. Исследования, проведенные рядом авторов, пока­зали, что понижение чувствительности на частоте раздражения обнаруживает постоянство при изменении интенсивности стиму­ляции в пределах от 20 до 90—100 дб (Арапова и др., 1950; Lierle, Reger, 1954; Selters, 1964), Лишь дальнейшее увеличение интен­

393

сивности стимулирующего звука выше 100 дб приводит к зна- чительному возрастанию сдвига порога на частоте раздражения (Davis et al., 1950; Hood, 1950).

Влияние продолжительности стимуля- ции. Большинство авторов, исследовавших влияние продолжи- тельности стимуляции на величину адаптационных изменений,

варьировали длительность стимулирующего звука в пределах от 10 сек. до 64 мин. Результаты измерений, проведенных разными авторами, представлены на рис. 146. Как видно из рисунка, величина сдвига порога обнаруживает линейную зависимость

от логарифма времени, что наблюдалось и в случае восстановления пороговой чувствительности.

Таким образом, было рассмотрено изолирован- ное действие на адапта-

Рис. 146. Зависимость сдвига порога от продолжитель- ности стимуляции.

По оси абсцисс — продолжительность стимуляции в мин.; по оси ординат — сдвиг порога в дб. Приведенные на рисунке прямые соответствуют данным разных авторов: 1 — Da­vis et al., 1950; стимуляция тоном 2000 гц интенсивностью 110 дб; 2 — Hood, 1950, соот­ветственно 2000 гц, 110 дб; 3 — Князева, 1946 — 2000 гц, 100 дб; 4 — Causse, Chavasse* 1947 — 800 гц, 40 дб.

цию таких факторов, как частота, интенсивность и про­должительность стимуляции и частота тестируемого сигнала. Зависимость между указанными факторами до сих пор не удалось представить в виде единой формулы, и вопрос о точной коли­чественной характеристике процесса адаптации все еще оста­ется открытым (Ward, 1963).

Разрешение этого вопроса затрудняет^значительная вариа­бельность адаптационных изменений у разных испытуемых, а также у одного и того же испытуемого при повторных исследо­ваниях.

Пороговая адаптация. До сих пор речь шла дб адаптационных изменениях, наступающих после стимуляции звуками надпрроговых интенсивностей.

В последнее время были проведены исследования изменений слуховой чувствительности, вызываемых воздействием звуковых стимулов пороговых интенсивностей (Earhart, 1957j Sorensen. 1967).

Метод исследования слуховой адаптации при действии непрет рывного тона пороговой интенсивности называется пороговой

394

адаптацией или тестом исчезновения порогового тона — Топе decay test. Исследование основывается на определении той поро­говой интенсивности тона, при которой он воспринимается в тече­ние 60—90 сек. Процедура заключается в предъявлении непре­рывного тона пороговой интенсивности до его исчезновения, после чего интенсивность увеличивается шагами по 5 дб до дости­жения стабильного уровня порога восприятия тона. За величину адаптации принимается разница между исходной величиной пороговой интенсивности тона и тем окончательным уровнем, который был обнаружен в течение указанного промежутка вре­мени.

Результаты исследований показали, что величина пороговой адаптации не превышает 10—15 дб у нормально слышащих, но резко увеличивается при некоторых ретрокохлеарных пораже­ниях.

Громкостная адаптация. Измерения основаны на суждении испытуемого о громкости двух выслушиваемых им звуков. В начальный период исследования стимулы предъ­являются на оба уха в неадаптированном состоянии. Интенсив­ность стимула, предъявляемого на сравниваемое ухо, регули­руется до тех пор, пока оба звука не будут казаться равногром­кими, либо пока не будет достигнуто суждение о локализации звука в середине головы, в зависимости от применяемой мето­дики. Во второй период подается непрерывный стимул на адапти­руемое ухо. Повторный баланс громкости проводится либо в про­цессе стимуляции, либо с момента ее прекращения. Этот метод дает возможность изучать адаптацию надпороговых уровней.

Ряд исследователей изучал громкостную адаптацию вТпро- цессе воздействия адаптирующего стимула (Bekesy, 1929; Hood, 1950; Palva, 1955; Karja, 1968), другие — после стимуляции (Pearce, 1935; Thwing, 1955).

Данные, полученные для разных частот, показали, что вели­чина громкостной адаптации является наименьшей для частот 125 и 250 гц (соответственно 5 и 8 дб), возрастает для 500 гц до 15 дб и достигает максимальных величин для 1000—8000 гц (24—25 дб). Уже в первых работах было показано, что максимальное падение громкости возникает на частоте воздействия (Peorse, 1935). Умень­шение громкости во времени протекает очень быстро в первые 15 сек. от начала стимуляции, затем процесс резко замедляется, протекает асимптотически и достигает, по мнению большинства авторов, стабильных значений к 1—3-й минутам. Однако неко­торыми авторами (Jerger, 1957) было показано, что процесс закан­чивается к 3-й минуте только для низких частот стимуляции (125—500 гц), для более высоких частот он продолжается дольше.

Что касается процесса восстановления ощущения громкости после прекращения звуковой нагрузки, то всеми авторами отмечается, что восстановление протекает значительно быстрее,

395

однако между полученными данными существуют большие рас- хождения. Так, по данным одних авторов (Hood, 1950), время восстановления колеблется от 10 до 40 сек., по данным других (Thwing, 1955) оно достигает 2—3 мин.

Значительные расхождения получены и при определении зависимости величины громкостной адаптации от продолжитель- ности предъявления звуковой стимуляции. Результаты, получен- ные разными авторами для тона 800—1000 гц, предъявляемого в течение 1 мин. при интенсивности 60—80 дб над порогом слы- шимости оказываются близкими: от 7 до 15 дб. При увеличении

экспозиции до 3 мин. ре- зультаты колеблются от 5 до 35 дб (рис. 147).

Сомнительность пред- положения о полной не- зависимости ушей при громкостной адаптации и, следовательно, воз-

Рис. 147. Зависимость гром- костной адаптации от про- должительности стимуля- ции (по: Harbert et al., 1968).

По оси абсцисс — продолжительность стимуляции в сек.; по оси ординат — величина громкостной адаптации в дб. Кривые соответствуют данным разных авторов: 1 — Wood, 1930 (цитировано по: Harbert et al., 1968); 2— Hood, 1950; 3 — Jerger, 1957; 4 — Thwing, 1955; 5 — Bekesy, 1929; 6 — Harbert et al., 1968; 7 — Egan, Thwing, 1955; 8 — Hallpike, Hood, 1951.

можность возникновения адаптации в тестируемом ухе — все это отчасти может объяснить пестроту данных, полученных разными исследователями.

О природе слуховой адаптации. В ранних работах по исследо­ванию слуховой адаптации временный сдвиг порога рассматри­вался как процесс, протекающий в самой улитке (Лазарев, 1923; Huizing, 1948; Hood, 1950; Комарович, 1955). Указанные авторы искали корреляцию между величиной адаптации и ускоренным нарастанием громкости, характерным для поражения волоско­вых клеток улитки. В последующих исследованиях, при воздей­ствии звуками малых интенсивностей, полученные симметричные кривые изменений чувствительности также позволили предпо­ложить, что адаптация разыгрывается в чувствительном эпи­телии органа Корти. Асимметричный характер кривых при даль­нейшем увеличении интенсивности стимуляции истолковывался как явление, протекающее в центральных отделах слухового анализатора (Арапова и др., 1950; Hood, 1950; Гершуни и Кня­

396

зева, 1959). Однако в электрофизиологических исследованиях при низких уровнях стимуляции не удается обнаружить изме­нения электрических потенциалов улитки. Между тем эти изме­нения наблюдаются при исследованиях слухового нерва (Galam- bos, Davis, 1943), верхнеоливарного комплекса (Goldberg et al., 1964) и некоторых других отделов слуховой системы. Исходя из этого, Лоуренс и Янтис (Lawrence, Yantis, 1957) предполо­жили, что адаптация при низких уровнях стимуляции характерна для ретрокохлеарных отделов анализатора. Что же касается действия звуков больших интенсивностей (более 100 дб), то авторы считают, что в этом случае к адаптации центральной природы присоединяется явление, протекающее на периферии.

Хирш и Билджер (Hirsh, Bilger, 1955), наблюдая двухфазный характер восстановления пороговой чувствительности, разли­чают два процесса: Rr вызывающий повышение чувствитель­ности, непродолжительный (до 1 мин. после прекращения звуковой стимуляции) и 7? 2 — монофазный процесс, вызывающий пони­жение чувствительности и зависящий от интенсивности стимуля­ции. Повторное повышение порогов слышимости объясняется временными нарушениями кохлеарного метаболизма, насту­пающими при значительных уровнях звукового воздействия (преобладание процесса /?2). При малой выраженности процесса R 2 преобладание R± может вызвать явление сенсибилизации.

Если в процессе исследования сдвига порога предъявлять шум незначительной интенсивности на контрлатеральное ухо, то постстимуляторный сдвиг окажется меньше и период восста­новления сократится. Последнее демонстрирует влияние контр­латеральной стимуляции на адаптацию, что следует рассматри­вать как явление центральной природы (Maspetiol et al., 1961).

Ряд других факторов также свидетельствуют о центральной природе адаптационного явления. Так, слуховая чувствительность значительно уменьшается при одновременном воздействии боле­вых раздражителей, затемнении глаз, при фармакологических и психофармакологических воздействиях на центральную нерв­ную систему (Гершуни и Волохов, 1935; Темкин и Шейхон, 1955; Трауготт и др., 1968).

Из изложенного видно, что вопрос о механизмах адаптацион­ного явления далеко еще не решен и требует дальнейшего изуче­ния.

Соседние файлы в папке Оториноларингология