Эта часть книги очень важна для музыкантов и сочувствующим им индивидуумам. В том, как человек определяет высоту звука, ноты "на слух" настолько много всякой ерунды написано, что это просто удивительно. А ведь высота звука, ноты, соотношение высот звуков - ключевая вещь для каждого музыканта.

Природа при изготовлении приспособления для определения высоты звука человеком поступила, как всегда, настолько затейливо, но, в то же время изящно, что непонятно - как это вообще все работает, остается только восхищаться демиургом! (текст базируется на материалах И.А.Алдошиной и других материалах по психоакустике)

Слушаем музыку и получаем удовольствие!

2.3. Как мы определяем высоту звука?

Определение высоты звуков, которые мы слышим, — основная задача нашей слуховой системы. Именно по высоте звука (наряду с тембром) мы различаем и группируем различную информацию. Речь без мо- дуляций и интонирования по высоте — безжизненна и малопонятна, в многотоновых языках, например китайском, вообще будет неясно, о чем человек говорит, если он говорит на одном тоне, на одной высоте звука. Также, естественно, на определении высоты звуков построена и вся музыка, которую мы слушаем — или не слушаем.

 

Важность определения высоты звуков для слуховой системы не случайна и, вероятно, вовсе не является результатом стремления всего

человечества сочинять музыку. Восприятие высоты играет основную роль в определении различных объектов в мире звуков и сепарирова- нии, отделении их друг от друга. Природа вокруг нас наполнена разно- образными конкурирующими звуками: интересными, угрожающими, шумовыми. Все смешалось, и слуховая система несет ответственность за их выделение, идентификацию и классификацию. Высота звука есть главный индикатор, позволяющий отделять важный звук от дру- гих звуковых объектов.

Хотя в природе, конечно, не бывает простых звуков с одной вы- деленной частотой, синусоидальных, однако начнем мы с них — для простоты.

Высота простых звуков

Было проведено множество экспериментов по определению того, на- сколько точно мы можем различать два звука по высоте. В среднем диапазоне частот (область речи, музыки) слуховая система может раз- личить по высоте два звука, отличающиеся всего на 0,2% по частоте. Это очень высокая точность.

 

Ниже частоты 500 Гц слуховая система может выделить примерно 140 градаций высоты тона, в диапазоне от 0,5 кГц до 16 кГц — при- мерно 480 градаций высоты тона (всего 620 градаций). В европейской музыке инструменты с равномерно темперированной шкалой исполь- зуют порядка 100 градаций высоты тона, а не 620. Это обстоятельство вселяет оптимизм во многих музыкантов, пишущих и играющих му- зыку в древних и микротоновых музыкальных строях. А оптимизм — важная вещь для человека, без него сложно жить в нашем мире.

 

Ощущение высоты чистого тона (одной частоты) связано не толь- ко с частотой, но и с интенсивностью звука и его длительностью. Как показали различные исследования, при повышении интенсивности громкие низкие звуки кажутся еще ниже (!), а высокие звуки кажутся еще выше (!). Для средних частот 0,5–2 кГц влияние интенсивности незаметно. Эта зависимость для простых звуков незначительна, а для сложных музыкальных звуков почти незаметна. Что является великим счастьем для музыки, так как иначе при переходе от pp к ff звуковысо- тные отношения между нотами (мелодия и гармония) были бы нару- шены, а музыканты, занимающиеся дома, играющие специально тихо, чтобы не ругались соседи, сходили бы с ума, ведь музыка, которую они играли бы дома, и музыка, исполняемая на концертном рояле на кон- церте в концертном зале, разительно отличались бы. Бы. Но природа пожалела музыкантов.

 

Восприятие высоты звука зависит и от его длительности, но об этом мы уже говорили.

Высота сложных звуков

В музыке простые синусоидальные тоны не используются. Каждый музыкальный тон имеет сложную структуру, состоящую из основного тона, гармоник и обертонов.

 

Однако можно установить соответствие по высоте музыкального тона, например ноты

ля

1-й октавы, и чистого синусоидального сигнала с частотой 440 Гц. Воспринимаемые нами высоты звуков будут одинако- выми, но тембры — разными. Это свидетельствует о том, что для слож- ных периодических сигналов высота определяется по частоте основно- го тона (первой гармонике), так как именно он соответствует 440 Гц.

В музыке используются свои шкалы для сравнения различных нот по высоте — полутоны, тоны, квинты, октавы и другие музыкальные интервалы. Связь с психофизической шкалой высоты звука, построен- ной для чистых тонов, неоднозначна. До частоты примерно 5 кГц уве- личение высоты тона на октаву связано с удвоением частоты. Напри- мер, переход от ноты

ля

1-й октавы к ноте

ля

2-й октавы соответствует увеличению частоты от 440 до 880 Гц. Но выше частоты 5 кГц это пра- вило нарушается. Чтобы получить ощущение увеличения высоты на октаву, в 2 раза, нужно увеличить соотношение частот почти в 10 раз! При создании компьютерных и электронных композиций нет ограни- чений для того, чтобы воспроизвести какой-либо звук какой-либо час- тоты, есть только ограничения, связанные со вкусом человека. Поэтому создавать музыкальные произведения на компьютерах и синтезаторах нужно аккуратно. Как, впрочем, и детей, даже без предварительного компьютерного моделирования.

Ученые-акустики предложили две размерности высоты тона: психофизическую в мелах, пропорциональную логарифму частоты и установленную для чистых тонов (pitch height), и музыкальную, со- ответствующую названию нот (pitch chroma), которая может быть оп- ределена примерно до 5 кГц. (Интересно, что даже музыканты с абсо- лютным музыкальным слухом затрудняются в определении названий нот для звуков с частотой выше 5 кГц.)

 

Для объяснения механизма восприятия высоты как простых, так и сложных звуков используются две основные теории: теория места и временна

́

я теория.

Теория места

Почему эта теория называется теорией места? Базилярная мембрана вкупе с кортиевым органом способна выполнять частотный анализ сложного звука, то есть действовать как спектраль- ный анализатор (выполняя прямое преобразование Фурье). Базилярная

мембрана организована весьма замысловатым образом. Каждый тон (каждая частота) имеет свое место (свою топографию) размещения на мембране, это свойство еще называется «тонотопическим». Звуковой сигнал вызывает появление на базилярной мембране волны, но стран- ная особенность возбуждения мембраны состоит в том, что максимум смещения стоячей волны разных частот располагается в разных же, определенных местах базилярной мембраны. Низкие частоты имеют максимум смещения вблизи вершины мембраны, высокие — вблизи овального окна. Природа этой особенности не вполне ясна. Каждая час- тота также имеет свое место максимума возбуждения на мембране, за- висящее от тембра звука (спектрального состава, гармонического спек- тра). Волосковые клетки сообщают мозгу, какие частоты присутствуют в спектре звука. Таким образом, информация о звуке в мозг передается в виде кода, матрицы, основанной на том, нейроны каких участков ак- тивны, а каких — пассивны. Определяемая высота звука меняется при этом скачкообразно, ведь количество волосковых клеток и нервных кле- ток ограничено, а частота звука может меняться как угодно плавно.

Строго говоря, для сложных звуков, содержащих множество гар- моник, это не совсем так. Ведь только для одной гармоники высота звука будет меняться скачкообразно при изменении частоты. Ког- да слышимое количество гармоник велико, они попадают на разные участки «полосовых фильтров», левее, правее максимума. И эффект скачкообразного изменения восприятия высоты тона сглаживается, почти нивелируется.

 

Изменение реакции волосковых клеток от частоты звука

 

 

Таким образом, можно считать, что наша слуховая система содер- жит банк, набор «полосовых фильтров» (слуховых фильтров, пропус- кающих лишь звуки узкого диапазона частот) с перекрывающимися полосами. Их ширина выше 1 кГц составляет примерно 10–17% от центральной частоты. Например, на частоте 1 кГц ширина полосы со- ставляет 160 Гц. С шириной слуховых фильтров связано известное по- нятие «критическая полоса» — внутри нее звуковая информация сум- мируется, интегрируется слухом. Если мы выйдем за пределы полосы,

 

произойдет скачкообразное изменение слуховых ощущений, что под- тверждается многочисленными экспериментами. Наверное, это похоже на расческу, лучше всего не прямоугольной формы, а изогнутую. Зубья расчески соответствуют определенной полосе звука; проводя пером руч- ки Mont Blanc по зубьям расчески, мы услышим меняющиеся по высоте звуки. Теперь постарайтесь засунуть эту расческу себе в ухо. Впрочем, подождите и дочитайте книгу до конца. Потом.

 

Итак. В соответствии с теорией места, при восприятии музыкаль- ного звука для слуховой системы существуют три возможности, три метода определения высоты звука:

 

1) определить, локализовать место на базилярной мембране ос- новной (фундаментальной) частоты, первой гармоники и по нему (по месту) определить высоту тона;

 

2) найти минимальную разницу между соседними гармониками, которая при этом будет равна фундаментальной частоте (n + 1)f

0

– nf

0

= = nf

0

+ 1f

0

– nf

0

= f

0

, где n = 1, 2, 3... — и принять ее за высоту звука;

3) найти общий наибольший сомножитель, который получается при делении частот всех гармоник на последовательные целые числа, и использовать его в качестве высоты звука.

 

Сомнения в правильности первого метода возникли, когда стало возможным электрическим путем синтезировать спектры сложных звуков. В 1940 году Шутен продемонстрировал, что ощущение высоты тона сложной периодической волны не изменится, если в музыкаль- ном тоне вырезать фундаментальную частоту (первую гармонику).

 

а) б)

 

в) г)

На рисунке

а

изображена форма сигнала, музыкального звука, соответствующего приблизительно ноте

соль

малой октавы (200 Гц), включающего в себя звуки частотой 200 Гц (фундаментальная часто- та), 400, 600 и 800 Гц. Спектр этого сигнала изображен на рисунке

б

.

Звук с формой сигнала как на рисунке

в

также ассоциируется с нотой

соль

малой октавы (200 Гц), однако он не содержит в своем спектре (рисунок

д

) звука с частотой в 200 Гц, а содержит лишь часто- ты 400, 600 и 800 Гц. Это явление называется «феномен пропущенной фундаментальной».

Из рисунка видно, что присутствие фундаментальной частоты (первой гармоники) не обязательно для восприятия высоты и что низ- шая частота не всегда является основой определения высоты звука (!).

 

Эксперимент этот получил название «феномен пропущенной фундаментальной» и доказал, что первый метод не может служить единственной базой для определения высоты сложного тона, хотя он работает для подавляющего большинства музыкальных звуков.

 

То есть еще проще, если мы имеем звук с основной частотой 100 Гц и гармониками в 200 Гц, 300 Гц, 400 Гц и т.д., наше ухо счита- ет, что мы слышим тембрально окрашенный звук высотой 100 Гц. Ес- ли мы вырежем с помощью современной техники первую гармонику в 100 Гц и оставим только гармоники в 200 Гц, 300 Гц, 400 Гц и т.д., то мы услышим все равно звук частоты 100 Гц, только с несколько отли- чающимся тембром. Важно это помнить, когда мы говорим о низких музыкальных звуках, например звуках больших органных труб. Там самый низкий звук, первая гармоника может лежать вне слышимого диапазона, но мы тем не менее опознаем этот звук как музыкальный и можем определить высоту его тона.

 

Однако с помощью компьютерных технологий можно создать ситуацию, которую не удастся объяснить и с помощью этого метода. Например, рассмотрим звук, в котором присутствуют только нечетные гармоники, скажем, 100 Гц, 300 Гц, 500 Гц, 700 Гц. Если фундаменталь- ная частота, первая гармоника есть в спектре, то слух определяет высо- ту по ней, 100 Гц. Если ее вырезать, то расстояние между гармониками останется 200 Гц, но слух продолжит определять высоту тона, равную фундаментальной, также 100 Гц.

 

Третий метод позволяет объяснить и пропущенную фундамен- тальную, и наличие только нечетных гармоник, так как от отсутствия каких-то гармоник общий наибольший сомножитель 100 Гц не меня- ется. Данный метод позволяет также объяснить восприятие слабого ощущения высоты тона у колоколов и других не вполне периодичес- ких звуков.

 

В рамках теории места гармоника звука опознается, если «кри- тическая полоса» слухового фильтра, соответствующая этой частоте, достаточна узкая и соседние гармоники внутрь этого фильтра не попа-

 

дают. Если гармоники находятся настолько близко по частоте друг от друга, что внутрь одного слухового фильтра попадает несколько гар- моник, то они не разворачиваются, то есть не распознаются раздельно. Какой бы ни была фундаментальная (базовая, основная) частота, слу- ховой механизм разворачивает (различает раздельно) только первые 6–7 гармоник — именно они и являются основными при определении высоты звука.

 

Но теория места не может объяснить ряд экспериментально об- наруженных фактов, например очень высокую точность определения высоты звука для тонов, чьи частотные компоненты не разворачива- ются, то есть для звуков с гармониками выше седьмой.

Временна ́я теория

Временна

́

я теория восприятия высоты основывается на анализе времен- но

́

й структуры звуковой волны. Эта теория использует синхронизацию разрядов нейронов о

́

ргана Корти с фазой колебания базилярной мемб- раны (эффект запирания фазы). При смещениях определенной точки мембраны в сторону расположения волосковых клеток в них возникает электрический потенциал, а при смещении в противоположную сто- рону — потенциал отсутствует. Благодаря фазовому запиранию время между импульсами в любом отдельном волокне будет равно целому числу (1, 2, 3...), умноженному на период основного звука. Нервные волокна при этом могут кооперироваться при декодировании (распоз- навании) частот выше 300 Гц.

С моей точки зрения, более-менее подробное изложение времен- но

́

й теории определения высоты звука превышает допустимый уро- вень сложности изложения материала в этой книге. Интересующих- ся отсылаю к специальной литературе, например к статьям и книгам И.А. Алдошиной или к медицинской литературе.

Приведу лишь краткий вывод из временной

́

теории определения высоты звука. Временная

́

теория позволяет понять, как слуховая сис- тема определяет фундаментальную частоту звука на основе анализа временных

́

интервалов между нервными импульсами от различных мест на базилярной мембране и по ней определяет высоту сложного тона. Од- нако временная

́

теория не объясняет восприятия высоты тона на частотах выше 5 кГц, так как эффект фазового запирания не срабатывает на этих частотах. Причина этого скорее всего в том, что никакой нейрон не может генерировать нервные импульсы быстрее 1000 раз в секунду из-за особен- ностей электрохимической динамики потенциала действия. Вероятно (!), в этой области частот меняется механизм восприятия высоты тона.

Напомню, что для звуков с базовой частотой выше 5 кГц в слухо- вой диапазон человеческого уха (до 20 кГц) попадают только две-три

слышимые гармоники (20 000 < 7000 × 3). Этого слишком мало для оп- ределения высоты звука. Поэтому восприятие высоты тона существен- но обедняется и практически заканчивается восприятие музыкальной высоты (pitch chroma) звука. Скорее всего это было интуитивно понят- но музыкантам, потому что на большинстве музыкальных инструмен- тов клавиатура заканчивается в области 5 кГц.

Господа читатели! Эта область знаний, психоакустика, находится в ста- дии развития, бурного роста, как и многие другие области знаний, нахо- дящиеся на стыке физики, биологии, химии, нейрофизиологии. Не ду- майте, что уже все давно придумано и со всем уже давно разобрались высоколобые ученые мужи или жены. Это не так. Да и лоб часто бывает у них довольно узок.

Современная теория восприятия высоты тона

Ни теория места, ни временна

́

я теория не могут по отдельности объ- яснить восприятие человеком высоты звука. Мозг принимает инфор- мацию от периферийной слуховой системы как за счет определения места возбуждения на базилярной мембране (частотный анализ), так и за счет информации о форме звуковой волны (временно

́

й анализ). Причем и та и другая информация передается по одним и тем же не- рвным волокнам.

Современная теория объединила оба метода: сначала идет филь- трация сигнала по частоте с помощью развертки по месту, затем идет анализ по межимпульсным интервалам (до шестой-седьмой гармони- ки они соответствуют периоду каждой гармоники), выше — по пери- оду огибающей кривой. Поскольку период огибающей кривой равен периоду основной частоты, то здесь различие высоты тона определя- ется только по месту возбуждения. После определения общего периода данному звуку присваивается определенная высота. Таким образом, обе теории дополняют друг друга.

 

Объединение экспериментальных данных с теорией места и вре- менно

́

й теорией дает следующее:

1) для музыкальных тонов с основной частотой от 100 до 400 Гц (с громкостью не менее 50 дБ) основную роль в определении высоты тона играют первые 5–6 гармоник (если их уровень превышает 10 дБ), то есть те гармоники, которые разворачиваются (распознаются) слухо- выми фильтрами;

 

2) звуковые сигналы, содержащие только очень высокие гармони- ки (выше двадцатой), не вызывают ощущения высоты тона;

 

3) музыкальные сигналы, содержащие очень низкие частоты (с ос- новной частотой ниже 50 Гц, например звуки больших труб орга

́

на)

вызывают ощущение высоты тона только по высшим гармоникам, так как такие низкие частоты не вызывают смещений базилярной мем- браны — они на ней не размещаются, им не хватает места; при этом наиболее существенную роль играют пятые-шестые гармоники;

 

4) основная частота звука, если она выше 1 кГц, является опреде- ляющей, базовой в определении высоты тона;

 

5) музыкальные звуки, содержащие только неразвернутые гар- моники (свыше шестой), могут дать ощущение высоты тона по оги- бающей кривой, при этом человеческий слух чувствует высоту звука довольно точно.

Обработка информации о высоте тона в нашей голове

Итак, звук попадает в весьма совершенный и очень необычно сконс- труированный микрофон (внешнее, среднее и внутреннее ухо), далее по «проводам» (по нервным волокнам) информация о звуке передает- ся в компьютерный блок (головной мозг). Напомним, что по нервным волокнам от внутреннего уха в головной мозг передается вся инфор- мация о гармониках, обертонах звуков, без предварительной сепара- ции — конечно, с учетом вообще технических возможностей нашей слуховой системы.

 

Мозг группирует несколько тонов (гармоник) с одинаковым час- тотным интервалом в одно ощущение высоты тона. Это является при- нципиальным свойством нашего слухового процессора (высших от- делов коры головного мозга). Из сложного внешнего звукового мира мозг выделяет звуки и группирует их по определенным признакам: месту, времени начала и конца, периодичности повторений. Это свя- зано с тем, что кратковременная память человека оперирует только 6–7 символами и без группировки мозг не может принимать быстрых решений. То есть мы имеем дело со своеобразным компромиссом, ко- торых великое множество в нашем организме.

 

Современная нейропсихология утверждает, что мозг мыслит об- разами. Музыкальные звуки тоже запоминаются в виде некоторых гармонических эталонов, шаблонов, матриц, статических или дина- мических. Наш мозг также любит достраивать неполные образы до целостных, используя только частичную информацию об образе. Это относится ко всем сенсорным системам: зрению, слуху, осязанию и др. Таким образом, Будда Гаутама был прав, говоря, что мы живем в сан- саре, иллюзорном мире, имеющем малое отношение к действитель- ности. Зато так проще, действительность не обжигает наше сознание. «Отрезвин» Станислава Лема не востребован в нашем мире. В нашем мире востребованы вещества, еще более затуманивающие сознание, хотя куда уж больше. Ладно, вернемся к нашим ушам и головам.

Головной мозг получает информацию от периферической слухо- вой системы о наличии компонент с кратными периодами в музыкаль- ном звуке, группирует их и сравнивает с матрицей, гармоническим шаблоном, в котором имеются все последовательные гармоники. Для каждого входного сигнала по фундаментальной частоте подбирается гармонический шаблон, который лучше всего ему подходит. В соответс- твии с таким подходом фундаментальная частота подобранного шаб- лона и будет воспринимаемой нами высотой тона. Если два шаблона с разными фундаментальными частотами подходят к данному сигналу, можно услышать или неопределенную высоту, или две высоты. В слу- чае отсутствия фундаментальной частоты сравнение производится по отдельным гармоникам. Если удается подобрать хотя бы несколько гармоник, подходящих под эталон, то по повторяющемуся интервалу между ними присваивается высота звука. Наиболее важными для воз- никновения ощущения высоты тона являются первые 3–6 развернутых гармоник. Отдельные составляющие сигнала, которые ведут себя ано- мально (например, одна гармоника включается-выключается или резко отличается от шаблона), выделяются центральным процессором, и им присваивается отдельная, выделенная высота. Все вышеописанное яв- ляется научной гипотезой, но — хорошей гипотезой.

Имеется много доказательств в поддержку данной гипотезы. На- пример, при подаче разных гармоник в разные уши одного человека через наушники (600 Гц в одно ухо и 800 Гц в другое) отчетливо слышен разностный тон высотой, соответствующей частоте 200 Гц. То есть цен- тральная система сама синтезирует в разных ушах высоту из гармоник.