Алексей Алексенко /

Говорите медленнее, а то смысл ускользает

Об одном важном отличии одесситов от эстонцев

Иллюстрация: Corbis/Fotosa.ru
Иллюстрация: Corbis/Fotosa.ru
+T -
Поделиться:

«Если бы я был испанцем, я бы говорил по-испански» — этот классический пример пустопорожнего силлогизма может внезапно приобрести смысл, если добавить к нему кое-что: «…я бы говорил по-испански гораздо быстрее, чем сейчас говорю по-русски». Чистая правда: представители разных народов говорят в разном темпе. Носители одних языков трещат со скоростью пулемета, другие растягивают слова; и те и другие тем самым подают окружающим повод для неполиткорректных шуток.

Спрашивается: с чего бы это? Вопрос серьезнее, чем кажется на первый взгляд. Все языки — способ обмена информацией, они вырабатывались в ходе конкурентной эволюции разных человеческих групп. Казалось бы, те народы, которые насобачились обмениваться информацией очень быстро, должны иметь преимущество перед народами, которые вечно тормозят. В итоге мы бы наблюдали всемирное господство самых скорострельных языков, и харьковчане ездили бы в Хельсинки обменивать ножи, бусы и огненную воду на шкуры северных оленей. На самом деле ничего подобного не происходит, и вот только сейчас лингвисты задались вопросом: «Какого черта?!»

Если быть точным, это были французские лингвисты, группа Франсуа Пеллегрино из университета Лиона (Pellegrino et al., Language, 2011). Чтобы разобраться в этом, они, во-первых, численно определили, насколько быстро тараторят представители разных народов. Лидерами в их выборке стали испанцы и японцы (почти 8 слогов в секунду!). Антилидерами — вьетнамцы и китайцы, точнее, носители мандаринского языка (чуть больше пяти слогов). Разница, как видим, в полтора раза.

Во-вторых, они эту разницу тут же и объяснили, придумав хитрый компьютерный алгоритм. Компьютер вычислил точное количество информации, приходящееся в том или ином языке на один слог. Вот тут и оказалось, что испанцы не зря так трещат: на один слог испанского языка приходится в среднем в полтора раза меньше информационной нагрузки, чем на один слог вьетнамского. Вот, например, если вы произнесете NGA (там на самом деле два звука, не три), испанец подумает, что вы глотаете слюни, готовясь произнести длинную тираду, а вьетнамец сразу поймет, что вы русский — именно это означает вышеприведенный слог на вьетнамском языке. Там, правда, еще важна высота тона.

Получается, что чем меньше битов приходится на один слог, тем быстрее выскакивают слоги — в итоге  информация передается примерно с постоянной скоростью. С какой именно скоростью? Видимо, с той, с которой ее способен оптимально обрабатывать человеческий мозг. Мозг у нас, стал быть, одинаковый у всех, то есть у харьковчан ровно такой же, как у обитателей норвежского города Тромсё — это уже вполне политкорректный вывод, никакой анекдот про это сочинить не получится.

Те, кто хочет поумничать, могут тут вспомнить Ноама Хомского-Чомского и его блестящие спекуляции про универсальную грамматику. Универсальная для разных языков скорость передачи информации — чуть ли не единственное на сегодняшний день практическое подтверждение этой красивой телеги. А те, кто про Хомского размышлять отказывается, могут извлечь из этого исследования практический урок: если скорость передачи информации постоянна, велика вероятность, что те, кто говорит много и быстро, на самом деле несут бессмыслицу. Посмотрите любое ток-шоу по телевизору, где люди кричат все одновременно и перебивают друг друга, и убедитесь, что так оно и есть.

Комментировать Всего 33 комментария

Вспомнил некстати. Идём по городу Скопье втроём - литовец, эстонец и русский (семинар у нас там). Литовец вдруг говорит: "А вот русские утверждают, что эстонцы - тормозные"... Пять шагов... Эстонец: "Что?".

А что насчет украинцев, свободно владеющих эстонским, и особенно  - эстонцев, свободно говорящих по-украински? Они говорят с двумя разными скоростями?

Если я правильно понял исследователей, это свойство языка. Если вы хорошо говорите на языке, вы говорите в темпе носителей. Если плохо – вы просто плохо говорите и передаете информацию заведомо неэффективно.

Так мне это и интересно: как это соотносится с личными и этническими характеристиками. Ведь есть же люди-балаболки и люди, говорящие крайне медленно. И что же, выучив другой язык, они меняют характеристики своей нервной системы?

Эту реплику поддерживают: Лена Де Винне

Я говорю быстро, значительно быстрей среднего носителя. Значит ли это, что я гоыорю плохо и по-русски, и по-английски?

Бредовая идея. Иврит примерно вдвое экономнее русского (фонетически), а на письме - вчетверо. Говорят на иврите (тот же эталонный текст) раз в шесть быстрее. И что? Библия в шесть раз менее насыщена смыслами, чем поэзия Есенина?

Справедливости ради, корреляция у них была не стопроцентная, некоторые языки выпали из закономерности.

А что касается Библии и Есенина, речь не о "смыслах" (что это такое, кстати? Я всегда думал что у слова "смысл" нет множественного числа: если смысл есть, то он один, а если он не один, то его нет) - а об "информации" в строгом смысле. Нечто, измеряемое битами и байтами.

слово смысл имеет множественное и это широко используется в нерусской литературе на русском языке.

Информация? ее в ивритской речи точно можно уложить не меньше, чем в русской.

Все проще: у народов разные темпераменты и разные мощности культур. Корреляции нет вовсе. Быстрая речь может быть высокосодержательной, а медленная - нулевой. Скорость - от темперамента, наполнение от ума.

"В начале сотворил... " и т. д. - 12 слогов.

"Берешит бара..." и т. д. - 18 слогов.

Но какая разница в смыслах! Перевод пустой и плоский, а по исходнику можно дать 24 часовую лекцию только по буквальному смыслу.

А соотношение длины текство я не с потолка взял, в молодости переводами подрабатывал, берем еврейский текст, умножаем на 3 (если современный), получаем тдлину текста перевода.

Кстати, дословный перевод:

В начале сотворения Бог(ами) определенных небес и определенной земли..."

Производит впечатление некачественно проведенных исследований

Или же в изложении есть значимые лакуны, из-за которых смысл непонятен

Как уже говорилось здесь, в рамках одного языка есть много людей (групп людей), говорящих с различной скоростью. Чисто характерологически.

Есть классификация по образованию/уровню культуры. Вмпоминается мой опыт поездки на шабашку под Тюмень, в деревню, в 1986 году. Там разговаривпли одним матом (ну, на 50-70%), и медленно. Учился понимать речь неделю. Говорить на их языке - 2 недели.

Как учитывались при оценке насыщенности речи "высота звуков" и интонация? Для меня это интересный вопрос. Нигде не встречал приличного научного описания.

Взять, хотя бы слово "Нуу", или "Ааа". От интонации даже вмнашем, русском языке, не в многотоновом китайском или вьетнамском смысл варьируется очень сильно.

Ритм жизни, "внутренняя тактовая частота нации", конечно, влияет. Южане в среднем говорят быстрее.

Но Александр Фейгин привел хороший пример. Иврит - очень быстрый язык, и очень концентрированный. Фарси, скажем, гораздо медленнее и более образный, метафоричный. И так далее.

Короче говоря - не совсем понятны эксперименты, как измерялась информация, как учитывались разные аспекты. Да и что такое корреляция - вопрос не очевидный.

Эту реплику поддерживают: Алексей Юсфин, Lucy Williams

Оригинал лежит в архивах Language под замком. В сети я его не нашел. Это на основе дайджеста из Scientific American за апрель этого года.

Но вообще эти критические комментарии напоминают мне вот что (без обид). Галилей: "Скорость падения тела не зависит от его массы". Булочник: "Да что вы такое говорите! Вот я кинул свой картуз, и он упал быстрее, чем перхоть из-под картуза". Галилей: "Если нет силы, движение прямолинейное". Булочник (саркастически): "Да-да! Будет двигаться, пока не увязнет!"

Да нет, какие обиды

Мне правда непонятно. Противоречит интуиции. А логика не понятна. Так, что не работает (у пеня) ни тот ни тот способ восприятия.

Кажется, я уже подписывался на эти подборки, посмотрю.

Спасибо за ссылки

Логика состоит в том, что у каждого языка есть свойственный ему темп речи. Моей интуиции это не противоречит. Остается проанализировать много-премного аудиотреков с речью носителей и подсчитать средний показатель, число слогов в секунду.

Вторая часть логики состоит в том, что слова переносят информацию, которую в принципе можно количественно измерить (как - это уже другой вопрос).

Третья часть состоит в том, чтобы нанести полученные усредненные точки (или облака точек) на координатную плоскость и посчитать корреляцию по формуле из математической статистики.

Я не могу понять, где здесь в игру вступает аргумент типа: "А мой парализованный дедушка перед смертью говорил по-испански очень медленно, так что никто его не понимал"?

Дедушка не вступает, он парализован, егоиречь не внятна.

Мне именно перечисленное и не понятно (причем, я не говорю, что не верно, а что мне непонятно)

Сделанно сразу много закадровых предположений (неочевидных для меня):

1. Темп речи различен в разных культурах, ОК. Но является ли разделителем по скорости именно язык? Не уверен.

2. При одной и той же тактовой частоте, как известно, 64х битная шина передачи данных предпочтительнее 8ми битной. То есть мы говорим о "концентрации, объеме передачи информации за один такт речи". По умолчанию за такт взят слог. Для меня - не очевидно.

3. Шаг в сторону. Европейская письменность - знаковая. Чтение ее - в основном аналитический процесс, анализ написанных знаков и синтез смысла. Иерогифическая - в основном образная, целостная. Если брать аналогию с компьютером - то это текстовый и графический способы передачи информации. Для передачи информации об образе иногда нужно очень много слов, слогов. В устной речи аналогом иероглифов могут выступать такие параметры, как высота тона, интонация в широком смысле и пр. То есть, для меня не очевиден базис для статистики.

Ладно

Я закончил трендеть

Почитаю статью

А вопрос интересный

1. Темп речи свойствен культуре, как свойствен ей и язык. Все. Дальше ничего не надо, мы не спрашиваем "почему у этой культуры этот язык и этот темп". То, что эти параметры связаны, доказывается самим исследованием.

2. Темп речи - как мы воспринимаем его на слух в иностранном языке - это именно слоги в секунду. Именно этим отличается тараторенье от мямленья. Для того чтобы отличить их на слух, язык (со всеми его способами смыслового членения) знать не надо.

3. Письменность-то тут при чем?

1. Есть множества, а есть подмеожества, есть пересекающиеся множества. Например, может быть все поофессоры-филологи говорят медленно, вне зависимости от языка? Или все кришнаиты? Или все тупые уроды? Приведу пример, я был в Португалии на пляже, где тусовались серферы, из разных стран. Я слушал их реь. Она была медленной и тягучей, на разных языках. То есть, я предполагаю, что этому подмножеству свойственнен свой темп (ииеще что-то) речи.

2. Это да. Но мы оеряем информацию о "насыщенности" слогов. 8ми битная или 64х битная шина данных?

3. При том, что при передачи информации с помощью речи (знаков на письме), могут иметь очень важное значение дополнительные параметры: высота, интонация и пр. (вид написания письменных знаков). Это аналогия.

Кстати, хороший пример с Галилеем

Если такое говорил Галилей - то он был не прав.

Сила притяжения зависит от массы. Сила сопротивления зависит от среды, в которой падает оело (вакуум, воздух, глицерин) и от формы тела и от скорости и еще много от чего.

То есть F=m1*a=m1*m2*K, где м1 сокращается, будет неверна с учетом сил трения. И скорость падения будет, соответстыенно, различной.

То есть, наш "сферический Галлилей в вакууме" был не прав.

Аналогия хороша.

Так и в этом случае, похоже

Но - почитаю статью в Сайнтифике

Это аргумент типа "Любая реальная ситуация отличается от идеальной, в ней всегда есть множество особенностей, которые не учтены в формуле, поэтому физика - ложь". Ответ на него состоит в том, что можно учитывать все больше и больше деталей, и результат будет приближаться к верному.

Представим себе человека, которого окружает N предметов, с которыми он может произвести M действий. Я отдаю ему приказ произвести действие такое-то с предметом таким-то, я передаю ему количство битов информации, равное логарифм* N плюс логарифм M. Он в ответ выражает готовность выполнить приказ, или отказывается, или делится одной из K запротоколированных эмоций (гнев, лень, подобострастие и т.п.). Добавляем логарифм K. И т.д. Мне кажется, что если не впадать в лженаучный идеализм, реальный язык можно в конечном итоге свести к такой схеме (правда, усложнив ее очень сильно, но вряд ли до бесконечности).

___

по основанию 2 разумеется.

Про "аргумент типа..."

Это классический вопрос к Теслинову

Когда мы имеем "вещь", "имя вещи" и "определение вещи", то все эти три понятия могут быть совсем различны для различных людей.

Я пояснил (каюсь, неявно) в каком смысле (с каой точки зрения) я подхожу: реальный предмет, который падает в какой-то среде. Для этой точки зрения утверждение Галилея неверно. Предложенное утверждение Галилея неиимело смысла, так как не было определено в каком смысле, с какой точки зрения.

Я совсем недавно читал про передачу/восприятие человеком информации. Восприятие весьма далеко от объективной реальности (поостой совокупности физико-математических характеристик) и носит поинципиально целостный характер. Это не означает, что процесс предачи информации нельзя рассматривать фрагментарно, аналитически. Можно, но нужно делать это аккуратно. Боюсь, что безимногочисленных оговорок (которых нет в тексте), тяжело поверить в корректность выводов. Мне тяжело.

Неудивительно, что реб Фейгин вопротивится такой формальной процедуре в применении к Библии, но мы-то вроде не по этой части, э?

Алексей, у меня есть полный текст оригинальной статьи. Напишите, пожалуйста, если хотите, чтобы я вам её переслал.

Впрочем, дайджест тоже под замком, подписываться надо.

Интересно, Спасибо! Посмотреть бы на статистику этих исследований, т.к. скорострельно тараторящих бессмыслицу людей много в одной языковой группе, также как много людей передающих значительно более сложные смыслы друг-другу за меньшие промежутки времени и с меньшим числом слогов. Нужна большая выборка, а главное непонятно, что же всё-таки их интересовало - скорострельность слов или скорость передачи смысловых понятий.

Т.к. с какой бы скорость нобелевский лауреат по физике из Рязани не татарорил "введение" к своей теории своей родной бабушке из той же самой Рязани - она ни фига бы не поняла раздел "выводы", даже если бы он снижал при этом скорость произношения и увеличивал бы при этом число слов ей знакомых.

Оригинальное исследование там предложил посмотреть комментатор чуть выше по треду.

Я хочу сказать, что наверное ввел всех в заблуждение финальной шуткой про бессмыслицу. Здесь речь идет не о смысле в высоком смысле в высоком смысле, а об информации как математической категории. С этой точки зрения фразы "Чунга-чанга весело живет" и "Вселенная безгранична" несут примерно одинаковое количество информации.

Два вопроса от двоечника:

1. У меня не получилось из объявленного силлогизма про испанцев построить силлогизм. Даже такой: Все испанцы говорят по-испански - Я испанец - Я говорю по-испански не проходит из за условной "бы"

2. Во всем рассуждении имеется чёрный ящик под названием "хитрый компьютерный алгоритм", без понимания которого всё теряет смысл. Неплохо бы выяснить, как информация в модели приписывалась слогам".

Иначе получится, как в истории, рассказанной мне А.А. Абрикосовым про некого моряка, защищавшегося по протекции в Институте Физпроблем. После доклада китам отечественной теорфизики один из них (слегка обескураженный) задал вопрос: "А скажите, решением какого уравнения является Ваш результат?". Соискатель не растерялся, "Уравнение засекречено", - ответил он.

Эту реплику поддерживают: Lucy Williams

2. Чуть выше по треду один из комментаторов предлагал полный текст статьи, которого у меня в онлайне нет. Еще выше в дискуссии с Алексеем Насретдиновым я предложил некую дилетантскую гипотезу, как можно было бы подойти к рассчету информационной наполненности языка.

1. Да, это скорее просто бессмысленное "суждение". Хотя увидеть в нем силлогизм можно: Все испанцы говорят по-испански (большая и постоянно действующая посылка), я испанец (малая посылка, которую вполне уместно выразить условной формой), и заключение. Аналогично "Если бы Кай был человеком, он был бы смертен".

Да, спасибо, прочту. Я занимался когда-то чуть-чуть теорией информации, и вообще, тема крайне интересна, но очень сложна. Я еще спросил, потому что при решении таких задач числовыми методами исследователи часто запихивают в алгоритмы неочевидные гипотезы, которые крайне трудно оттуда выудить и увидеть, где ограничения модели.

Ну очевидно они их туда и запихнули, это ж лингвисты, в конце концов. Они пять лет в универе учатся, как девушку уболтать, чтобы одежду сняла – уж наверняка тут приходится использовать какие-то неочевидные предположения =)

Эту реплику поддерживают: Алексей Юсфин

Первое, что мне пришло в голову, это что они решили доказать, что количество передаваемой вербальной информации в единицу времени не зависит от языка (так себе гипотеза, кстати). И при крайней сложности задачи построения модели соответствия единицы языка единице информации и численном методе очень сооблазнительно зациклить программу и считать наоборот: так, чтобы количество информации в слоге соответствовало гипотезе сохранения скорости передачи информации. Иногда такие вещи делаются подсознательно. Но я лучше прочту.

Мне кажется, что средняя скорость речи коррелирует с национальностью не столько из-за употребления какого-то определенного языка, сколько с общими качествами носителей этого языка. Например, южные народы (быстро говорящие) в среднем более темпераментные, чем северные (медленно говорящие), что частично определяется некоторыми физиологическими особенностями. Кроме того, есть определенные модели поведения, принятые в той или иной стране. Например, итальянцы любят говорить громко, быстро, размахивая руками, а в скандинавских странах такое поведение в основном считается неприличным. Примеров много.

Я хочу сказать, что соотносить скорость речи только с языковой принадлежностью - неправильно. Язык связан со всеми аспектами человеческой деятельности, и изучать этот вопрос необходимо только комплексно.

Внутри группы носителей одного языка тоже скорость речи отличается в разы. Люди же разные по психотипу, вот и мыслят с разной скоростью, и говорят тоже. В конце концов, просто речью люди пользуются в разной степени. Один лекции читает всю жизнь, а другой - лесник одинокий. Образ жизни тоже влияет.

Эту реплику поддерживают: Lucy Williams