Ученые научились предсказывать мутации языков
Источник:
Грани.ру
В ходе длительного (сотни и тысячи
лет) развития человеческих языков сохраняются лишь наиболее
часто используемые слова, в то время как менее
употребительные обычно видоизменяются до неузнаваемости или
заменяются какими-нибудь новыми формами. Это положение в
лингвистике считается общепризнанным и едва ли не
самоочевидным (достаточно сравнить, например, термины
родства в разных европейских языках), однако строго научное
доказательство было получено только сейчас, с публикацией
двух новых исследований в журнале Nature.
Оказалось, что при изучении таких продуктов социального и
культурного развития, как язык и речь, может с большим
успехом привлекаться инструментарий эволюционной биологии.
Словно гены, слова ведут безжалостную борьбу за выживание и
испытывают мощное давление со стороны факторов своего рода
"речевого мутагенеза".
Биолог Марк Пейджел (Mark Pagel) и его коллеги из
британского Ридингского университета (University of
Reading), используя базу данных по сравнительным
характеристикам индоевропейских языков, проследили за
изменением слов, используемых для передачи двух сотен
различных значений в 87 различных языках. Некоторые
смысловые значения (например, "вода", "water" (англ.), "Wasser"
(нем.), ср. готское "watō"; или число "два", "two" (англ.),
"zwei" (нем.), "deux" (фр.), "duō" (греч.), "due"(ит.),
"dos" (исп.) и т.д.) передаются созвучными или так или иначе
родственно связанными словами, восходящими к одному
праязыку, тогда как некоторые другие (например, "хвост" -
"tail" (англ.), "Schwanz" (нем.), "queue" (фр.), "oupa"
(греч.),"coda" (ит.) и "cola" (исп.) или "птица" - "bird"
(англ.), "Vogel" (нем.), "oiseau" (фр.), "pouli" (греч.), "uccello"
(ит.), "pájaro" (исп.) и т.д.) выражены многими очевидно
несвязанными между собой словами (по крайней мере, в
пределах этих 87 языков), и это указывает на то, что они
сильно изменились за последние 6-10 тысячелетий (общий
возраст индоевропейских языков).
Для определения частоты использования выбранных 200 значений
в разных языках исследователи обратились к обширным базам
данных по четырем современным индоевропейским языкам -
английскому, русскому, испанскому и греческому. В результате
выявилась четкая закономерность: чем чаще то или иное
значение используется в речи, тем меньше наблюдалось
изменений в соответствующих словах. Из этого следует, что
наиболее важные лингвистические элементы являются также и
"ультраконсервативными". Впрочем, группа профессора Пейджела
также выяснила, что такие части речи, как предлоги и союзы,
нашей речью считаются все-таки "менее важными" и меняются с
большей вероятностью, чем критически важные для нее
числительные, местоимения и так называемые
местоимения-наречия (т.е. слова, которые указывают на
признак действия или признак признака) - такие как "who",
"what", "where", "when", "how", "not" ("кто", "что", "где",
"когда", "как" и "нет").
Исследователи теперь научились чисто математическими
методами достоверно предсказывать вероятные "темпы мутации"
для каждого слова, основываясь на его частоте и
функциональных особенностях. Наиболее часто используемые
слова, согласно этим предсказаниям, скорее всего останутся
устойчивыми на протяжении ближайших 10 тысяч лет, что
позволяет считать эти "культурные артефакты", или мимы
("memes") более устойчивыми, чем даже некоторые гены
(понятие "саморазмножающихся", перепрыгивающих из сознания в
сознание мимов и соответствующего "мимофонда" ввел в 1976 г.
в своей книге Ричард Доукинс (Richard Dawkins) - выдающийся
британский ученый-этолог, блестящий популяризатор науки и
убежденный атеист).
Второе исследование, проводимое американским
аспирантом-математиком Эрезом Либерманом (Erez Lieberman) из
Гарвардского университета (Harvard University, Кембридж,
штат Массачусетс) и его группой, демонстрирует подобный
эффект на примере одного лишь английского языка. Коллеги
Либермана Джо Джексон (Joe Jackson) и Тина Тэнг (Tina Tang)
под руководством математика Мартина Новака (Martin A. Nowak)
"прочесали" учебники грамматики по староанглийскому языку и
получили список из 177 неправильных староанглийских
глаголов.
Неправильные глаголы (в современном английском языке их
свыше четырех сотен, и они создают изрядные трудности для
изучающих этот язык как иностранный) не подчиняются
общепринятым правилам при образовании прошедшего времени и
страдательного залога. Дело в том, что современный
английский по своему составу едва ли не на 2/3 состоит из
корневых слов германского и французского происхождения
(представленных примерно в равной пропорции), на 20% из
латыни и 3% из греческого. Такое смешение всего и вся до
определенного момента приводило к достаточно быстрому
упрощению языка, но в XVII-XVIII веках в этот вполне
естественный процесс вмешались лингвисты, которые закрепили
в грамматиках того времени уже сложившуюся ситуацию.
Отмирание окончаний в словах они сочли признаком деградации,
а не прогресса, и хотя не смогли вернуть уже исчезнувшие
окончания, решили хотя бы "законсервировать" сохранившихся
"динозавров", что им и удалось, благодаря повсеместно
распространившемуся образованию. Если бы не эти усилия
лингвистов, то неправильных глаголов в современном
английском (т.е. "окаменелостей", оставшихся от шести
мертвых правил, с помощью которых образовывали прошедшее
время) было бы гораздо меньше, и школярам жить было бы
гораздо проще. Огромное количество неправильных английских
глаголов и охраняемые грамматиками окончания, кроме всего
прочего, не дали возможности английскому языку
преобразоваться в полностью аналитический язык (из
синтетического, хорошим примером которого является,
например, русский).
Из найденных группой Либермана глаголов 145 оставались
неправильными еще в среднеанглийском языке (конец XI - конец
XV вв., языке "Кентерберийских рассказов" Джефри Чосера
(1340-1400)), а 98 остаются неправильными и поныне, в
течение долгого времени успешно противостоя тенденциям
обращения в "правильные".
Когда Либерман и его коллеги сопоставили свои наблюдения с
информацией о частоте употребления каждого глагола, то сразу
же нашли ясную закономерность. Наиболее часто используемые
глаголы (вроде "be" - "быть", "have" - "иметь", "come" -
"приходить", "go" - "идти" и "take" - "брать") стабильно на
протяжении столетий оставались неправильными. А чем реже
глагол используется в речи, тем с большей вероятностью он
рисковал превратиться в правильный. Например, правильной
формой глагола "help" ('помогать') в прошедшем времени
раньше считалась "holp", а теперь - "helped". За прошедшие
1200 лет 91 процент из самых редких глаголов в списке
Либермана (включая "bide" - 'ждать, выжидать', "delve" -
'копать, рыть; тщательно изучать', "hew" - 'рубить,
рассекать', "snip" - 'резать, отрезать, разрезать' и "wreak"
- 'мстить; давать выход, волю (чувствам)') "поменял свою
ориентацию".
"Лучшую десятку самых употребимых глаголов английского языка
составляют именно неправильные глаголы, несмотря на то, что
все неправильные глаголы представляют лишь 3 процента
словарного запаса", - говорит Эрез Либерман.
Исследователи даже выдают свой прогноз: следующим
неправильным глаголом, который превратится в правильный,
станет "wed" ('женить(ся); выходить замуж; вступать в
брак'). В настоящее время он спрягается как "wed", однако
ему на смену уже приходит версия с суффиксом "-ed" -
"wedded". На страницах новой работы выведено замечательное
правило: "время "полураспада" неправильных глаголов
пропорционально квадратному корню из частоты их
употребления".
Впрочем, комментаторы отмечают, что при всей продуктивности
аналогий языкового развития и дарвиновской эволюции,
все-таки достаточно легко отыскиваются такие примеры,
которые совершенно необъяснимы в рамках чисто
"биологической" трактовки.
Источники:
Language 'mutations' affect least-used words
12:24 11 October 2007
NewScientist.com news service
Bob Holmes
As languages evolve over centuries
and millennia, the most frequently used words tend to remain
unaltered, while rarer words are more likely to change.
This tendency was long suspected, but has now been proven
rigorously for the first time by two new studies. The
results show that the tools of evolutionary biology can be
applied to study the evolution of cultural artefacts like
language.
Evolutionary biologist Mark Pagel and his colleagues at the
University of Reading, UK, used a comparative database of
Indo-European languages to trace the words used to express
200 different meanings in 87 different languages.
A few meanings, for example the number "two", used related
words, known as "cognates", in every language they studied.
Some meanings, for example "tail", were expressed by many
apparently unrelated words across the 87 languages,
indicating great change in the 6,000 to 10,000 years since
the origin of Indo-European languages.
Cultural coordinates
The researchers then turned to large databases of four
modern Indo-European languages – English, Russian, Spanish
and Greek – to determine the frequency of use of the 200
meanings in these languages. They found the more frequently
the meaning is used in speech, the less change in the words
used to express it.
This suggests that more important linguistic elements are
more resistant to change. Supporting this, Pagel also found
that less important parts of common speech, such as
conjunctions and prepositions, are more likely to change
than crucial ones such as numbers, pronouns, and so-called
"special adverbs" like "who", "what", "where", "when", "how"
and "not".
"We use those words over and over," says Pagel. "It's what I
like to think of as coordinates: who did what to whom, and
how many did they do it with? And those words stay put. They
just don't evolve, while the other ones seem to go all over
the place."
The researchers were able to mathematically predict the
likely "mutation rate" for each word, based on its
frequency. The most frequently used words, they predict, are
likely to remain stable for over 10,000 years, making these
cultural artifacts, or "memes", more stable than some genes.
'Regularised' verbs
A second study, led by Erez Lieberman, a mathematician at
Harvard University, shows a similar effect within a single
language, English. Lieberman's colleagues Joe Jackson and
Tina Tang combed through grammar textbooks on Old English –
the language of Beowulf – to compile a list of 177 irregular
Old English verbs.
These are verbs, such as "sing" do not follow modern
English's standard rule for forming past tenses by adding
"-ed", in this case simply becoming "sang" or "sung". Of
these verbs, 145 were found to still be irregular in Middle
English, and 98 remain irregular today, reflecting a
tendency of verbs to become "regularised" over time.
When Lieberman's team included information on the frequency
of use of each verb, a clear pattern emerged. The most
frequently used verbs (such as "be", "have", "come", "go"
and "take") remained irregular. The less often a verb is
used, the more likely it was to have been regularised. Of
the rarest verbs in their list, including "bide", "delve",
"hew", "snip" and "wreak", 91% have regularised over the
past 1200 years.
The researchers even think they know the next irregular verb
to make the switch: "wed". Officially, the past tense of the
verb stays as "wed", as in "newly wed". But do not get too
wedded to that notion: the -ed suffixed version is already
alive and well.
Journal reference: Nature (DOI: 10.1038/nature06176, DOI:
10.1038/nature06137)
Щербаков Ю.Н. 2012 г.