Материалы портала «Научная Россия»

Глоттохронологический распад

Глоттохронологический распад
Последние исследования показывают, что лексикостатистика требует рекалибровки.

От латыни и древнегреческого нам досталось множество текстов. Из внешних источников мы можем примерно восстановить, когда эти языки существовали и какие современные языки могут считаться их потомками. Но письменная история человечества не так уж и велика. Люди тысячелетиями жили, разговаривая между собой, договариваясь, передавая сказания из уст в уста, оставляя наставления для потомков без использования письменности. Как узнать, на каком языке они разговаривали, если от древних языков нам остались только письменные памятники?

Впрочем, язык — это такая сущность, которая развивается довольно предсказуемо. От языка-предка со временем расходятся линии языков-потомков — что русский язык является родственником английского и персидского, сейчас известно достаточно широко. Используя данные известных языков и сравнительно-исторический метод реконструкции праязыка, сравнивая корни слов между собой, можно путем ступенчатой реконструкции шаг за шагом опуститься довольно глубоко в прошлое — ученые-компаративисты, занимающиеся языковой реконструкцией, говорят, что теоретически таким образом можно добраться до языка, на котором говорили примерно 10 тысяч лет назад.

Название изображения

Тут можно напомнить, что шумерская клинопись, которая считается древнейшей на земле, была выдавлена на глине всего около пять с небольшим тысяч лет назад, а общий предок английского, русского и персидского — праиндоевропейский язык — использовался в живой речи около шести–семи тысяч лет назад. Развитие языка можно представить себе в виде дерева (это называется генеалогическим деревом языков) — от языка-предка расходятся отдельные ветви-семьи языков, разделяющиеся, в свою очередь, на следующем уровне на еще более мелкие группы и подгруппы.

Есть основания считать, что скорость распада языка — величина относительно устойчивая. Зная эту константу и сравнивая количество совпадений и различий (замен) в наиболее устойчивой части лексического запаса родственных языков (так называемые стословные списки — т.е. наиболее устойчивые слова, дольше всего сохраняющиеся в языке, например, личные местоимения и названия частей тела), можно узнать с помощью лексикостатистического метода, как давно эти языки разошлись. Такие расчеты называются глоттохронологическими, от греч. γλῶττα — язык и χρόνος — время.

Впервые с этой идеей выступил лингвист Морис Сводеш, а в России начало лексикостатистическим исследованиям и исследованиям дальнего родства языков положил основатель Московской школы компаративистики Сергей Анатольевич Старостин. С 2005 года в Российском государственном гуманитарном университете проводится ежегодная конференция его памяти — Старостинские чтения, на которой ученые, занимающиеся родством языков, представляют итоги своей работы. Очередная, 11-я по счету, конференция на днях закончила свою работу.

Название изображения

Лексикостатистические исследования базисной лексики индоевропейских языков, представленные на чтениях, коснулись трех направлений — индоарийской, романской и скандинавской групп. И сразу повернули обсуждение в очень любопытное русло — а жива ли еще лексикостатистика? Можно ли полагаться на константы распада языков при расчете времени расхождения языковых семей? Скорость распада романских языков, расчеты по которым проводил Михаил Саенко из Института славяноведения РАН, оказалась ощутимо выше, чем рассчитанная в свое время С.А. Старостиным. Изменений в базисной лексике скандинавских языков, представленных в докладе Георгия Старостина из Института восточных языков и античности РГГУ, наоборот, оказалось существенно меньше ожидаемого. Анализ этих работ может привести к рекалибровке метода глоттохронологических расчетов.

Саенко сравнивал 100- и 110-словные списки, составленные для 50 современных романских диалектов, со списком архаичной латыни Плавта. Романские языки в целом показали примерно такое же генеалогическое дерево, какое можно спрогнозировать, зная историю этих языков, а различия в сохранности базисной лексики для разных романских диалектов хорошо укладываются в гауссово распределение. Вот только скорость распада оказалась завышенной. Означает ли это, что константа, рассчитанная в свое время основателем Московской школы компаративистики, оказалась неверной? Как полагают лингвисты, проблема не в самой идее постоянного коэффициента скорости распада языка — но в необходимости уточнять коэффициенты.

Название изображения

Георгий Старостин сравнил данные разных скандинавских языков и диалектов в историческом развитии. Принято считать, что исландский язык — такой консервативный язык, который сохранил много древних черт со времен, когда викинги бороздили просторы Атлантического океана, благодаря тому, что был на протяжении веков отрезан от остального цивилизованного мира.

Однако, как показал докладчик, похоже, что все скандинавские языки, в том числе имевшие на протяжении истории тесные отношения с другими народами, за последние 1500 лет тоже практически полностью сохранили 100 наиболее устойчивых слов в своей лексике (выпадение в объеме 2–4 слов за последние 700–800 лет, еще 3–5 слов за предыдущие 700 лет). То есть скандинавские языки были очень консервативными. Что удивительно, предок этих языков — праскандинавский (около 500 г. н. э.) — за буквально 600–700 лет, отделяющих его от прагерманского языка (около 200–100 г. до н. э.) набрал 10 замен в той же самой базисной лексике. То есть скорость изменения языка оказалась вдвое выше — о константе говорить не приходится. Но можно ли считать это концом лексикостатистики?

В свое время С. А. Старостин тоже заметил странное поведение скандинавских языков в истории — именно это заставило его когда-то изменить коэффициент в глоттохронологической формуле расчета, принятый Сводешем  — 0,14 —  на коэффициент 0,05. Но очевидно, что для романских языков больше подошел бы исходный коэффициент Сводеша. Фактически получается, что для разных языков следует использовать разные коэффициенты, что кажется смертельным для статистического метода, однако сохранение гауссова распределения для романских языков заставляет думать, что проблема всё же не в самом методе, а в деталях, требующих иного подхода.

Как говорит Михаил Васильев (Лаборатория востоковедения ШАГИ РАНХиГС) в дискуссии, поднявшейся по этому поводу после доклада Саенко, методику расчета времени расхождения языков менять придется. Но, по его словам, «нужна не рекалибровка лексикостатистики, а переход к многокомпонентной модели. 25-словный список (25 наиболее устойчивых слов из 100-словного списка. — Примеч. ред.) для романских языков, например, надо сравнивать с 25-словным списком для индоарийских языков, и тогда оценивать скорость распада». Ученый уверен, что вначале лингвистам придется определить состав этих компонентов и темп распада для каждого из них, прежде чем в существующий метод удастся внести корректировку.

Георгий Старостин, подводя итог обсуждению этого вопроса, отметил, что похожая на романские языки ситуация наблюдается в греческих, а также в китайских диалектах. Поэтому, считает он, «скорее всего, константа Сводеша (0.14) адекватна для ситуации вроде греческих, романских и китайских языков, а для скандинавских больше подходит константа Старостина (0.05). Что является нормой и как это встроить в существующие модели — вопрос. Ждем новых списков — это должно толкать нас к новой работе и пониманию тех факторов, которые тормозят или ускоряют глоттохронологический распад».

[Фото: Алексей Касьян]

дальнее родство языков компаративистика конференция старостинские чтения

Назад

Социальные сети

Комментарии

Авторизуйтесь, чтобы оставить комментарий