Что между такими языками, как русский, английский, ирландский, фарси, греческий и армянский, существует родство — дело известное. Все они входят в индоевропейскую семью языков. Это означает, что когда-то, примерно 6-8 тысяч лет назад, существовали племена, говорившие на диалектах одного языка, который мы называем праиндоевропейским. Эти диалекты в ходе истории развивались, племена расселялись по всей Евразии, и теперь носители разных индоевропейских языков друг друга совсем не понимают и удивляются, узнавая, что такое языковое родство существует.

Между тем древние индоевропейцы тоже имели родственников и соседей. Как предполагают лингвисты, занимающиеся реконструкцией праязыков, общий предок мог быть у индоевропейской и уральской семьи — в последнюю входят такие языки, как финно-угорские (в том числе финский и венгерский, а также эстонский) и самодийские (например, ненецкий язык). Есть и еще одна рабочая гипотеза о том, как развивались индоевропейские языки и их ближайшее окружение. Древние языки Анатолии, древнейшие из зафиксированных индоевропейских языков, которые мы в основном знаем по клинописным табличкам бронзового века и которые относятся к анатолийской группе (в том числе хеттский и лувийский), согласно текущим представлениям, были первыми отделившимися от праиндоевропейского единства. Рабочая гипотеза же, которую называют в научном обиходе индохеттской, предполагает, что они и вовсе не были, так сказать, дочерними языками для праиндоевропейского, а составляли с ним когда-то более древнее единство и имели общий язык-предок.

Поискам доказательства существования такого доисторического языкового единства посвящена открывшаяся вчера в Лейденском университете (Нидерланды) конференция «Предшественники праиндоевропейского: индохеттская и индоуральская гипотезы» (The precursors of Proto-Indo-European: the Indo-Hittite and Indo-Uralic hypotheses). В ходе ее заседаний лингвисты из разных европейских стран представили результаты своей работы в этом направлении.

В частности, Георгий Старостин из Российского государственного гуманитарного университета (Москва) рассказал о том, какие доказательства индоуральского родства представляет лексикостатистика — метод, основанный на оценке совпадения базисной лексики разных языков. Базисная лексика, которую обычно используют для такого анализа — это наиболее устойчивая к заимствованиям часть словарного запаса языка. Ее фиксируют так называемые списки Сводеша, названные в честь придумавшего их американского лингвиста Морриса Сводеша (Morris Swadesh) — 100-200 слов, наиболее устойчивых к заимствованию в языке, такие как названия частей тела и личные местоимения.

Представив аудитории проект «Лексикостатистическая база данных» (The Global Lexicostatistical Database), Старостин отметил, что для макрокомпаративного подхода к изучению языков, когда сравнение проводится между восстановленными праязыками, не зафиксированными в письменности, более эффективно использовать ограниченные и выверенные 50-словные списки базисной лексики. Также для определения родства лучше полагаться на совпадения в лексике, больше чем на общие черты в морфологии.

Макрокомпаративистика — наука, занимающаяся дальним родством языков, то есть анализом их генетических отношений на такой временной дистанции, когда речь идет о погружении в прошлое на тысячи лет. Как принято считать, предельная глубина такого анализа, на которой можно получить отличающиеся от шума данные, ограничена примерно десятком тысяч лет.

Аналогичный проект, рассчитанный на использование статистических данных для оценки родства языков, представила Герд Карлинг (Gerd Carling) из Лундского университета (Швеция). Его название — LUNDIC — расшифровывается как Lund Digital Atlas of languages and Cultures. Как и московская «Лексикостатистическая база данных», этот проект включает в себя данные не только по индоевропейским языкам, но позволяет оценить в том числе и степень родства праиндоевропейского с праязыками прочих семей. «К сожалению, данные шведского проекта пока не опубликованы,  — прокомментировал результаты коллег Георгий Старостин специально для «Научной России». — Поэтому невозможно оценить, насколько аккуратно они работают с данными и, соответственно, насколько можно доверять их результатам». Из результатов этого проекта видно, что дерево, построенное по типологии отличается от дерева, построенного по лексике, и последнее более достоверно.

Шведские лингвисты оценивают данные языков по нескольким критериям. В частности, они так же отмечают схожесть языков в базисной лексике, определенных грамматических характеристиках (порядок слов, глагольная и именная морфология, и т. п.), а также дополнительно учитывают совпадения в культурной лексике и фонетике.