Ученые из Массачусетского технологического института изучили и визуализировали глобальную сеть языков. Оказалось, что современная кросскультурная коммуникация держится всего на шести мировых языках — английском, испанском, итальянском, немецком, французском и русском, то есть тех, что чаще всего используются для перевода информации между различными культурами (а вовсе не тех, на которых говорят больше людей). Глобальная сеть языков и все данные, на которых она построена, размещены в открытом доступе на сайте Global Language Network — рекомендуем изучить, чрезвычайно увлекательное занятие. Академические подробности изложены в статье в журнале PNAS.

Для анализа они использовали данные твиттера, Википедии и переводной литературы. Выяснилось, что если убрать перечисленные выше семь узловых языков, то мировая коммуникация распадется, и народ мапуче из Чили никак не узнает, что там нового происходит в арабо-израильском конфликте, потому что эта информация до него доходит не напрямую переводом с арабского на язык мапуче, а через английский и испанский. 

Изначально группа ученых задалась вопросом, какой язык в современном мире самый важный? Для этого они решили взять не только данные о количестве носителей языка, но и данные о связях между языками, о количестве знаменитых людей, рожденных носителями языка, и размер валового национального продукта. Они посмотрели корреляцию между этими наборами данных и построили визуальную сеть связей между языками во всем мире (см. ссылку выше). Узлы сети (кружочки) принимают значение одного из параметров: числа носителей языка, размера валового национального продукта или собственного вектора центральности — это математическое понятие из теории сетей, отражающее важность узла. Ребра сети (линии между кружочками) означают связи языков. Чем большей связей, чем толще ребро.

Но как узнать связи языков? На помощь пришел интернет и его социальные сети — твиттер и Википедия. Это любимые объекты исследований математиков, занимающихся теорией сетей, потому что они очень большие, с обильными взаимными связями, структурированные, многоязычные и постоянно растущие. Сначала ученые проанализировали миллиард твитов и создали базу данных пользователей, которые используют твиты на разных языках. Например, кто твитит на английском и испанском, тот, с большой вероятностью, знает оба языка. Второй набор данных извлекли из национальных википедий. Ученых интересовали пользователи, которые редактируют статьи на разных языках. Третий набор данных дал анализ списков переводной литературы, предоставленных ЮНЕСКО. Из этих список вытянули информацию о том, с каких языков на какие существуют переводы книг. Например, «Приключения Тома Сойера» переведены с испанского на каталонский, а перевода на каталонский непосредственно с английского, на котором Марк Твен написал эту книгу, не существует.

Вот вам очевидный пример: на голландском говорит всего 27 млн человек, то есть около 0,5% мирового населения, и однако он куда значимее, с точки зрения мировой коммуникации, по сравнению с, например, арабским, на котором говорят около 530 миллионов, иначе около 6% населения Земли (с учетом тех, для кого арабский — второй язык). А все потому, что носители голландского очень активны в коммуникации и в сети. Даже латынь — вроде бы мертвый язык — оказалась более важной, на фоне арабского и китайского. Количество, как мы убеждаемся в очередной раз, далеко не самый важный фактор.

С определенной точки зрения подобный набор источников может показаться странным: ведь в твиттере сидят молодые люди, редко отягченные интеллектом, википедию редактируют разные чокнутые зануды-программисты, которые могут месяцами не выходить на улицу и ни с кем не разговаривать, а уж переводчики книг вообще особый мир — бумажный, и создавался он совершенно по иным законам, чем всемирная сеть. Но сравнив результаты по всем трем источникам, ученые увидели, что между этими тремя мирами существует неплохая корреляция, и даже есть общее свойство — они выраженно иерархичны. То есть для связи между малоиспользуемыми языками используются несколько языков, ставших очень популярными. Это английский, испанский, немецкий, французский, русский, португальский и китайский. Ученые назвали их узловыми языками.

Чтобы понять особенность узлового языка, представьте себе, что на хинди или арабском языках говорят очень много людей, но они не так важны именно для глобальной коммуникации. На китайском говорят больше всего людей в мире, но по связанности с другими языками он уступает английскому и русскому. Кстати, высокая связанность русского языка — это, по мнению одного из авторов исследования Цезаря Идальго (César Hidalgo), заслуга СССР. В советское время переводили очень много литературы союзных республик и стран коммунистического блока, поэтому коммуникация вьетнамцев или таджиков с остальным миром осуществлялась посредством русского языка. Цифровой мир, интернет сменил технологию коммуникацию, теперь жители этих стран чаще используют английский как узловой язык.

Для определения центральности языков исследователи использовали данные о знаменитостях. Их извлекли из Википедии, взяв те персоналии, статьи о которых есть не менее чем на 26 языках — например, об Элвисе Пресли или принцессе Диане. Использовали также данные из Human Accomplishment — книги, где приведены сведения о почти 4 тысячах знаменитостей. По городу или местности, где родился персонаж, ученые определяли его язык — и знаменитость чаще всего оказывалась носителем одного из узловых языков. Или становилась таким носителем, что в контексте исследования не делает разницы. В конечном итоге видна явная корреляция между данными о численности носителей языка, размере валового национального продукта и языком популярных личностей.

Авторы исследования понимают, что использование данных из твиттера и Википедии — продуктов англоязычного мира — может наложить отпечаток на полученный результат. Но они полагают, что доминирование английского языка в интернете в первую очередь отражает реальность, то есть значимость английского в мировой коммуникации.

Так что если вы хотите повысить значимость своего языка — будьте активнее, вкладывайтесь в популяризацию родной речи. Но если вы хотите, что мир услышал вас — используйте соответствующий второй язык. Скажем, любой неанглоязычный логично выберет именно английский в качество второй языка. А вот тем, у кого английский и так родной, стоит выбрать, например, испанский, а не китайский.

А тем, кто сомневается, сообщаем: вчера Microsoft запустил онлайн-переводчик речи для скайпа — разумеется, «английский<=>испанский».

 

Источник иллюстрации: conversationilmh.blogspot.com