Материалы портала «Научная Россия»

Интернет без анонимности: новые технологии ИСП РАН

Интернет без анонимности: новые технологии ИСП РАН
Технологии “Талисман” и “Текстерра”, разработанные Институтом Системного Программирования РАН, предназначенные для анализа больших массивов данных социальных сетей, способны изменить лицо глобальной сети Интернет.

Технологии “Талисман” и “Текстерра”, разработанные Институтом Системного Программирования РАН, способны изменить лицо глобальной информационной сети Интернет. Предназначенные для анализа больших массивов данных социальных сетей, они были впервые представлены широкой аудитории этой зимой.

“Текстерра” – технология многоязычного интеллектуального анализа текста. В ее основе – программный комплекс, способный накапливать и анализировать информацию, устанавливать взаимосвязь между понятиями и проводить интеллектуальный анализ текстов. При этом “Текстерра” опирается на объем понятий и терминов, почти на порядок превышающий размеры Британской энциклопедии, и может при необходимости расширить свою базу знаний еще больше. В результате при использовании этой технологии возможно вычислять лексически сходные тексты, принадлежащие перу одного автора или написанные по единому плану, содержащие сходные семантические конструкции, и, таким образом, выявлять факт и структуру информационных “вбросов”.

Система “Талисман”, в свою очередь, позволяет отследить и выявить фиктивные аккаунты, служащие для распространения недостоверной информации, спама, имитации массовой активности – ботов. Анализ производится по полным и неполным данным, указанным в профилях социальных сетей, социальным связям аккаунтов, подпискам, спискам друзей и читателей. В результате анализа определяются такие демографические атрибуты, как возраст пользователя, а также семейное положение, уровень образования и так далее. Если значения тех или иных атрибутов не вписываются в создаваемый программным комплексом алгоритм, можно с серьезной долей уверенности говорить о том, что выпадающий из схемы профиль социальной сети принадлежит не живому человеку, а создан искусственно. Дальше приходит на помощь “Текстерра”, позволяющая вычислить множества ботов, созданных одной рукой либо ведущихся по одному лекалу-методичке.

Также технология “Талисман” позволяет на основании анализа неполных данных с использованием информации из социальных сетей вычислить примерное место проживания пользователя, его принадлежность к определенному социальному слою, приверженность той или иной идеологии и другую полезную информацию.

“Анализ такого постоянно меняющегося массива данных, как информация в соцсетях,  сегодня  – насущная необходимость, –  отмечает директор ИСП РАН Арутюн Аветисян. –  Это и маркетинговый инструмент, позволяющий оценивать аудиторию, выстраивать закономерности, помогающие работать адресно с разными возрастными  и социальными группами. И во многом – инструмент безопасности. В последние десятилетия неограниченная интернет-анонимность стала источником угрозы для отдельных людей или компаний, для целых народов и стран. Работа в этом направлении способна в корне изменить ситуацию”.

Важным, по мнению директора ИСП РАН, является также этический аспект применения разработок института, сохранение тайны личных данных и неприкосновенности частной жизни.

“При применении подобных технологий  необходимо, чтобы  не нарушались права пользователей социальных сетей, не разглашались персональные данные”, – уточнил Денис Турдаков, заведующий отделом Информационных систем ИСП РАН. – Мы проводим  научные исследования, дорабатываем “Текстерру” и “Талисман”. Всеобъемлющий анализ соцсетей пока затруднен, прорыв еще предстоит, но ждать его осталось недолго”.

В настоящий момент совершенствование этих программных комплексов продолжается, наращивается их функционал и мощность. В недалеком будущем внедрение разработок такого рода может серьезно изменить лицо глобальной информационной сети и культуру Интернет-общения.

 

Справка

Институт системного программирования Российской академии наук (ИСП РАН) – научно-исследовательская организация, специализирующаяся в области системного программирования. Институт разрабатывает технологии мирового уровня в таких областях, как операционные системы, компиляторные технологии, параллельные и распределенные вычисления, технологии верификации и тестирования программного обеспечения, анализ и обработка больших объемов данных, семантический поиск и др. Среди долговременных отечественных партнеров Института – ГосНИИАС, Вымпелком, Квант, Орион, среди зарубежных – Samsung, Huawei, DellEMC, HPE, Intel, Nvidia, RogueWave, LinuxFoundation. Со многими из них созданы совместные лаборатории.

Одна из главных задач ИСП РАН – подготовка кадров высшей квалификации в сфере ИТ. На базе Института функционируют собственная аспирантура и кафедры в МГУ, МФТИ и ВШЭ. Также ИСП РАН реализует совместные проекты с ведущими университетскими и исследовательскими центрами: Кембридж (Великобритания), Карнеги-Меллон (США), INRIA (Франция), Университет Пассау (Германия) и др.

 

анализ данных арутюн авестисян денис турдаков интеллектуальный анализ текста интернет исп ран технология "талисман" технология "текстерра"

Назад

Социальные сети

Комментарии

Авторизуйтесь, чтобы оставить комментарий

Информация предоставлена Информационным агентством "Научная Россия". Свидетельство о регистрации СМИ: ИА № ФС77-62580, выдано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций 31 июля 2015 года.