Как точно оценить качество автоматической сортировки писем, придумали в МГУ

16.06.2026 14:30

688

Исследователи факультета вычислительной математики и кибернетики (ВМК) МГУ разработали подход, позволяющий точнее оценивать качество систем автоматической сортировки электронных писем. Работа посвящена методам более корректной оценки эффективности таких алгоритмов.

В работе исследовались структурные признаки переписки, которые в наибольшей степени влияют на точность рекомендаций по сортировке входящих сообщений.

Сегодня объём корпоративной электронной почты постоянно растёт, и ручная сортировка сообщений становится всё более трудоёмкой. Поэтому используются алгоритмы, автоматически предлагающие папку для входящего письма. Такие системы учитывают содержание сообщения, историю переписки и поведение пользователя — например, куда он ранее перемещал похожие письма.

В работе рассматривается задача выбора наиболее подходящей папки: система формирует список возможных вариантов и располагает их в порядке предполагаемой релевантности. Качество таких рекомендаций оценивается с помощью метрик, которые учитывают не только правильность выбора папки, но и её место в итоговом списке.

Одной из ключевых проблем оказалось то, что письма тесно связаны между собой: они группируются по цепочкам переписки, проектам или отправителям. Поэтому данные нельзя рассматривать как полностью независимые, а стандартные методы оценки качества моделей могут давать завышенные результаты.

Чтобы получить более корректную оценку, исследователи предложили использовать «кластерный бутстрэп» — метод, при котором анализ выполняется не на уровне отдельных писем, а на уровне групп связанных сообщений. Такой подход позволяет учитывать зависимость данных и получать более надёжные оценки качества моделей.

«При анализе почтовых данных важно учитывать, что письма связаны между собой и не являются независимыми. Использование кластерных методов позволяет более точно оценивать качество моделей», — отметила доцент кафедры математической статистики факультета ВМК МГУ Татьяна Захарова.

«Мы стремились проверить, насколько эффективно можно использовать структурные свойства переписки без анализа текста и сложных алгоритмов машинного обучения. Результаты показали, что даже минимальные признаки принадлежности письма к цепочке могут давать сильный классификационный сигнал», — отметил Кирилл Кодряну.

Полученные результаты могут использоваться при разработке корпоративных почтовых систем и сервисов автоматической обработки писем.

Работа была представлена на научной конференции «Ломоносовские чтения» на факультете вычислительной математики и кибернетики МГУ.

Информация предоставлена пресс-службой МГУ

Источник фото: ru.123rf.com

Разместила Наталья Сафронова

Информация предоставлена Информационным агентством "Научная Россия". Свидетельство о регистрации СМИ: ИА № ФС77-62580, выдано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций 31 июля 2015 года.

Партнеры

Показать всех

Карельский научный центр Российской академии наук

Государственная корпорация по атомной энергии "Росатом"

Физический Институт им. П.Н. Лебедева РАН (ФИАН)

Объединенный институт ядерных исследований

ФГУП Всероссийская государственная телевизионная и радиовещательная компания

Совет при Президенте по науке и образованию

Объединенный институт высоких температур РАН

Пермская научно-производственная приборостроительная компания

Национальный исследовательский Томский государственный университет

Федеральный исследовательский центр Институт прикладной физики Российской академии наук (ИПФ РАН)

Государственный геологический музей им. В.И. Вернадского Российской академии наук

Палеонтологический музей им. Ю.А. Орлова РАН

Наше мобильное приложение

Установить с RuStore

Мы в соцсетях

НАУКА ДЕТЯМ

Недавнее

26 июля – 75 лет со дня открытия первой берестяной грамоты

14:00 / Археология, История

Ученые объяснили аномально высокие приливы в Татарском проливе

12:00 / География, Физика

Технологию алмазного шлифования пластин для полупроводников разработали в РТУ МИРЭА

14:00 / Инженерия

Гигантские китайские моллюски продолжают стремительно расселяться в водоемах России

12:00 / Биология

Прослушивание «звенящих» черных дыр открывает возможности для гравитационно-волновой астрономии

20:00 / Астрономия, Астрофизика

Обнаружена новая форма наследственного рака предстательной железы

19:30 / Биология, Медицина

Углеродная «шуба». Ученые представили новый способ синтеза нанодисперсных материалов

15:00 / Химия

Международный коллектив ученых завершил этап исследования инновационного препарата против рака легкого

14:30 / Медицина

Отечественный прибор для обсерватории «Спектр-УФ» может регистрировать отдельные фотоны

14:00 / Астрономия, Космонавтика

Клинические испытания инновационного метода лечения остеоартрита готовятся провести в России

13:00 / Здравоохранение, Медицина, Наука и общество

Лекции

20.04.2026 10:30

3270

«Вечный двигатель» внутри нас: как надпочечники обновляют сами себя. Лекция гистолога Натальи Ягловой

Ученые ФИЦ питания и биотехнологии доказали, что клетки надпочечников постоянно самообновляются. Доктор медицинских наук Наталья Яглова рассказала о строении надпочечников и истории их изучения, механизмах их самообновления и современных концепциях регенерации в медицине

Смотреть все