Ученые Московского городского педагогического университета (МГПУ) разработали алгоритм обработки больших данных для анализа содержания сценариев уроков Московской электронной школы (МЭШ), сообщает сайт РИА Новости. По словам авторов, в будущем предложенный подход сможет автоматически определять "лучший" вариант сценария урока и отбрасывать некачественный контент. Результаты первого исследования опубликованы в сборнике Information.

© Григорий Сысоев

© Григорий Сысоев

 

На интернет-платформе МЭШ размещено более 2,1 млн сценариев уроков, из которых около 54 тыс. находится в открытом доступе. Их разрабатывают и используют учителя при проведении очных и дистанционных уроков. Процесс создания нового цифрового контента идет непрерывно, ежедневно происходит увеличение объема данных.

Специалисты Управления информационных технологий МГПУ разработали интеллектуальный алгоритм для изучения данных с платформы МЭШ, который способен анализировать смысловое значение текста и визуализировать результаты в удобном для человека виде. Оценивали качество работы алгоритма по 26 предметам эксперты — преподаватели МГПУ.

"Мы сопоставляли контент сценариев уроков МЭШ с Тематическим каркасом (единый классификатор тем образовательной программы по ФГОС - прим. ред.). По всем темам и дидактическим единицам в МЭШ имеются сценарии уроков по рассмотренным нами предметам. Однако их распределение по темам и дидактическим единицам неравномерно: по каким-то создано больше уроков, по каким-то меньше", — прокомментировала доцент, старший научный сотрудник информационно-аналитического отдела МГПУ Елена Петряева.

Также она отметила, что применение алгоритма позволило изучить структуру тем сценариев уроков и выявить крупные предметные семантические группы и междисциплинарные темы.

"Например, на уровне начального общего образования были зафиксированы такие междисциплинарные темы, как "Великая Отечественная война", "Мир вокруг меня", "Звуки и буквы", "Москвоведение". А в семантическую группу, к примеру, "Война" объединились сценарии уроков по предметам: всеобщая история, история России и литература, музыка. Но в целом результаты показали тематическую обособленность школьных предметов друг от друга", — рассказала Петряева.

Для обработки текстовых данных был использован метод word2vec, в основе которого лежит нейронная сеть.

"Для исследования отобрали текстовые данные 36 644 сценариев уроков. Затем их обработали и использовали для обучения алгоритма word2vec. После этого мы получили сопоставления сценариев уроков и Тематического каркаса. С целью визуализации результатов были выполнены преобразования для снижения размерности данных с использованием алгоритма t-SNE. Мы планируем повысить качество работы алгоритма с помощью расширения набора текстовых данных и перевода ключевых слов тем уроков на иностранные языки", — рассказал заместитель начальника Управления информационных технологий МГПУ Роман Куприянов.

По словам начальника Управления информационных технологий МГПУ Руслана Сулейманова, алгоритм поможет выявлять разные типы содержания и развивать ресурсы, имеющие большой педагогический потенциал.

Также ученые отметили, что алгоритм может быть использован для решения других задач: анализа домашних заданий, обработки текстового цифрового следа учеников, мониторинга образовательных результатов.

Проект реализуется под руководством доктора педагогических наук, директора института системных проектов МГПУ Светланы Вачковой.