Применение мультимодальных больших языковых моделей в видеоаналитике изучили в МГУ

13.06.2024 12:30

1556

Ученые МГУ провели исследование по проблеме перевода видео в текст, что позволит значительно сократить время поиска необходимой информации и повысить эффективность ее обработки. Результаты исследования были представлены на Всероссийской конференции «Ломоносовские чтения - 2024».

С появлением эпохи больших данных видеоконтент стал ключевым источником информации и развлечений. Однако быстрый обзор огромного объема видеоматериала стал проблемой, занимающей много времени. Для ускорения этого процесса и извлечения ценной информации из видео были разработаны алгоритмы перевода видеопоследовательностей в текст.

Перевод видео в текст представляет собой сложную задачу, решение которой становится все более актуальным в современном мире. Одним из перспективных подходов к этой проблеме являются мультимодальные модели, способные обрабатывать данные разных модальностей, включая текст, аудио и изображения.

В недавнем исследовании, проведенном специалистами, был проведен сравнительный анализ методов перевода видео в текст с использованием классификатора CLIP и различных мультимодальных моделей. Архитектуры различных подходов были тщательно изучены, выявлены их сильные и слабые стороны, а также определены ключевые направления для улучшения результатов, включая увеличение длительности видео и более детальное описание содержания.

«Наше исследование показывает значительный прогресс в области развития мультимодальных больших языковых моделей, позволяющих переводить видео в текст, - отмечает сотрудник кафедры информационной безопасности ВМК МГУ Евгений Альбинович. - Эти модели открывают новые возможности для более эффективного анализа видеоматериала и извлечения ценной информации из него».

Это исследование является важным шагом в направлении разработки более точных и эффективных методов перевода видео в текст, что существенно упростит и ускорит обработку мультимедийной информации в цифровой эпохе.

Источник информации: ВМК МГУ имени М.В. Ломоносова

Источник фото: ru.123rf.com

Разместила Наталья Сафронова

Информация предоставлена Информационным агентством "Научная Россия". Свидетельство о регистрации СМИ: ИА № ФС77-62580, выдано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций 31 июля 2015 года.

Партнеры

Показать всех

Карельский научный центр Российской академии наук

Государственная корпорация по атомной энергии "Росатом"

Физический Институт им. П.Н. Лебедева РАН (ФИАН)

Объединенный институт ядерных исследований

ФГУП Всероссийская государственная телевизионная и радиовещательная компания

Совет при Президенте по науке и образованию

Объединенный институт высоких температур РАН

Пермская научно-производственная приборостроительная компания

Национальный исследовательский Томский государственный университет

Федеральный исследовательский центр Институт прикладной физики Российской академии наук (ИПФ РАН)

Государственный геологический музей им. В.И. Вернадского Российской академии наук

Палеонтологический музей им. Ю.А. Орлова РАН

Наше мобильное приложение

Установить с RuStore

Мы в соцсетях

НАУКА ДЕТЯМ

Недавнее

Дошкольная Академия в марте

14:40 / «Мамин навигатор»

Сибирские ученые вдвое повысили износостойкость титана

14:00 / Физика

Комплекс для автономного поиска дефектов в магистральных газовых трубопроводах разработали в СПбПУ

12:00 / Инженерия

Пионер отечественной электрофизики. День рождения отмечает академик Геннадий Месяц

10:00 / Физика

Новый рекорд: лазер рассекает кость глубже, чем раньше

20:00 / Инженерия, Медицина, Новые технологии

Более позднее начало занятий поможет подросткам лучше учиться

19:30 / Здравоохранение, Наука и общество

Представители ФИАН приняли участие в открытии Российско-Китайского института фундаментальных исследований в КНР

18:40 / Физика

Развитие дирижаблей ― в десятилетней перспективе. Скоро новое интервью на портале «Научная Россия»

16:00 / Инженерия, Наука и общество

О регулировании биоэкономики поговорили на Форуме будущих технологий

14:30 / Биология, Новые технологии, Экономика

В Институте цитологии РАН разработали подход лечения рака, перспективный для полного удаления метастазов

13:30 / Медицина

Лекции

14.06.2023 10:30

41417

«Когнитом ― глубокая жизнь мозга». Лекция академика Константина Анохина

«Атомы» разума возникают не в качестве надстройки над существующей нервной сетью, а трансформируя эту нейронную сеть донизу, до появления когнитивных свойств у отдельных нейронов. Каким образом это происходит?

Смотреть все