Название изображения

Участники подведут итоги соревнований по автоматической генерации заголовков новостей, восстановлению слов из контекста и морфологическому анализу редких языков, а эксперты обсудят, как интерпретировать результаты глубокого машинного обучения и использовать возможности нейросетей в текстовой аналитике.

Москва, 13 мая 2019 года. – 25-я международная научная конференция для обсуждения методов компьютерного анализа языка «Диалог» пройдет в Российском государственном гуманитарном университете с 29 мая по 1 июня. Организатором выступает компания ABBYY, мировой разработчик решений в области интеллектуальной обработки информации и лингвистики.

«Название конференции является «говорящим». С одной стороны, оно подчеркивает интерес участников к языку как средству коммуникации, включая общение с интеллектуальными технологиями, а с другой стороны, это междисциплинарный диалог между лингвистами и специалистами по анализу данных», - комментирует Владимир Селегей, директор по лингвистическим исследованиям компании ABBYY. Некоторые из ключевых тем 2019 года:

  • Как открыть «черный ящик» глубокого машинного обучения: о способах содержательной интерпретации работы нейронных сетей при анализе языка.
  • От текста документа – к его сути. Современные методы саммаризации -- извлечения обобщенной информации из исходного текста: от значимых фактов до определения общего смысла и тональности документа.
  • Как перенести методы анализа больших данных на задачи, для которых большого объема данных нет. 2019 год объявлен Международным годом языков коренных народов, поэтому одна из сессий «Диалога» будет посвящена методам применения машинного обучения для описания «малоресурсных» языков, например, эвенкийского или селькупского.
  • Мультимодальная лингвистика: исследование речевого акта в его целостности, включая интонацию, мимику и жесты. Такие разработки применяют, в том числе, в обучении роботов, интеллектуальных ассистентов, чат-ботов.

На мероприятии выступят признанные эксперты в области компьютерной лингвистики:

  • Крис Биман из Гамбургского университета. Один из ведущих аналитиков в области декомпозиции результатов работы нейронных сетей.
  • Пик Воссен из Амстердамского свободного университета, основатель и президент Глобальной Ассоциации WordNet. Его основной интерес сегодня – речевое взаимодействие человека и компьютера.
  • Андрей Кибрик, директор Института Языкознания РАН, руководитель проекта  «мультиканального» анализа речи.
  • Сергей Шаров, профессор Лидского университета, специалист по задачам языкового трансфера, когда модели, полученные при описании одного языка, автоматически переносятся на другой язык.

Одно из самых значимых событий «Диалога» – форум Dialogue Evaluation, технологические соревнования разработчиков систем автоматического анализа текстов.

Цель этого «соревнования алгоритмов» – определить реальный уровень достижений в решении различных задач анализа языка. Для проведения таких соревнований нужны специально подготовленные данные (датасеты), позволяющие обучать тестируемые алгоритмы.  Впервые в создании таких датасетов для части соревнований участвовали технологии искусственного интеллекта ΑΒΒΥΥ. В рамках соревнований участники решали несколько задач. Это автоматическая генерация заголовков новостей, создание моделей для малоресурсных языков, определение референциальных цепочек (различных упоминаний одного и того же объекта в тексте), автоматическое восстановление опущенной информации (эллипсиса).

Лучшие материалы конференции будут опубликованы в ежегоднике «Компьютерная лингвистика и интеллектуальные технологии», который входит в международную систему цитирования Scopus. По основным направлениям «Диалога» также пройдет студенческая сессия. Наиболее интересные работы получат призы Ассоциации преподавателей фундаментальной и прикладной лингвистики (АПИФИПЛ).

Узнать подробности о конференции «Диалог 2019» и зарегистрироваться на мероприятие можно на сайте.